① 璇锋暀python閲忓寲浜ゆ槗镞剁敤鍒扮殑镶$エ姣忓ぉ阃愮玛浜ゆ槗鏁版嵁濡备綍鐖鍙栵纻
棣栧厛锛屾墦寮链熻揣浜ゆ槗杞浠讹纴锏诲綍镊宸辩殑浜ゆ槗璐︽埛銆傞夋嫨鐩稿簲镄勬湡璐у悎绾︼纴杩涘叆浜ゆ槗鐣岄溃銆
鍏舵★纴镓惧埌钬沧垚浜よ板綍钬濇垨钬滈愮玛鎴愪氦钬濈瓑鐩稿叧锷熻兘鎸夐挳銆傚湪涓浜涗氦鏄撹蒋浠朵腑锛岃繖涓鎸夐挳鍙鑳戒綅浜庝氦鏄撶晫闱㈢殑搴曢儴鎴栦晶杈规爮銆
铹跺悗锛岀偣鍑烩沧垚浜よ板綍钬濇垨钬滈愮玛鎴愪氦钬濇寜阍锛岃繘鍏ユ垚浜よ板綍椤甸溃銆傚湪杩欎釜椤甸溃涓婏纴浣犲彲浠ョ湅鍒版渶杩戠殑鎴愪氦璁板綍鍒楄〃銆
鎺ヤ笅𨱒ワ纴镓惧埌钬滃煎嚭钬濇垨钬滃煎嚭鎴愪氦鏄庣粏钬濈瓑鎸夐挳銆傝繖涓鎸夐挳阃氩父浣崭簬鎴愪氦璁板綍椤甸溃镄勪笂鏂规垨涓嬫柟銆
铹跺悗锛岀偣鍑烩滃煎嚭钬濇垨钬滃煎嚭鎴愪氦鏄庣粏钬濇寜阍锛岄夋嫨瀵煎嚭鏂囦欢镄勬牸寮忓拰淇濆瓨璺寰勚备竴鑸𨱒ヨ达纴鎴戜滑鍙浠ラ夋嫨瀵煎嚭涓篍xcel鎴朇SV镙煎纺镄勬枃浠讹纴杩欐牱鍙浠ユ柟渚垮悗缁镄勬暟鎹澶勭悊鍜屽垎鏋愩
链钖庯纴镣瑰嚮钬灭‘璁も濇垨钬滃煎嚭钬濇寜阍锛岀瓑寰呰蒋浠跺畬鎴愬煎嚭杩囩▼銆傚煎嚭镄勯熷害鍙栧喅浜庢垚浜よ板綍镄勬暟閲忓拰鐢佃剳镐ц兘绛夊洜绱犮
涓镞﹀煎嚭瀹屾垚锛屼綘灏卞彲浠ュ湪阃夋嫨镄勪缭瀛樿矾寰勪腑镓惧埌瀵煎嚭镄勬枃浠躲傞氲繃镓揿紑杩欎釜鏂囦欢锛屼綘灏卞彲浠ユ煡鐪嫔拰鍒嗘瀽链熻揣阃愮玛鎴愪氦鏄庣粏浜嗐
瀵煎嚭镄勬湡璐ч愮玛鎴愪氦鏄庣粏鏂囦欢阃氩父鍖呮嫭浠ヤ笅淇℃伅锛氢氦鏄撴棩链熴佷氦鏄撴椂闂淬佹垚浜や环镙笺佹垚浜ゆ暟閲忋佷拱鍗栨柟钖戠瓑銆傝繖浜涗俊鎭鍙浠ュ府锷╀綘杩借釜姣忎竴绗旀垚浜ょ殑𨱍呭喌锛屽垎鏋愬竞鍦虹殑涔板崠锷涢噺鍜屼氦鏄撹屼负銆
阃氲繃瀵规湡璐ч愮玛鎴愪氦鏄庣粏镄勫垎鏋愶纴浜ゆ槗钥呭拰鎶曡祫钥呭彲浠ヨ幏鍙栦互涓嬫柟闱㈢殑淇℃伅锛
棣栧厛锛屼简瑙e竞鍦虹殑鎴愪氦𨱍呭喌銆傞氲繃镆ョ湅鎴愪氦浠锋牸鍜屾垚浜ゆ暟閲忥纴鍙浠ュ垽鏂甯傚満镄勪环镙艰蛋锷垮拰浜ゆ槗娲昏穬搴︺
鍏舵★纴鍒嗘瀽甯傚満镄勪拱鍗栧姏閲忋傞氲繃缁熻′拱鍏ュ拰鍗栧嚭镄勬暟閲忓拰姣斾緥锛屽彲浠ヤ简瑙e竞鍦虹殑澶氱┖鍙屾柟锷涢噺瀵规瘆锛屽垽鏂甯傚満镄勮蛋锷垮拰瓒嫔娍銆
鍐嶆★纴镰旂┒浜ゆ槗钥呯殑琛屼负鍜岀瓥鐣ャ傞氲繃鍒嗘瀽鎴愪氦璁板綍锛屽彲浠ヤ简瑙d氦鏄撹呯殑涔板崠琛屼负鍜岀瓥鐣ワ纴鍙戠幇涓浜涙綔鍦ㄧ殑浜ゆ槗链轰细銆
链钖庯纴浼桦寲浜ゆ槗绛栫暐鍜岄庨橹绠$悊銆傞氲繃瀵规湡璐ч愮玛鎴愪氦鏄庣粏镄勭爷绌讹纴鍙浠ュ彂鐜颁竴浜涘父瑙佺殑浜ゆ槗阌栾鍜岄庨橹锲犵礌锛屼粠钥屾敼杩涜嚜宸辩殑浜ゆ槗绛栫暐鍜岄庨橹绠$悊鑳藉姏銆
② 股票软件大智慧LEVEL-2中的日线逐笔统计的公式函数是什么
这是源码
DRAWTEXTABS(10,0,'《逐笔反应资金成交动态》'),COLORyellow;
DRAWTEXTABS(10,15,'《逐单反应筹码收集发散》'),COLORyellow;
DRAWTEXTABS(10,30),COLOR0000FF;
逐笔:SUM((TRANSACTNUM(1,0))-(TRANSACTNUM(2,0)),0),Colorred,LINETHICK2,PRECIS0,LAYER0;
逐单:sum(ORDERNUM(2,0)-ORDERNUM(1,0),0),layer1,PRECIS0,LINETHICK2,Coloryellow;
DRAWTEXT( BARSTATUS=2,逐笔 ,'逐笔' ),Colorred;
DRAWTEXT( BARSTATUS=2,逐单 ,'逐单' ),Coloryellow,LAYER6;
STICKLINE(逐单>0,0,逐单,2,0),Colorred;
STICKLINE(逐单<0,0,逐单,2,0),Color000000;
fillrgn(逐单,0,逐单>=0,rgb(100,00,00),逐笔<0,rgb(00,20,150)),Coloryellow;
③ 关于股票逐笔成交数据的小技巧
股票逐笔成交数据蕴含丰富的投资信息,但挖掘这些信息并非易事。本文旨在教你如何构建逐笔成交数据库并掌握数据挖掘技巧。
首先,你需要一台配置良好的电脑,同时找到可靠的数据源。逐笔数据通常以压缩包形式存在,包含数千个CSV文件,每只股票对应一个文件。例如,平安银行(000001)2023年9月22日的数据,单日就有50,000多行,数据密集,处理难度大。
处理这类大数据的关键在于分块。逐笔数据计算因子,特别是日频因子(解释股票收益的横截面),通常只需要单个交易日的数据。因此,应将一个交易日的数据分为小文件,每个约200万行,便于电脑并行处理。使用Python的Pandas和feather格式,以及joblib的Parallel并行计算,可以提高效率。
因子计算通常分为两步:第一步,基于单日数据形成sub_factor;第二步,汇总过去20个交易日的数据。建议在计算sub_factor时进行并行处理,实时保存结果,最后汇总得到最终的factor。这样的方法有助于节省计算资源,提高处理速度。
④ 关于股票逐笔成交数据的小技巧
搭建逐笔成交数据库并挖掘逐笔数据因子是获取股票Alpha信息的有效途径。在操作过程中,需先准备一台支持计算任务的电脑,并找到数据源。逐笔数据通常以交易日命名,包含数千个CSV文件,每个文件对应一个股票。数据量庞大,需要分块处理,以避免内存不足。举例,以平安银行为例,一天的交易数据量可达近7千万行,数据处理难度大。数据应分块存储,每个交易日的数据存为一个文件夹,内含若干数据块,每块约200万行,以支持并行处理。Python+Pandas处理数据时,推荐使用feather文件格式,因其压缩率高且读取速度快。因子计算通常分为两步:首先形成sub_factor,然后汇总为最终factor。此过程需将所有sub_factor并行计算,并边计算边保存。最终汇总所有sub_factor,完成因子计算。此方法提高了因子计算的效率和可行性。