A. 濡備綍緋葷粺鍦板︿範 R 璇璦鐨勫悇縐 packages
瀵逛簬R璇璦鐨勭湡姝d嬌鐢ㄨ呴摱琚滄℃潵璇達紝R鏈澶х殑闂棰樹笉鏄鎱錛岃屾槸紼嬪簭鍖呯殑鏉備貢錛屽珜瀹冩參鐨勪竴寮濮嬪氨涓嶄細鐢≧銆傛垜璁や負榪欎釜闂棰樺彲浠ュ垎涓轟袱閮ㄥ垎錛屼竴涓鏄濡備綍閫夋嫨鑷宸遍渶瑕佺殑鍖咃紝涓涓鏄濡備綍瀛︿範榪欎簺鍖呫
鎴戞妸紼嬪簭鍖呭垎涓轟笁綾伙紝絎涓縐嶆槸鍔熻兘澧炲己鍨嬶紝姣斿倆oo鍜実gplot2錛屼粬浠鐨勫姛鑳藉師鏈鍙浠ョ敤綣佺悙鐨勪唬鐮佸疄鐜幫紝浣嗘槸閿嬫梺浣跨敤榪欎簺鍖呭彲浠ュ疄鐜扮殑鏇村揩鎴栬呮洿濂斤紱絎浜岀嶆槸緇熻″緩妯″瀷錛屼笓闂ㄤ負鏌愪釜緇熻¢嗗煙鎴栨ā鍨嬭屽仛鐨勫寘錛屽皬鍒皐avelet榪欑嶄笓闂ㄥ仛灝忔嘗鍒嗚В鐨勫寘錛屽ぇ鍒癟SA榪欑嶆墍鏈夌粡嫻庣被涓撲笟閮界敤鐨勬椂闂村簭鍒楀寘閮藉睘浜庤繖涓綾匯傜涓夌嶆槸鐗瑰畾鍔熻兘鍨嬶紝榪欑嶅寘涓鑸闈炲父灝忎紬,姣斿傚垎瑙e拰鍒墮犻煶濂芥壈棰戠殑tuneR(鍙浠ョ敤瀹冩潵鍚鑲$エ浠鋒牸鐨勭櫧鍣澹板摝)錛屽啀姣斿傛垜鑷宸卞啓鐨勭敤浜巇ota2閫変漢鐨凴Dota錛圧鐗堟湰鏇存柊浠ュ悗宸茬粡涓嶈兘鐢ㄤ簡鏆傛椂鎳掑緱鏇存柊錛夛紝榪欑嶅寘涓瀹氭槸瑕佷箞寰堜笓涓氳佷箞寰堝ū涔愶紝涓嶅お闇瑕佸︿範鈥淩鈥,鑰屾槸榪欎釜鍔熻兘鏈韜錛岃繖涓綾婚兘涓嶅睘浜庝笅闈㈣ㄨ虹殑鑼冪暣銆
濡備綍閫夋嫨鑷宸遍渶瑕佺殑紼嬪簭鍖咃紵
瀵逛簬鍔熻兘澧炲己鍨嬪寘錛屾垜璁や負鍊煎緱緋葷粺瀛︿範鐨勫彧鏈塯gplot2錛屽叾浠栫殑鍖呭簲璇ユ槸浠涔堟椂鍊欑敤鍒幫紝鎴栬呬粈涔堟椂鍊欒佸埌錛屽氨浠涔堟椂鍊欏︺傛瘮濡備綘闇瑕佸勭悊鏃墮棿搴忓垪浜嗗氨浼氱敤鍒皕oo錛屾垨鑰呬綘涓婄綉璇劇湅鍒頒簡浠涔堢壒瀹氱殑鍔熻兘寰堜笉閿欙紝灝辯暀涓鍗拌薄錛屼粈涔堟椂鍊欓渶瑕佷簡鍐嶅洖鍘葷炕銆傚啀姣斿備綘宸ヤ綔鐨勬椂鍊欒夊緱R鎱錛屾兂鐭ラ亾鎬庝箞鎻愰珮R鐨勬晥鐜,鍘昏胺姝屼竴涓"how to improve computing performance in R",灝變細鎼滃埌CRAN瀹樻柟緇欏嚭鐨勪竴鐗囨枃絝燙RAN Task View: High-Performance and Parallel Computing with R
鎵浠ワ紝瑙佸埌浠涔堝氨璁幫紝闇瑕佷粈涔堝氨鎼滃氨鍙浠ヤ簡錛屽傛灉浣犳寜鐓R鍖呬笅杞介噺鍓10鐨勫寘涓涓涓涓瀛︼紝浣犲彲鑳藉叾涓90%鐨勫姛鑳介兘鐢ㄤ笉鍒幫紙娌¢敊灝辨槸90%錛屽洜涓烘瘡涓鍖呴噷閮芥湁寰堝氱妱瑙掓棶鏃浣犵敤涓嶅埌鐨勫姛鑳斤級銆
ggplot2瀹炲湪鏄澶寮哄ぇ浜嗭紝鐢ㄧ啛鎮変互鍚庡摢鎬曟槸鍦╩atlab閲屽啓鐨勭▼搴忔垜涔熸妸鏁版嵁璋冨埌R閲岀敾鍥撅紝鐒惰岃繖涓鍖呭緢澶嶆潅錛屼粠甯鍔╂枃浠墮噷浣犲緢闅懼揩閫熶笂鎵嬶紝鍥犳ら渶瑕佺郴緇熷︿範銆
B. 什麼是量化交易
量化交易是指以先進的數學模型替代人為的主觀判斷,利用計算機技術磨氏族從龐大的歷史數據中海核燃選能帶來超額收益的多種「大概率」事件以制定策略,極大地減少了投資者情緒瞎弊波動的影響,避免在市場極度狂熱或悲觀的情況下作出非理性的投資決策。
C. R璇璦 騫誇箟鍔犳фā鍨婫AM
鍘熸枃閾炬帴錛歨ttp://tecdat.cn/?p=20882
1瀵艱█
榪欑瘒鏂囩珷鎺㈣ㄤ簡涓轟粈涔堜嬌鐢ㄥ箍涔夌浉鍔犳ā鍨鏄涓涓涓嶉敊鐨勯夋嫨銆備負姝わ紝鎴戜滑棣栧厛鏃呴》闇瑕佺湅涓涓綰挎у洖褰錛岀湅鐪嬩負浠涔堝湪鏌愪簺鎯呭喌涓嬪畠鍙鑳戒笉鏄鏈浣抽夋嫨銆
2鍥炲綊妯″瀷
鍋囪炬垜浠鏈変竴浜涘甫鏈変袱涓灞炴Y鍜孹鐨勬暟鎹銆傚傛灉瀹冧滑鏄綰挎х浉鍏崇殑錛屽垯瀹冧滑鍙鑳界湅璧鋒潵鍍忚繖鏍鳳細
a<-ggplot(my_data, aes(x=X,y=Y))+geom_point()+
涓轟簡媯鏌ヨ繖縐嶅叧緋伙紝鎴戜滑鍙浠ヤ嬌鐢ㄥ洖褰掓ā鍨嬨傜嚎鎬у洖褰掓槸涓縐嶄嬌鐢╔鏉ラ勬祴鍙橀噺Y鐨勬柟娉曘傚皢鍏跺簲鐢ㄤ簬鎴戜滑鐨勬暟鎹灝嗛勬祴鎴愮孩綰跨殑涓緇勫礆細
a+geom_smooth(col="red", method="lm")+
榪欏氨鏄鈥鐩寸嚎鏂圭▼寮鈥濄傛牴鎹姝ょ瓑寮忥紝鎴戜滑鍙浠ヤ粠鐩寸嚎鍦▂杞翠笂寮濮嬬殑浣嶇疆錛堚鎴璺鈥濇垨偽錛夊紑濮嬫弿榪幫紝騫朵笖姣忎釜鍗曚綅鐨剎閮藉炲姞浜嗗氬皯y錛堚滄枩鐜団濓級錛屾垜浠灝嗗畠縐頒負x鐨勭郴鏁幫紝鎴栫О涓何詫級銆傝繕鏈変竴鐐硅嚜鐒剁殑娉㈠姩錛屽傛灉娌℃湁鐨勮瘽錛屾墍鏈夌殑鐐歸兘灝嗘槸瀹岀編鐨勩傛垜浠灝嗘ょО涓衡孌嬪樊鈥濓紙ϵ錛夈傛暟瀛︿笂鏄錛
璇風偣鍑昏緭鍏ュ浘鐗囨弿榪
10瀹冩瘮綰挎фā鍨嬪ソ鍚楋紵
璁╂垜浠瀵規瘮鍏鋒湁鐩稿悓鏁版嵁鐨勬櫘閫氱嚎鎬у洖褰掓ā鍨嬶細
鎴戜滑鐨鏂瑰樊鍒嗘瀽鍑芥暟鍦ㄨ繖閲屾墽琛屼簡f媯楠岋紝鎴戜滑鐨凣AM妯″瀷鏄庢樉浼樹簬綰挎у洖褰掋
11灝忕粨
鎵浠ワ紝鎴戜滑鐪嬩簡浠涔堟槸鍥炲綊妯″瀷錛屾垜浠鏄濡備綍瑙i噴涓涓鍙橀噺y鍜屽彟涓涓鍙橀噺x鐨勩傚叾涓涓涓鍩烘湰鍋囪炬槸綰挎у叧緋伙紝浣嗘儏鍐靛苟闈炴繪槸榪欐牱銆傚綋鍏崇郴鍦▁鐨勮寖鍥村唴鍙樺寲鏃訛紝鎴戜滑鍙浠ヤ嬌鐢ㄥ嚱鏁版潵鏀瑰彉榪欎釜褰㈢姸銆備竴涓寰堝ソ鐨勬柟娉曟槸鍦ㄢ滅粨鈥濈偣澶勫皢鍏夋粦鏇茬嚎閾炬帴鍦ㄤ竴璧鳳紝鎴戜滑縐頒箣涓衡滄牱鏉℃洸綰庫
鎴戜滑鍙浠ュ湪甯歌勫洖褰掍腑浣跨敤榪欎簺鏍鋒潯鏇茬嚎錛屼絾鏄濡傛灉鎴戜滑鍦℅AM鐨勮儗鏅涓浣跨敤瀹冧滑錛屾垜浠鍚屾椂浼拌′簡鍥炲綊妯″瀷浠ュ強濡備綍浣挎垜浠鐨勬ā鍨嬫洿鍏夋粦銆
涓婇潰鐨勭ず渚嬫樉紺轟簡鍩轟簬鏍鋒潯鐨凣AM錛屽叾鎷熷悎搴︽瘮綰挎у洖褰掓ā鍨嬪ソ寰楀氥
12鍙傝冿細
NELDER, J. A. & WEDDERBURN, R. W. M. 1972. Generalized Linear Models. Journal of the Royal Statistical Society. Series A (General), 135, 370-384.
HARRELL, F. E., JR. 2001. Regression Modeling Strategies, New York, Springer-Verlag New York.
璇風偣鍑昏緭鍏ュ浘鐗囨弿榪
鏈鍙楁㈣繋鐨勮佽В
1.R璇璦澶氬厓Logistic閫昏緫鍥炲綊 搴旂敤妗堜緥
2.闈㈡澘騫蟲粦杞縐誨洖褰(PSTR)鍒嗘瀽妗堜緥瀹炵幇
3.matlab涓鐨勫嚲鏈灝忎簩涔樺洖褰掞紙PLSR錛夊拰涓繪垚鍒嗗洖褰掞紙PCR錛
4.R璇璦娉婃澗Poisson鍥炲綊妯″瀷鍒嗘瀽妗堜緥
5.R璇璦鍥炲綊涓鐨凥osmer-Lemeshow鎷熷悎浼樺害媯楠
6.r璇璦涓瀵筁ASSO鍥炲綊錛孯idge宀鍥炲綊鍜孍lastic Net妯″瀷瀹炵幇
7.鍦≧璇璦涓瀹炵幇Logistic閫昏緫鍥炲綊
8.python鐢ㄧ嚎鎬у洖褰掗勬祴鑲$エ浠鋒牸
9.R璇璦濡備綍鍦ㄧ敓瀛樺垎鏋愪笌Cox鍥炲綊涓璁$畻IDI錛孨RI鎸囨爣
D. 什麼是資本資產定價模型,如何使用
原文鏈接:http://tecdat.cn/?p=20031
簡介
資本資產定價模型(CAPM)是用於確定是否在一個特定資產的投資是值得的。本質上,問題是:「該資產的回報是否值得投資?」 在本教程中,我們將應用CAPM模型,使用多元回歸模型查看特定股票是否值得投資。
CAPM:公式
經濟學就是權衡取捨。根據CAPM公式,基本上將股票或任何類型的資產類別與相對無風險的資產(通常是政府債券)進行比較,因為這些資產的違約概率非常低。CAPM公式如下
E. 值得推薦的數據可視化工具有哪些
推薦幾款我比較常用的可視化工具
Excel
通常認為Excel不是可視化工具,不過也確實能作出一些很漂亮的圖表,主要問題在於默認的圖表設計都太丑了太丑了。如果你想做得好一點,可能要花的時間比較多。不支持一鍵拖拽生成圖表,在細節的處理上需要花更多的時間。
實際上還有很多其他的像echart,D3.js,highcharts等等,工具的選擇上是非常多的,我個人的建議是在精專一個的同時多了解一下其他的工具。「你手裡拿著錘子,看什麼都是釘子」,不要被你自己所掌握的工具所限制,我們的出發點始終是問題解決的。我們應當做的是「你眼裡看著釘子,拿什麼都是錘子」。(文/艾萌atanqing,一個略懂數據分析的心理咨詢師)