A. 如何用爬虫抓取股市数据并生成分析报表
1. 关于数据采集
股票数据是一种标准化的结构数据,是可以通过API接口访问的(不过一般要通过渠道,开放的API有一定的局限性)。也可以通过爬虫软件进行采集,但是爬虫软件采集数据不能保证实时性,根据数据量和采集周期,可能要延迟几十秒到几分钟不等。我们总结了一套专业的爬虫技术解决方案(Ruby + Sidekiq)。能够很快实现这个采集,也可以后台可视化调度任务。
2. 关于展现
网络股票数据的展现,网页端直接通过HTML5技术就已经足够,如果对界面要求高一点,可以采用集成前端框架,如Bootstrap;如果针对移动端开发, 可以使用Ionic框架。
3. 关于触发事件
如果是采用Ruby on Rails的开发框架的话,倒是很方便了,有如sidekiq, whenever这样子的Gem直接实现任务管理和事件触发。
B. 阃氲揪淇¤偂绁ㄦ暟鎹涓嬭浇涓庡煎嚭璇﹁В
阃氲揪淇℃槸涓娆惧箍娉涗娇鐢ㄧ殑镶$エ鍒嗘瀽杞浠讹纴瀹冩彁渚涗简涓板瘜镄勮偂绁ㄦ暟鎹涓嬭浇涓庡煎嚭锷熻兘銆傝繖浜涘姛鑳戒娇寰楃敤鎴疯兘澶熸柟渚垮湴銮峰彇镓闇镄勮偂绁ㄦ暟鎹锛屼互渚胯繘琛屾洿娣卞叆镄勫垎鏋愬拰镰旂┒銆
棣栧厛锛岄氲揪淇℃彁渚涗简澶氱嶈偂绁ㄦ暟鎹涓嬭浇镄勬柟寮忋傜敤鎴峰彲浠ラ氲繃杈揿叆镶$エ浠g爜鎴栧悕绉版潵妫绱㈠苟涓嬭浇镓闇镄勮偂绁ㄦ暟鎹銆傛ゅ栵纴阃氲揪淇¤缮鏀鎸佽嚜瀹氢箟鏁版嵁涓嬭浇锛岀敤鎴峰彲浠ユ牴鎹镊宸辩殑闇姹傝剧疆涓嬭浇鍙傛暟锛屼緥濡傛椂闂磋寖锲淬佹暟鎹绫诲瀷绛夈傝繖浣垮缑鐢ㄦ埛鑳藉熺伒娲诲湴銮峰彇镓闇镄勮偂绁ㄦ暟鎹锛屾弧瓒充笉钖岀殑鍒嗘瀽闇姹伞
鍦ㄥ煎嚭镶$エ鏁版嵁鏂归溃锛岄氲揪淇′篃鎻愪緵浜嗗氱嶅煎嚭镙煎纺鍜岄夐”銆傜敤鎴峰彲浠ュ皢涓嬭浇镄勮偂绁ㄦ暟鎹瀵煎嚭涓篍xcel銆丆SV绛夊父瑙佹牸寮忥纴鏂逛究钖庣画镄勬暟鎹澶勭悊鍜屽垎鏋愩傚悓镞讹纴阃氲揪淇¤缮鏀鎸佽嚜瀹氢箟瀵煎嚭瀛楁碉纴鐢ㄦ埛鍙浠ユ牴鎹镊宸辩殑鍒嗘瀽闇姹傞夋嫨闇瑕佸煎嚭镄勬暟鎹瀛楁碉纴鎻愰珮鏁版嵁澶勭悊镄勬晥鐜囥
涓句釜渚嫔瓙锛屽亣璁句竴涓鐢ㄦ埛𨱍宠佷笅杞藉苟瀵煎嚭镆愬彧镶$エ镄勫巻鍙蹭环镙兼暟鎹銆备粬鍙浠ュ湪阃氲揪淇′腑杈揿叆璇ヨ偂绁ㄧ殑浠g爜鎴栧悕绉帮纴阃夋嫨闇瑕佷笅杞界殑镞堕棿锣冨洿鍜屾暟鎹绫诲瀷锛岀劧钖庣偣鍑讳笅杞芥寜阍銆备笅杞藉畬鎴愬悗锛屼粬鍙浠ュ皢鏁版嵁瀵煎嚭涓篍xcel镙煎纺锛屽苟鍦‥xcel涓瀵规暟鎹杩涜岃繘涓姝ョ殑鍒嗘瀽鍜屽勭悊銆
镐讳箣锛岄氲揪淇$殑镶$エ鏁版嵁涓嬭浇涓庡煎嚭锷熻兘涓虹敤鎴锋彁渚涗简渚垮埄镄勬暟鎹銮峰彇鍜屽勭悊鏂瑰纺锛屾弧瓒充简涓嶅悓鐢ㄦ埛镄勯渶姹伞傞氲繃𨱔垫椿杩愮敤杩欎簺锷熻兘锛岀敤鎴峰彲浠ユ洿濂藉湴杩涜岃偂绁ㄥ垎鏋愬拰镰旂┒锛屼负鎶曡祫鍐崇瓥鎻愪緵链夊姏镄勬敮鎸併
C. 璇锋暀python閲忓寲浜ゆ槗镞剁敤鍒扮殑镶$エ姣忓ぉ阃愮玛浜ゆ槗鏁版嵁濡备綍鐖鍙栵纻
棣栧厛锛屾墦寮链熻揣浜ゆ槗杞浠讹纴锏诲綍镊宸辩殑浜ゆ槗璐︽埛銆傞夋嫨鐩稿簲镄勬湡璐у悎绾︼纴杩涘叆浜ゆ槗鐣岄溃銆
鍏舵★纴镓惧埌钬沧垚浜よ板綍钬濇垨钬滈愮玛鎴愪氦钬濈瓑鐩稿叧锷熻兘鎸夐挳銆傚湪涓浜涗氦鏄撹蒋浠朵腑锛岃繖涓鎸夐挳鍙鑳戒綅浜庝氦鏄撶晫闱㈢殑搴曢儴鎴栦晶杈规爮銆
铹跺悗锛岀偣鍑烩沧垚浜よ板綍钬濇垨钬滈愮玛鎴愪氦钬濇寜阍锛岃繘鍏ユ垚浜よ板綍椤甸溃銆傚湪杩欎釜椤甸溃涓婏纴浣犲彲浠ョ湅鍒版渶杩戠殑鎴愪氦璁板綍鍒楄〃銆
鎺ヤ笅𨱒ワ纴镓惧埌钬滃煎嚭钬濇垨钬滃煎嚭鎴愪氦鏄庣粏钬濈瓑鎸夐挳銆傝繖涓鎸夐挳阃氩父浣崭簬鎴愪氦璁板綍椤甸溃镄勪笂鏂规垨涓嬫柟銆
铹跺悗锛岀偣鍑烩滃煎嚭钬濇垨钬滃煎嚭鎴愪氦鏄庣粏钬濇寜阍锛岄夋嫨瀵煎嚭鏂囦欢镄勬牸寮忓拰淇濆瓨璺寰勚备竴鑸𨱒ヨ达纴鎴戜滑鍙浠ラ夋嫨瀵煎嚭涓篍xcel鎴朇SV镙煎纺镄勬枃浠讹纴杩欐牱鍙浠ユ柟渚垮悗缁镄勬暟鎹澶勭悊鍜屽垎鏋愩
链钖庯纴镣瑰嚮钬灭‘璁も濇垨钬滃煎嚭钬濇寜阍锛岀瓑寰呰蒋浠跺畬鎴愬煎嚭杩囩▼銆傚煎嚭镄勯熷害鍙栧喅浜庢垚浜よ板綍镄勬暟閲忓拰鐢佃剳镐ц兘绛夊洜绱犮
涓镞﹀煎嚭瀹屾垚锛屼綘灏卞彲浠ュ湪阃夋嫨镄勪缭瀛樿矾寰勪腑镓惧埌瀵煎嚭镄勬枃浠躲傞氲繃镓揿紑杩欎釜鏂囦欢锛屼綘灏卞彲浠ユ煡鐪嫔拰鍒嗘瀽链熻揣阃愮玛鎴愪氦鏄庣粏浜嗐
瀵煎嚭镄勬湡璐ч愮玛鎴愪氦鏄庣粏鏂囦欢阃氩父鍖呮嫭浠ヤ笅淇℃伅锛氢氦鏄撴棩链熴佷氦鏄撴椂闂淬佹垚浜や环镙笺佹垚浜ゆ暟閲忋佷拱鍗栨柟钖戠瓑銆傝繖浜涗俊鎭鍙浠ュ府锷╀綘杩借釜姣忎竴绗旀垚浜ょ殑𨱍呭喌锛屽垎鏋愬竞鍦虹殑涔板崠锷涢噺鍜屼氦鏄撹屼负銆
阃氲繃瀵规湡璐ч愮玛鎴愪氦鏄庣粏镄勫垎鏋愶纴浜ゆ槗钥呭拰鎶曡祫钥呭彲浠ヨ幏鍙栦互涓嬫柟闱㈢殑淇℃伅锛
棣栧厛锛屼简瑙e竞鍦虹殑鎴愪氦𨱍呭喌銆傞氲繃镆ョ湅鎴愪氦浠锋牸鍜屾垚浜ゆ暟閲忥纴鍙浠ュ垽鏂甯傚満镄勪环镙艰蛋锷垮拰浜ゆ槗娲昏穬搴︺
鍏舵★纴鍒嗘瀽甯傚満镄勪拱鍗栧姏閲忋傞氲繃缁熻′拱鍏ュ拰鍗栧嚭镄勬暟閲忓拰姣斾緥锛屽彲浠ヤ简瑙e竞鍦虹殑澶氱┖鍙屾柟锷涢噺瀵规瘆锛屽垽鏂甯傚満镄勮蛋锷垮拰瓒嫔娍銆
鍐嶆★纴镰旂┒浜ゆ槗钥呯殑琛屼负鍜岀瓥鐣ャ傞氲繃鍒嗘瀽鎴愪氦璁板綍锛屽彲浠ヤ简瑙d氦鏄撹呯殑涔板崠琛屼负鍜岀瓥鐣ワ纴鍙戠幇涓浜涙綔鍦ㄧ殑浜ゆ槗链轰细銆
链钖庯纴浼桦寲浜ゆ槗绛栫暐鍜岄庨橹绠$悊銆傞氲繃瀵规湡璐ч愮玛鎴愪氦鏄庣粏镄勭爷绌讹纴鍙浠ュ彂鐜颁竴浜涘父瑙佺殑浜ゆ槗阌栾鍜岄庨橹锲犵礌锛屼粠钥屾敼杩涜嚜宸辩殑浜ゆ槗绛栫暐鍜岄庨橹绠$悊鑳藉姏銆
D. 爬虫都可以干什么
爬虫技术前景非常不错,搜狗 网络 字节跳动 这样的互联网公司都需要爬虫工程师啊,而且薪资非常不错。
Python、C++、PHP 这些编程语言都很火热啊,现在干什么不都需要爬虫啊。
数据采集、舆情分析、撰写行业报告、AI、自然语言处理 都需要大数据和爬虫啊
我觉得你可以亲自试试,感受一下爬虫的魅力,比如 前嗅的数据采集器就可以,网络直接搜就行