① 大數據股票龍頭股票
大數據龍頭股票有:
1、福田汽車600166:
大數據龍頭。2020年報顯示,公司的營業收入577.7億元,同比增長22.99%,近3年復合增長18.63%。公司是網路Apollo的合作夥伴,與網路就車聯網、大數據、智能汽車和無人駕駛展開全面合作,共同打造面向未來的智能互聯網商用汽車。
2、高鴻股份000851:
大數據龍頭。公司2020年實現總營收70.18億,同比增長-38.49%。2014年6月17日晚間公告稱,公司擬聯合貴州旅遊投資控股有限責任公司、貴州產業技術發展研究院,合計認繳資5000萬元發起方式設立貴州大數據旅遊產業股份有限公司,立足貴州,面向全國打造知名的大數據旅遊平台運營公司。
3、神州數碼000034:雙方將聚焦金融、稅務、醫療大數據、農業等領域構建差異化雲服務,未來將帶動上百萬企業和代理商客戶向雲轉型。
4、中國長城000066:採用新一代的人工智慧和大數據技術,為傳統智慧城市提供全新的一攬子解決方案,促進關鍵行業的產業升級。
5、華數傳媒000156:公司處於大數據產業鏈的數據端(影音數據),公司通過有線電視網路業務逐步輻射互動電視/IPTV、手機電視、互聯網電視和互聯網視聽等新媒體業務,同時公司於阿里合作推出阿里盒子,掌控電視屏入口。
6、常山北明000158:中標舞鋼市智慧城市項目;通過整合雲計算、大數據、物聯網、移動互聯網和人工智慧等領域技術、業務成果,融合成國內領先的智慧城市總體解決方案。
7、美的集團000333:2014年3月,公司與阿里雲簽署《框架合作協議》,就構建基於雲平台的物聯網智慧系統及大數據應用達成框架合作意向 。
拓展資料:
股票投資注意事項
1、股票價格。購買股票時要觀察的第一件事是每隻股票的價格。這不僅決定了自己是否負擔得起該股票投資,還決定了購買每種證券的數量。如果自己是通過經紀人購買股票,則平均每購買一股股票就需要支付一定的傭金。
2、收益。即使自己負擔得起某隻股票,也不意味著該證券值得購買。因為如果自己認為該企業將來會獲得高利潤,則100元的股票可能會顯得便宜。
3、股利。當自己購買股票時應該先查找這些公司是否有向投資者支付股息的歷史。這是公司在有足夠現金儲備的前提下可以選擇向股東支付現金。即使股票下跌一段時間,股息也可以為自己提供一定的收益。並且需要注意公司是否有提高股息金額的歷史。
4、股票風險。如果自己要購買大量股票,應該要倆接公司交易所在行業的市場風險。
② 大數據相關概念股票有哪些
1、拓爾思( 300229 )。北京拓爾思信息技術股份有限公司是第一家在A股上市的大數據技術企業,公司資產近20億元人民幣。
公司已在全國主要中心城市設立了分公司或辦事處。自主研發的TRS系列產品和服務已被國內外4000多家企業級機構客戶廣泛使用,在中國非結構化中文信息智能應用軟體市場的佔有率位居第一。大數據技術領先,長期價值凸顯,大數據處理技術業內領先,技術完善產品市場空間廣闊。
2、科華恆盛( 002335 )。廈門科華恆盛股份有限公司成立於1999年,是一家以研究電力電子技術為核心的高科技企業,是中國本土最大的高端UPS電源製造商與提供商。
科華定位「數據中心基礎設施解決方案提供商」,在中大型數據中心市場打破外資壟斷優勢,實現高端突破。即使2016年占數據中心市場10%份額,也有2倍以上成長空間。
3、萬達信息( 300168 )。萬達信息是以公共事務為核心的城市信息化領域的軟體和服務提供商,依託在大型應用軟體開發、復雜系統集成和先進軟體架構等方面的領先水平,公司已發展成為國內城市信息化領域的領先企業。
4、榕基軟體( 002474 )。榕基軟體成立於1993年10月,2007年10月整體改制變更為股份有限公司。公司專注於發展軟體產品的開發和銷售、計算機系統集成及技術支持和服務業務,是行業內取得資質和認證種類最齊全、等級最高的企業之一。
5、太極股份(政務雲服務及政務大數據服務優質運營商)
6、漢得信息(智能製造應用軟體服務商)
7、啟明星辰(信息安全龍頭企業,核心客戶集中於黨政軍領域,全面布局城市級安全運營中心)
③ 大數據的應用領域有哪些
1.了解和定位客戶
這是大數據目前最廣為人知的應用領域。很多企業熱衷於社交媒體數據、瀏覽器日誌、文本挖掘等各類數據集,通過大數據技術創建預測模型,從而更全面地了解客戶以及他們的行為、喜好。
利用大數據,美國零售商Target公司甚至能推測出客戶何時會有Baby;電信公司可以更好地預測客戶流失;沃爾瑪可以更准確的預測產品銷售情況;汽車保險公司能更真實的了解客戶實際駕駛情況。
滑雪場利用大數據來追蹤和鎖定客戶。如果你是一名狂熱的滑雪者,想像一下,你會收到最喜歡的度假勝地的邀請;或者收到定製化服務的簡訊提醒;或者告知你最合適的滑行線路。。。。。。同時提供互動平台(網站、手機APP)記錄每天的數據——多少次滑坡,多少次翻越等等,在社交媒體上分享這些信息,與家人和朋友相互評比和競爭。
除此之外,政府競選活動也引入了大數據分析技術。一些人認為,奧巴馬在2012年總統大選中獲勝,歸功於他們團隊的大數據分析能力更加出眾。
2.
改善醫療保健和公共衛生
大數據分析的能力可以在幾分鍾內解碼整個DNA序列,有助於我們找到新的治療方法,更好地理解和預測疾病模式。試想一下,當來自所有智能手錶等可穿戴設備的數據,都可以應用於數百萬人及其各種疾病時,未來的臨床試驗將不再局限於小樣本,而是包括所有人!
蘋果公司的一款健康APP ResearchKit有效將手機變成醫學研究設備。通過收集用戶的相關數據,可以追蹤你一天走了多少步,或者提示你化療後感覺如何,帕金森病進展如何等問題。研究人員希望這一過程變得更容易、更自動化,吸引更多的參與者,並提高數據的准確度。
大數據技術也開始用於監測早產兒和患病嬰兒的身體狀況。通過記錄和分析每個嬰兒的每一次心跳和呼吸模式,提前24小時預測出身體感染的症狀,從而及早干預,拯救那些脆弱的隨時可能生命危險的嬰兒。
更重要的是,大數據分析有助於我們監測和預測流行性或傳染性疾病的暴發時期,可以將醫療記錄的數據與有些社交媒體的數據結合起來分析。比如,谷歌基於搜索流量預測流感爆發,盡管該預測模型在2014年並未奏效——因為你搜索「流感症狀」並不意味著真正生病了,但是這種大數據分析的影響力越來越為人所知。
3.提供個性化服務
大數據不僅適用於公司和政府,也適用於我們每個人,比如從智能手錶或智能手環等可穿戴設備採集的數據中獲益。Jawbone的智能手環可以分析人們的卡路里消耗、活動量和睡眠質量等。Jawbone公司已經能夠收集長達60年的睡眠數據,從中分析出一些獨到的見解反饋給每個用戶。從中受益的還有網路平台「尋找真愛」,大多數婚戀網站都使用大數據分析工具和演算法為用戶匹配最合適的對象。
4.
了解和優化業務流程
大數據也越來越多地應用於優化業務流程,比如供應鏈或配送路徑優化。通過定位和識別系統來跟蹤貨物或運輸車輛,並根據實時交通路況數據優化運輸路線。
人力資源業務流程也在使用大數據進行優化。Sociometric Solutions公司通過在員工工牌里植入感測器,檢測其工作場所及社交活動——員工在哪些工作場所走動,與誰交談,甚至交流時的語氣如何。美國銀行在使用中發現呼叫中心表現最好的員工——他們制定了小組輪流休息制度,平均業績提高了23%。
如果在手機、鑰匙、眼鏡等隨身物品上粘貼RFID標簽,萬一不小心丟失就能迅速定位它們。假想一下未來可能創造出貼在任何東西上的智能標簽。它們能告訴你的不僅是物體在哪裡,還可以反饋溫度,濕度,運動狀態等等。這將打開一個全新的大數據時代,「大數據」領域尋求共性的信息和模式,那麼孕育其中的「小數據」著重關注單個產品。
5.
改善城市和國家建設
大數據被用於改善我們城市和國家的方方面面。目前很多大城市致力於構建智慧交通。車輛、行人、道路基礎設施、公共服務場所都被整合在智慧交通網路中,以提升資源運用的效率,優化城市管理和服務。
加州長灘市正在使用智能水表實時檢測非法用水,幫助一些房主減少80%的用水量。洛杉磯利用磁性道路感測器和交通攝像頭的數據來控制交通燈信號,從而優化城市的交通流量。據統計目前已經控制了全市4500個交通燈,將交通擁堵狀況減少了約16%。
6.提升科學研究
大數據帶來的無限可能性正在改變科學研究。歐洲核子研究中心(CERN)在全球遍布了150個數據中心,有65,000個處理器,能同時分析30pb的數據量,這樣的計算能力影響著很多領域的科學研究。比如政府需要的人口普查數據、自然災害數據等,變的更容易獲取和分析,從而為我們的健康和社會發展創造更多的價值。
7.提升機械設備性能
大數據使機械設備更加智能化、自動化。例如,豐田普銳斯配備了攝像頭、全球定位系統以及強大的計算機和感測器,在無人干預的條件下實現自動駕駛。Xcel Energy在科羅拉多州啟動了「智能電網」的首批測試,在用戶家中安裝智能電表,然後登錄網站就可實時查看用電情況。「智能電網」還能夠預測使用情況,以便電力公司為未來的基礎設施需求進行規劃,並防止出現電力耗盡的情況。在愛爾蘭,雜貨連鎖店Tescos的倉庫員工佩戴專用臂帶,追蹤貨架上的商品分配,甚至預測一項任務的完成時間。
8.強化安全和執法能力
大數據在改善安全和執法方面得到了廣泛應用。美國國家安全局(NSA)利用大數據技術,檢測和防止網路攻擊(挫敗恐怖分子的陰謀)。警察運用大數據來抓捕罪犯,預測犯罪活動。信用卡公司使用大數據來檢測欺詐交易等等。
2014年2月,芝加哥警察局對大數據生成的「名單」——有可能犯罪的人員,進行通告和探訪,目的是提前預防犯罪。
9.
提高體育運動技能
如今大多數頂尖的體育賽事都採用了大數據分析技術。用於網球比賽的IBM SlamTracker工具,通過視頻分析跟蹤足球落點或者棒球比賽中每個球員的表現。許多優秀的運動隊也在訓練之外跟蹤運動員的營養和睡眠情況。NFL開發了專門的應用平台,幫助所有球隊根據球場上的草地狀況、天氣狀況、以及學習期間球員的個人表現做出最佳決策,以減少球員不必要的受傷。
還有一件非常酷的事情是智能瑜伽墊:嵌入在瑜伽墊中的感測器能對你的姿勢進行反饋,為你的練習打分,甚至指導你在家如何練習。
10.金融交易
大數據在金融交易領域應用也比較廣泛。大多數股票交易都是通過一定的演算法模型進行決策的,如今這些演算法的輸入會考慮來自社交媒體、新聞網路的數據,以便更全面的做出買賣決策。同時根據客戶的需求和願望,這些演算法模型也會隨著市場的變化而變化。
更多精彩:14_spark體系之分布式計算課程Spark 集群搭建+S
④ 「大數據」主要涉及哪些領域相關股票分別有哪些
近期,大數據概念正在風靡全球,從華爾街到國內資本市場,大數據概念股持續走強。5月17日,可視化數據分析軟體供應商Tableau 及大數據營銷公司Marketo一登陸美股市場,便引來瘋狂的買盤。截至當日收盤,Marketo的股價飆升77.69%,Tableau的股價也暴漲63.71%。美股對「大數據」概念的瘋狂熱炒很快傳播到了A股市場。今年以來至今,大數據概念股逆市上揚,累計漲幅達47.8%。根據細分行業分類,「大數據」主要涉及七大領域,包括數據處理和分析環節以及綜合處理、語音識別、視頻識別、商業智能軟體、數據中心建設與維護、IT咨詢和方案實施、信息安全等。
相關股票
「大數據」涉及的七大領域之一數據處理、分析環節和綜合處理,與其相關的國內A股上市公司拓爾思和美亞柏科,近期表現搶眼。
語音識別作為「大數據」涉及的七大領域之一,近期,其相關的科大訊飛、大華股份(002236)、華平股份(300074)、中威電子(300270)和國騰電子(300101)等5隻個股受到市場關注。
目前,國內A股市場中涉及視頻識別行業的上市公司主要有5家,具體為:海康威視(002415)、大華股份、華平股份、中威電子、國騰電子。這5隻個股今年以來至今均有不錯表現,大華股份(74.34%)、華平股份(60.34%)、國騰電子(25.49%)、海康威視(22.47%)、中威電子(15.60%)。
目前,A股市場中涉及商業智能軟體生產的上市公司主要有:久其軟體(002279)、用友軟體(600588)、東方國信(300166)。
對於國內企業而言,在大型設備與基礎軟體方面尚無法與全球IT巨頭匹敵。不過,在應用軟體、IT服務的多個細分領域,國內企業已積累了客戶基礎與行業、項目經驗,有望借大數據的興起而獲得增長助力。
值得一提的是,漢得信息是我國本土領先的IT咨詢企業,多年來致力於為企業提供高端ERP實施服務。
三分技術,七分數據,得數據者得天下。隨著未來數據的規模劇增,數據中心的建設與維護是必不可少的。目前A股中涉及數據中心建設與維護的公司包括天璣科技(300245)、銀信科技(300231)和榮之聯(002642)。
目前A股涉及信息安全領域的個股包括:衛士通(002268)、同有科技(300302)、美亞柏科等等。
⑤ 可以利用大數據炒股嗎
大數據可以用於股票交易,所謂大數據,就是一個新的分析概念,利用新的系統、新的工具、新的模型來挖掘大量動態的、可持續的數據,從而獲得具有洞察力和新價值的東西。大數據已經在一些金融工具中有所體現,大數據會將股票之前的數據全都發布出來,股民可以根據這只股票之前的數據來進行對比。
其實大數據只能說是個趨勢,我們可以通過打數據讓投資者能夠有一個參考性,但不能夠過度依賴大數據,畢竟著只是數據,這些數據是死的,而股市卻是千變萬化的,我們不能過度的依賴大數據得出的分析與結論,大數據也只是作為一個參考數據。世事無絕對,更何況是股票,可能上一秒還是盈利的狀態,但是下一秒就已經處於虧損了,不少人也因為炒股傾家盪產,所以這邊還是要提醒大家一下,謹慎行事,不要盲目跟風。
⑥ 大數據分析技術應用領域有哪些
大數據分析應用的十大應用領域!每當我們說到大數據應用分析的時候,很多人都會覺得那是一個龐大的伺服器集群,其實大數據應用分析平台開發在人類社會實踐中發揮著巨大的優勢,它被應用的深度和廣度超乎我們的相像,今天小編給大家介紹一下大數據應用分析平台的十大常見應用領域,一起來了解一下吧。
1、了解和定位客戶:這是大數據分析應用平台目前最廣為人知的應用領域。很多企業熱衷於社交媒體數據、瀏覽器日誌、文本挖掘等各類數據集,通過大數據技術創建預測模型,從而更全面地了解客戶以及他們的行為、喜好,從而對客戶或產品進行定位。
2、了解和優化業務流程:大數據分析應用平台也越來越多地應用於優化業務流程,比如供應鏈或配送路徑優化。通過定位和識別系統來跟蹤貨物或運輸車輛,並根據實時交通路況數據優化運輸路線。
3、提供個性化服務:大數據分析應用平台不僅適用於公司和政府,也適用於我們每個人,比如從智能手錶或智能手環等可穿戴設備採集的數據中獲益。假如:智能手環可以分析人們的卡路里消耗、活動量和睡眠質量等。婚戀網站都使用大數據分析工具和演算法為用戶匹配最合適的對象等。
4、改善醫療保健和公共衛生:大數據分析應用平台的數據分析的能力可以在幾分鍾內解碼整個DNA序列,有助於我們找到新的治療方法,更好地理解和預測疾病模式。更重要的是,大數據分析有助於我們監測和預測流行性或傳染性疾病的暴發時期,可以將醫療記錄的數據與有些社交媒體的數據結合起來分析。
5、提高體育運動技能:如今大多數頂尖的體育賽事都採用了大數據分析技術。可採集並分析運動員在訓練之外跟蹤運動員的營養和睡眠情況。以及運動場所的狀況、天氣狀況、以及學習期間運動員的個人表現做出最佳決策,以減少球員不必要的受傷。
6、提升科學研究:大數據分析應用帶來的無限可能性正在改變科學研究。比如政府需要的人口普查數據、自然災害數據等,變的更容易獲取和分析,從而為我們的健康和社會發展創造更多的價值。
7、提升機械設備性能:大數據分析應用使機械設備更加智能化、自動化。
8、強化安全和執法能力:大數據分析應用在改善安全和執法方面得到了廣泛應用。
9、改善城市和國家建設:分析應用被用於改善我們城市和國家的方方面面。目前很多大城市致力於構建智慧交通。車輛、行人、道路基礎設施、公共服務場所都被整合在智慧交通網路中,以提升資源運用的效率,優化城市管理和服務。
10、金融交易:分析應用在金融交易領域應用也比較廣泛。大多數股票交易都是通過一定的演算法模型進行決策的,如今這些演算法的輸入會考慮來自社交媒體、新聞網路的數據,以便更全面的做出買賣決策。同時根據客戶的需求和願望,這些演算法模型也會隨著市場的變化而變化。
隨著大數據分析應用平台開發成本的降低和人們可接受度的提高,大數據會更加普及到日常生活中,未來將會出現哪些新的應用領域,我們值得期待。
⑦ 大數據技術可以應用在炒股上嗎有這種軟體嗎
有的呀,RC智能雲就是運用大數據和智能AI,預測的精準度還可以,超出人類的水平了。
⑧ 大數據在未來發展怎麼樣啊
大數據行業主要上市公司:易華錄(300212)、美亞柏科(300188)、海量數據(603138)、同有科技(300302)、海康威視(002415)、依米康(300249)、常山北明(000158)、思特奇(300608)、科創信息(300730)、神州泰岳(300002)、藍色游標(300058)等
本文核心數據:大數據應用領域分布 互聯網大數據、金融大數據、政府大數據市場規模 應用場景等
應用領域分布:互聯網、政府、金融為大數據主要應用領域
從具體行業應用來看,互聯網、政府、金融和電信引領大數據融合產業發展,合計規模佔比為77.6%。互聯網、金融和電信三個行業由於信息化水平高,研發力量雄厚,在業務數字化轉型方面處於領先地位;政府大數據成為近年來政府信息化建設的關鍵環節,與政府數據整合與開放共享、民生服務、社會治理、市場監管相關的應用需求持續火熱。此外,工業大數據和健康醫療大數據作為新興領域,數據量大、產業鏈延展性高,未來市場增長潛力大。
註:金融大數據市場規模為前瞻根據中國大數據市場規模與金融大數據所佔市場份額數據測算所得,僅供參考。
⑨ 未來大數據的主要應用領域包括哪些
大數據不僅意味著海量、多樣、迅捷的數據處理,更是一種顛覆的思維方式、一項智能的基礎設施、一場創新的技術變革。
大數據不僅意味著海量、多樣、物聯網、智慧城市、增強現實(AR)與虛擬現實(VR)、區塊鏈技術、語音識別、人工智慧、數字匯流是大數據未來應用的七大發展方向。
趨勢一:物聯網
物聯網:把所有物品通過信息感測設備與互聯網連接起來,進行信息交換,即物物相息,以實現智能化識別和管理。
物聯網是新一代信息技術的重要組成部分,也是「信息化」時代的重要發展階段。
物聯網的核心和基礎仍然是互聯網,是在互聯網基礎上的延伸和擴展的網路;
其用戶端延伸和擴展到了任何物品與物品之間,進行信息交換和通信,也就是物物相息。
趨勢二:智慧城市
智慧城市就是運用信息和通信技術手段感測、分析、整合城市運行核心系統的各項關鍵信息;對包括民生、環保、公共安全、城市服務、工商業活動在內的各種需求做出智能響應。其實質是利用先進的信息技術,實現城市智慧式管理和運行,進而為城市中的人創造更美好的生活,促進城市的和諧、可持續成長。這項趨勢的成敗取決於數據量跟數據是否足夠,這有賴於政府部門與民營企業的合作;此外,發展中的5G網路是全世界通用的規格,如果產品被一個智慧城市採用,將可以應用在全世界的智慧城市。
趨勢三:增強現實(AR)與虛擬現實(VR)
擬現實技術是一種可以創建和體驗虛擬世界的計算機模擬系統,它利用計算機生成一種模擬環境;是一種多源信息融合的、互動式的三維動態視景和實體行為的系統模擬使用戶沉浸到該環境中。這兩個技術最近開始降價跟提升質量,走向大眾市場。VR應用一開始以電玩為主,現在的應用卻超越電玩,可以用來教學,靠著VR設備,把家裡的插頭電線完成配線,就像有水電技師在教學一樣。
趨勢四:區塊鏈技術
區塊鏈是分布式數據存儲、點對點傳輸、共識機制、加密演算法等計算機技術的新型應用模式。所謂共識機制是區塊鏈系統中實現不同節點之間建立信任、獲取權益的數學演算法。 區塊鏈技術是指一種全民參與記賬的方式。所有的系統背後都有一個資料庫,你可以把資料庫看成是就是一個大賬本。區塊鏈有很多不同應用方式,美國幾乎所有科技公司都在嘗試如何應用,最常見的應用是比特幣跟其他加密貨幣的交易。
趨勢五:語音識別技術
人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。很多專家都認為語音識別技術是2000年至2010年間,信息技術領域十大重要的科技發展技術之一。語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和資訊理論、發聲機理和聽覺機理、人工智慧等。這項產業有個很大優點,就是發展技術的公司都打算把這項技術商品化。像是google、Amazon跟蘋果的語音識別技術都可透過授權,使用在其他業者的硬體服務上。
趨勢六:人工智慧(AI)
人工智慧(Artificial Intelligence),英文縮寫為AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。
人工智慧需要被教育,匯入很多信息才能進化,進而產生一些意想不到的結果。AI影響幅度很大,例如媒體業,現在計算機跟機器人可以寫出很好的文章,而且1小時產出好幾百篇,成本也低。
AI對經濟發展會產生劇烈影響,很多知識產業跟白領工作也可能被機器人取代。但他對於AI的態度很正面,這會讓生活更好,例如自駕車絕對比人駕車更安全。
趨勢七:數字匯流
大約從1995年左右,就陸續有人在討論所謂「數位匯流」,在不同的使用情境之下,我們還是會需要很不一樣的數位裝置—光是螢幕大小就有好多種選項,音響效果、攝影機,都需要不同的配套。
所以數位比較像是「iCloud」,也就是說所有的裝置會存取同一個遠端資料庫,讓你的數位生活可以完全同步,隨時、無縫的切換使用情境。
但除了「載具」的匯流,我們更應關心的是另一個數位匯流,一個網路商業模式的匯流,或者更明確的說,數字匯流就是「內容」與「電子商務」的匯流。
⑩ 如何用大數據炒股
我們如今生活在一個數據爆炸的世界裡。網路每天響應超過60億次的搜索請求,日處理數據超過100PB,相當於6000多座中國國家圖書館的書籍信息量總和。新浪微博每天都會發布上億條微博。在荒無人煙的郊外,暗藏著無數大公司的信息存儲中心,24小時夜以繼日地運轉著。
克托·邁爾-舍恩伯格在《大數據時代》一書中認為,大數據的核心就是預測,即只要數據豐富到一定程度,就可預測事情發生的可能性。例如,「從一個人亂穿馬路時行進的軌跡和速度來看他能及時穿過馬路的可能性」,或者通過一個人穿過馬路的速度,預測車子何時應該減速從而讓他及時穿過馬路。
那麼,如果把這種預測能力應用在股票投資上,又會如何?
目前,美國已經有許多對沖基金採用大數據技術進行投資,並且收獲甚豐。中國的中證廣發網路百發100指數基金(下稱百發100),上線四個多月以來已上漲68%。
和傳統量化投資類似,大數據投資也是依靠模型,但模型里的數據變數幾何倍地增加了,在原有的金融結構化數據基礎上,增加了社交言論、地理信息、衛星監測等非結構化數據,並且將這些非結構化數據進行量化,從而讓模型可以吸收。
由於大數據模型對成本要求極高,業內人士認為,大數據將成為共享平台化的服務,數據和技術相當於食材和鍋,基金經理和分析師可以通過平台製作自己的策略。
量化非結構數據
不要小看大數據的本領,正是這項剛剛興起的技術已經創造了無數「未卜先知」的奇跡。
2014年,網路用大數據技術預測命中了全國18卷中12卷高考作文題目,被網友稱為「神預測」。網路公司人士表示,在這個大數據池中,包含互聯網積累的用戶數據、歷年的命題數據以及教育機構對出題方向作出的判斷。
在2014年巴西世界盃比賽中,Google亦通過大數據技術成功預測了16強和8強名單。
從當年英格蘭報社的信鴿、費城股票交易所的信號燈到報紙電話,再到如今的互聯網、雲計算、大數據,前沿技術迅速在投資領域落地。在股票策略中,大數據日益嶄露頭角。
做股票投資策略,需要的大數據可以分為結構化數據和非結構化數據。結構化數據,簡單說就是「一堆數字」,通常包括傳統量化分析中常用的CPI、PMI、市值、交易量等專業信息;非結構化數據就是社交文字、地理位置、用戶行為等「還沒有進行量化的信息」。
量化非結構化就是用深度模型替代簡單線性模型的過程,其中所涉及的技術包括自然語言處理、語音識別、圖像識別等。
金融大數據平台-通聯數據CEO王政表示,通聯數據採用的非結構化數據可以分為三類:第一類和人相關,包括社交言論、消費、去過的地點等;第二類與物相關,如通過正在行駛的船隻和貨車判斷物聯網情況;第三類則是衛星監測的環境信息,包括汽車流、港口裝載量、新的建築開工等情況。
衛星監測信息在美國已被投入使用,2014年Google斥資5億美元收購了衛星公司Skybox,從而可以獲得實施衛星監測信息。
結構化和非結構化數據也常常相互轉化。「結構化和非結構化數據可以形象理解成把所有數據裝在一個籃子里,根據應用策略不同相互轉化。例如,在搜索頻率調查中,用戶搜索就是結構化數據;在金融策略分析中,用戶搜索就是非結構化數據。」網路公司人士表示。
華爾街拿著豐厚薪水的分析師們還不知道,自己的僱主已經將大量資本投向了取代自己的機器。
2014年11月23日,高盛向Kensho公司投資1500萬美元,以支持該公司的大數據平台建設。該平台很像iPhone里的Siri,可以快速整合海量數據進行分析,並且回答投資者提出的各種金融問題,例如「下月有颶風,將對美國建材板塊造成什麼影響?」
在Kensho處理的信息中,有80%是「非結構化」數據,例如政策文件、自然事件、地理環境、科技創新等。這類信息通常是電腦和模型難以消化的。因此,Kensho的CEO Daniel Nadler認為,華爾街過去是基於20%的信息做出100%的決策。
既然說到高盛,順便提一下,這家華爾街老牌投行如今對大數據可謂青睞有加。除了Kensho,高盛還和Fortress信貸集團在兩年前投資了8000萬美元給小額融資平台On Deck Capital。這家公司的核心競爭力也是大數據,它利用大數據對中小企業進行分析,從而選出值得投資的企業並以很快的速度為之提供短期貸款。
捕捉市場情緒
上述諸多非結構化數據,歸根結底是為了獲得一個信息:市場情緒。
在采訪中,2013年諾貝爾經濟學獎得主羅伯特•席勒的觀點被無數采訪對象引述。可以說,大數據策略投資的創業者們無一不是席勒的信奉者。
席勒於上世紀80年代設計的投資模型至今仍被業內稱道。在他的模型中,主要參考三個變數:投資項目計劃的現金流、公司資本的估算成本、股票市場對投資的反應(市場情緒)。他認為,市場本身帶有主觀判斷因素,投資者情緒會影響投資行為,而投資行為直接影響資產價格。
然而,在大數據技術誕生之前,市場情緒始終無法進行量化。
回顧人類股票投資發展史,其實就是將影響股價的因子不斷量化的過程。
上世紀70年代以前,股票投資是一種定性的分析,沒有數據應用,而是一門主觀的藝術。隨著電腦的普及,很多人開始研究驅動股價變化的規律,把傳統基本面研究方法用模型代替,市盈率、市凈率的概念誕生,量化投資由此興起。
量化投資技術的興起也帶動了一批華爾街大鱷的誕生。例如,巴克萊全球投資者(BGI)在上世紀70年代就以其超越同行的電腦模型成為全球最大的基金管理公司;進入80年代,另一家基金公司文藝復興(Renaissance)年均回報率在扣除管理費和投資收益分成等費用後仍高達34%,堪稱當時最佳的對沖基金,之後十多年該基金資產亦十分穩定。
「從主觀判斷到量化投資,是從藝術轉為科學的過程。」王政表示,上世紀70年代以前一個基本面研究員只能關注20隻到50隻股票,覆蓋面很有限。有了量化模型就可以覆蓋所有股票,這就是一個大的飛躍。此外,隨著計算機處理能力的發展,信息的用量也有一個飛躍變化。過去看三個指標就夠了,現在看的指標越來越多,做出的預測越來越准確。
隨著21世紀的到來,量化投資又遇到了新的瓶頸,就是同質化競爭。各家機構的量化模型越來越趨同,導致投資結果同漲同跌。「能否在看到報表數據之前,用更大的數據尋找規律?」這是大數據策略創業者們試圖解決的問題。
於是,量化投資的多米諾骨牌終於觸碰到了席勒理論的第三層變數——市場情緒。
計算機通過分析新聞、研究報告、社交信息、搜索行為等,藉助自然語言處理方法,提取有用的信息;而藉助機器學習智能分析,過去量化投資只能覆蓋幾十個策略,大數據投資則可以覆蓋成千上萬個策略。
基於互聯網搜索數據和社交行為的經濟預測研究,已逐漸成為一個新的學術熱點,並在經濟、社會以及健康等領域的研究中取得了一定成果。在資本市場應用上,研究發現搜索數據可有效預測未來股市活躍度(以交易量指標衡量)及股價走勢的變化。
海外就有學術研究指出,公司的名稱或者相關關鍵詞的搜索量,與該公司的股票交易量正相關。德國科學家Tobias Preis就進行了如此研究:Tobias利用谷歌搜索引擎和谷歌趨勢(Google Trends),以美國標普500指數的500隻股票為其樣本,以2004年至2010年為觀察區間,發現谷歌趨勢數據的公司名稱搜索量和對應股票的交易量,在每周一次的時間尺度上有高度關聯性。也就是說,當某個公司名稱在谷歌的搜索量活動增加時,無論股票的價格是上漲或者下跌,股票成交量與搜索量增加;反之亦然,搜索量下降,股票成交量下降。以標普500指數的樣本股為基礎,依據上述策略構建的模擬投資組合在六年的時間內獲得了高達329%的累計收益。
在美國市場上,還有多家私募對沖基金利用Twitter和Facebook的社交數據作為反映投資者情緒和市場趨勢的因子,構建對沖投資策略。利用互聯網大數據進行投資策略和工具的開發已經成為世界金融投資領域的新熱點。
保羅·霍丁管理的對沖基金Derwent成立於2011年5月,注冊在開曼群島,初始規模約為4000萬美元, 2013年投資收益高達23.77%。該基金的投資標的包括流動性較好的股票及股票指數產品。
通聯數據董事長肖風在《投資革命》中寫道,Derwent的投資策略是通過實時跟蹤Twitter用戶的情緒,以此感知市場參與者的「貪婪與恐懼」,從而判斷市場漲跌來獲利。
在Derwent的網頁上可以看到這樣一句話:「用實時的社交媒體解碼暗藏的交易機會。」保羅·霍丁在基金宣傳冊中表示:「多年以來,投資者已經普遍接受一種觀點,即恐懼和貪婪是金融市場的驅動力。但是以前人們沒有技術或數據來對人類情感進行量化。這是第四維。Derwent就是要通過即時關注Twitter中的公眾情緒,指導投資。」
另一家位於美國加州的對沖基金MarketPsych與湯普森·路透合作提供了分布在119個國家不低於18864項獨立指數,比如每分鍾更新的心情狀態(包括樂觀、憂郁、快樂、害怕、生氣,甚至還包括創新、訴訟及沖突情況等),而這些指數都是通過分析Twitter的數據文本,作為股市投資的信號。
此類基金還在不斷涌現。金融危機後,幾個台灣年輕人在波士頓組建了一家名為FlyBerry的對沖基金,口號是「Modeling the World(把世界建模)」。它的投資理念全部依託大數據技術,通過監測市場輿論和行為,對投資做出秒速判斷。
關於社交媒體信息的量化應用,在股票投資之外的領域也很常見:Twitter自己也十分注重信息的開發挖掘,它與DataSift和Gnip兩家公司達成了一項出售數據訪問許可權的協議,銷售人們的想法、情緒和溝通數據,從而作為顧客的反饋意見匯總後對商業營銷活動的效果進行判斷。從事類似工作的公司還有DMetics,它通過對人們的購物行為進行分析,尋找影響消費者最終選擇的細微原因。
回到股票世界,利用社交媒體信息做投資的公司還有StockTwits。打開這家網站,首先映入眼簾的宣傳語是「看看投資者和交易員此刻正如何討論你的股票」。正如其名,這家網站相當於「股票界的Twitter」,主要面向分析師、媒體和投資者。它通過機器和人工相結合的手段,將關於股票和市場的信息整理為140字以內的短消息供用戶參考。
此外,StockTwits還整合了社交功能,並作為插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,讓人們可以輕易分享投資信息。
另一家公司Market Prophit也很有趣。這家網站的宣傳語是「從社交媒體噪音中提煉市場信號」。和StockTwits相比,Market Prophit更加註重大數據的應用。它採用了先進的語義分析法,可以將Twitter里的金融對話量化為「-1(極度看空)」到「1(極度看多)」之間的投資建議。網站還根據語義量化,每天公布前十名和後十名的股票熱度榜單。網站還設計了「熱度地圖」功能,根據投資者情緒和意見,按照不同板塊,將板塊內的個股按照顏色深淺進行標注,誰漲誰跌一目瞭然。
中國原創大數據指數
盡管大數據策略投資在美國貌似炙手可熱,但事實上,其應用尚僅限於中小型對沖基金和創業平台公司。大數據策略投資第一次被大規模應用,應歸於中國的百發100。
網路金融中心相關負責人表示,與歐美等成熟資本市場主要由理性機構投資者構成相比,東亞尤其是中國的股票類證券投資市場仍以散戶為主,因此市場受投資者情緒和宏觀政策性因素影響很大。而個人投資者行為可以更多地反映在互聯網用戶行為大數據上,從而為有效地預測市場情緒和趨勢提供了可能。這也就是中國國內公募基金在應用互聯網大數據投資方面比海外市場並不落後、甚至領先的原因。
百發100指數由網路、中證指數公司、廣發基金聯合研發推出,於2014年7月8日正式對市場發布,實盤運行以來一路上漲,漲幅超過60%。跟蹤該指數的指數基金規模上限為30億份,2014年9月17日正式獲批,10月20日發行時一度創下26小時瘋賣18億份的「神話」。
外界都知道百發100是依託大數據的指數基金,但其背後的細節鮮為人知。
百發100數據層面的分析分為兩個層面,即數據工廠的數據歸集和數據處理系統的數據分析。其中數據工廠負責大數據的收集分析,例如將來源於互聯網的非結構化數據進行指標化、產品化等數據量化過程;數據處理系統,可以在數據工廠遞交的大數據中尋找相互統計關聯,提取有效信息,最終應用於策略投資。
「其實百發100是在傳統量化投資技術上融合了基於互聯網大數據的市場走勢和投資情緒判斷。」業內人士概括道。
和傳統量化投資類似,百發100對樣本股的甄選要考慮財務因子、基本面因子和動量因子,包括凈資產收益率(ROE)、資產收益率(ROA)、每股收益增長率(EPS)、流動負債比率、企業價值倍數(EV/EBITDA)、凈利潤同比增長率、股權集中度、自由流通市值以及最近一個月的個股價格收益率和波動率等。
此外,市場走勢和投資情緒是在傳統量化策略基礎上的創新產物,也是百發100的核心競爭力。接近網路的人士稱,市場情緒因子對百發100基金起決定性作用。
網路金融中心相關負責人是羅伯特•席勒觀點的支持者。他認為,投資者行為和情緒對資產價格、市場走勢有著巨大的影響。因此「通過互聯網用戶行為大數據反映的投資市場情緒、宏觀經濟預期和走勢,成為百發100指數模型引入大數據因子的重點」。
傳統量化投資主要著眼點在於對專業化金融市場基本面和交易數據的應用。但在網路金融中心相關業務負責人看來,無論是來源於專業金融市場的結構化數據,還是來源於互聯網的非結構化數據,都是可以利用的數據資源。因此,前文所述的市場情緒數據,包括來源於互聯網的用戶行為、搜索量、市場輿情、宏觀基本面預期等等,都被網路「變廢為寶」,從而通過互聯網找到投資者參與特徵,選出投資者關注度較高的股票。
「與同期滬深300指數的表現相較,百發100更能在股票市場振盪時期、行業輪動劇烈時期、基本面不明朗時期抓住市場熱點、了解投資者情緒、抗擊投資波動風險。」網路金融中心相關負責人表示。
百發100選取的100隻樣本股更換頻率是一個月,調整時間為每月第三周的周五。
業內人士指出,百發100指數的月收益率與中證100、滬深300、中證500的相關性依次提升,說明其投資風格偏向中小盤。
但事實並非如此。從樣本股的構成來說,以某一期樣本股為例,樣本股總市值6700億元,佔A股市值4.7%。樣本股的構成上,中小板21隻,創業板4隻,其餘75隻樣本股均為大盤股。由此可見,百發100還是偏向大盤為主、反映主流市場走勢。
樣本股每個月的改變比例都不同,最極端的時候曾經有60%進行了換倉。用大數據預測熱點變化,市場熱點往往更迭很快;但同時也要考慮交易成本。兩方面考慮,網路最後測算認為一個月換一次倉位為最佳。
樣本股對百發100而言是核心機密——據說「全世界只有基金經理和指數編制機構負責人兩個人知道」——都是由機器決定後,基金經理分配給不同的交易員建倉買入。基金經理也沒有改變樣本股的權利。
展望未來,網路金融中心相關負責人躊躇滿志,「百發100指數及基金的推出,只是我們的開端和嘗試,未來將形成多樣化、系列投資產品。」
除了百發100,目前市場上打著大數據旗幟的基金還有2014年9月推出的南方-新浪I100和I300指數基金。
南方-新浪I100和I300是由南方基金、新浪財經和深圳證券信息公司三方聯合編制的。和百發100類似,也是按照財務因子和市場情緒因子進行模型打分,按照分值將前100和前300名股票構成樣本股。推出至今,這兩個指數基金分別上漲了10%左右。
正如百發100的市場情緒因子來自網路,南方-新浪I100和I300的市場情緒因子全部來自新浪平台。其中包括用戶在新浪財經對行情的訪問熱度、對股票的搜索熱度;用戶在新浪財經對股票相關新聞的瀏覽熱度;股票相關微博的多空分析數據等。
此外,阿里巴巴旗下的天弘基金也有意在大數據策略上做文章。據了解,天弘基金將和阿里巴巴合作,推出大數據基金產品,最早將於2015年初問世。
天弘基金機構產品部總經理劉燕曾對媒體表示,「在傳統的調研上,大數據將貢獻於基礎資產的研究,而以往過度依賴線下研究報告。大數據將視野拓展至了線上的數據分析,給基金經理選股帶來新的邏輯。」
在BAT三巨頭中,騰訊其實是最早推出指數基金的。騰訊與中證指數公司、濟安金信公司合作開發的「中證騰安價值100指數」早在2013年5月就發布了,號稱是國內第一家由互聯網媒體與專業機構編制發布的A股指數。不過,業內人士表示,有關指數並沒有真正應用大數據技術。雖然騰訊旗下的微信是目前最熱的社交平台,蘊藏了大量的社交數據,但騰訊未來怎麼開發,目前還並不清晰。
大數據投資平台化
中歐商學院副教授陳威如在其《平台戰略》一書中提到,21世紀將成為一道分水嶺,人類商業行為將全面普及平台模式,大數據金融也不例外。
然而,由於大數據模型對成本要求極高,就好比不可能每家公司都搭建自己的雲計算系統一樣,讓每家機構自己建設大數據模型,從數據來源和處理技術方面看都是不現實的。業內人士認為,大數據未來必將成為平台化的服務。
目前,阿里、網路等企業都表示下一步方向是平台化。
螞蟻金服所致力搭建的平台,一方麵包括招財寶一類的金融產品平台,另一方麵包括雲計算、大數據服務平台。螞蟻金服人士說,「我們很清楚自己的優勢不是金融,而是包括電商、雲計算、大數據等技術。螞蟻金服希望用這些技術搭建一個基礎平台,把這些能力開放出去,供金融機構使用。」
網路亦是如此。接近網路的人士稱,未來是否向平台化發展,目前還在討論中,但可以確定的是,「網路不是金融機構,目的不是發產品,百發100的意義在於打造影響力,而非經濟效益。」
當BAT還在摸索前行時,已有嗅覺靈敏者搶佔了先機,那就是通聯數據。
通聯數據股份公司(DataYes)由曾任博時基金副董事長肖風帶隊創建、萬向集團投資成立,總部位於上海,公司願景是「讓投資更容易,用金融服務雲平台提升投資管理效率和投研能力」。該平台7月上線公測,目前已擁有130多家機構客戶,逾萬名個人投資者。
通聯數據目前有四個主要平台,分別是通聯智能投資研究平台、通聯金融大數據服務平台、通聯多資產投資管理平台和金融移動辦公平台。
通聯智能投資研究平台包括雅典娜-智能事件研究、策略研究、智能研報三款產品,可以對基於自然語言的智能事件進行策略分析,實時跟蹤市場熱點,捕捉市場情緒。可以說,和百發100類似,其核心技術在於將互聯網非結構化數據的量化使用。
通聯金融大數據服務平台更側重於專業金融數據的分析整理。它可以提供公司基本面數據、國內外主要證券、期貨交易所的行情數據、公司公告數據、公關經濟、行業動態的結構化數據、金融新聞和輿情的非結構化數據等。
假如將上述兩個平台比作「收割機」,通聯多資產投資管理平台就是「廚房」。在這個「廚房」里,可以進行全球跨資產的投資組合管理方案、訂單管理方案、資產證券化定價分析方案等。
通聯數據可以按照主題熱點或者自定義關鍵字進行分析,構建知識圖譜,將相關的新聞和股票提取做成簡潔的分析框架。例如用戶對特斯拉感興趣,就可以通過主題熱點看到和特斯拉相關的公司,並判斷這個概念是否值得投資。「過去這個搜集過程要花費幾天時間,現在只需要幾分鍾就可以完成。」王政表示。
「通聯數據就好比一家餐館,我們把所有原料搜集來、清洗好、准備好,同時准備了一個鍋,也就是大數據存儲平台。研究員和基金經理像廚師一樣,用原料、工具去『烹制』自己的策略。」王政形容道。
大數據在平台上扮演的角色,就是尋找關聯關系。人類總是習慣首先構建因果關系,繼而去倒推和佐證。機器學習則不然,它可以在海量數據中查獲超越人類想像的關聯關系。正如維克托`邁爾-舍恩伯格在《大數據時代》中所提到的,社會需要放棄它對因果關系的渴求,而僅需關注相互關系。
例如,美國超市沃爾瑪通過大數據分析,發現颶風用品和蛋撻擺在一起可以提高銷量,並由此創造了頗大的經濟效益。如果沒有大數據技術,誰能將這毫無關聯的兩件商品聯系在一起?
通聯數據通過機器學習,也能找到傳統量化策略無法發現的市場聯系。其中包括各家公司之間的資本關系、產品關系、競爭關系、上下游關系,也包括人與人之間的關系,例如管理團隊和其他公司有沒有關聯,是否牽扯合作等。
未來量化研究員是否將成為一個被淘汰的職業?目前研究員的主要工作就是收集整理數據,變成投資決策,而之後這個工作將更多由機器完成。
「當初醫療科技發展時,人們也認為醫生會被淘汰,但其實並不會。同理,研究員也會一直存在,但他們會更注重深入分析和調研,初級的數據搜集可以交給機器完成。」王政表示。
但當未來大數據平台並廣泛應用後,是否會迅速擠壓套利空間?這也是一個問題。回答根據網上資料整理