A. 大數據時代應該如何投資股票
給一篇關於【如何使用大數據進行A股行業投資】的教程給你參考一下~
好的投資,首先是選好行業
紅杉資本曾經有一條著名的投資經驗,大意是:好的投資,首先是選好賽道,其次是賽道上的選手。對於每天活躍於資本市場上的投資者而言,賽道所指的正是你正在投資、或者將要投資的那家公司它所在的行業,更直接的說,你投資於什麼行業,投資於這個行業的哪家公司,決定了你最終能獲得什麼樣的收益表現。
那麼,紅杉資本的這條投資經驗是否適用於A股市場,並給我們帶來可觀的投資收益呢?本文試圖通過量化分析和交易回測來驗證這一投資模式是否真正有效,所採用的數據取自於聚寬數據出品的JQData本地量化金融數據,通過梳理出自2010年以來A股市場上不同行業的發展情況,進一步構建出一個優質行業龍頭組合,觀察其從2015年股災至今的收益表現。最終發現,這樣一個優質行業的龍頭組合,從股災至今大幅跑贏了上證指數和滬深300指數高達30%的以上的收益率,可以說是超乎預期的。以下是具體分析過程。
2010 ~ 2017 滬深A股各行業量化分析
在開始各行業的量化分析之前,我們需要先弄清楚兩個問題:
第一,A股市場上都有哪些行業;
第二,各行業自2010年以來的營收、凈利潤增速表現如何?
第一個問題:
很好回答,我們使用JQData提供的獲取行業成分股的方法,輸入get_instries(name='sw_l1')
得到申萬一級行業分類結果如下:它們分別是:【農林牧漁、採掘、化工、鋼鐵、有色金屬、電子、家用電器、食品飲料、紡織服裝、輕工製造、醫葯生物、公用事業、交通運輸、房地產、商業貿易、休閑服務、綜合、建築材料、建築裝飾、電器設備、國防軍工、計算機、傳媒、通信、銀行、非銀金融、汽車、機械設備】共計28個行業。
第二個問題:
要知道各行業自2010年以來的營收、凈利潤增速表現,我們首先需要知道各行業在各個年度都有哪些成分股,然後加總該行業在該年度各成分股的總營收和凈利潤,就能得到整個行業在該年度的總營收和總利潤了。這部分數據JQData也為我們提供了方便的介面:通過調用get_instry_stocks(instry_code=『行業編碼』, date=『統計日期』),獲取申萬一級行業指定日期下的行業成分股列表,然後再調用查詢財務的數據介面:get_fundamentals(query_object=『query_object』, statDate=year)來獲取各個成分股在對應年度的總營收和凈利潤,最後通過加總得到整個行業的總營收和總利潤。這里為了避免非經常性損益的影響,我們對凈利潤指標最終選取的扣除非經常性損益的凈利潤數據。
我們已經獲取到想要的行業數據了。接下來,我們需要進一步分析,這些行業都有什麼樣的增長特徵。
我們發現,在28個申萬一級行業中,有18個行業自2010年以來在總營收方面保持了持續穩定的增長。它們分別是:【農林牧漁,電子,食品飲料,紡織服裝,輕工製造,醫葯生物,公用事業,交通運輸,房地產,休閑服務,建築裝飾,電氣設備,國防軍工,計算機,傳媒,通信,銀行,汽車】;其他行業在該時間范圍內出現了不同程度的負增長。
那麼,自2010年以來凈利潤保持持續增長的行業又會是哪些呢?結果是只有5個行業保持了基業長青,他們分別是醫葯生物,建築裝飾,電氣設備,銀行和汽車。(註:由於申萬行業在2014年發生過一次大的調整,建築裝飾,電氣設備,銀行和汽車實際從2014年才開始統計。)
從上面的分析結果可以看到,真正能夠保持持續穩定增長的行業並不多,如果以扣非凈利潤為標准,那麼只有醫葯生物,建築裝飾,電氣設備,銀行和汽車這五個行業可以稱之為優質行業,實際投資中,就可以只從這幾個行業中去投資。這樣做的目的是,一方面,能夠從行業大格局層面避免行業下行的風險,繞開一個可能出現負增長的的行業,從而降低投資的風險;另一方面,也大大縮短了我們的投資范圍,讓投資者能夠專注於從真正好的行業去挑選公司進行投資。
選好行業之後,下面進入選公司環節。我們知道,即便是一個好的行業也仍然存在表現不好的公司,那麼什麼是好的公司呢,本文試圖從營業收入規模和利潤規模和來考察以上五個基業長青的行業,從它們中去篩選公司作為投資標的。
1、按營業收入規模構建的行業龍頭投資組合
首先,我們按照營業收入規模,篩選出以上5個行業【醫葯生物,建築裝飾,電氣設備,銀行和汽車】從2010年至今的行業龍頭如下表所示:
通過以上行業分析和投資組合的歷史回測可以看到:
先選行業,再選公司,即使是從2015年股災期間開始投資,至2018年5月1號,仍然能夠獲得相對理想的收益,可以說,紅杉資本的賽道投資法則對於一般投資者還是比較靠譜的。
在構建行業龍頭投資組合時,凈利潤指標顯著優於營業收入指標,獲得的投資收益能夠更大的跑贏全市場收益率
市場是不斷波動的,如果一個投資者從股災期間開始投資,那麼即使他買入了上述優質行業的龍頭組合,在近3年也只能獲得12%左右的累計收益;而如果從2016年5月3日開始投資,那麼至2018年5月2日,2年時間就能獲得超過50%以上的收益了。所以,在投資過程中選擇時機也非常重要~
B. 利用大數據人工智慧投資股票的話,能代替投顧嗎
現在有越來越多的人都想進入到股票市場進行投資,的確股票是一種高收益的投資,但是很多人進入到股票市場都會血本無歸,就是因為他們本身對於股票市場沒有足夠的認識。利用大數據人工智慧投資股票,這樣能夠代替投資顧問嗎?
大家要知道投資顧問在中國市場發展的時間是非常長的,現在科技的發展速度也已經越來越快了,為什麼投資顧問無法被機器人代替這也是有一定的原因的。這是因為基金或者是股票投資本身就是一種動態的過程,在這個過程之中,需要當事人跟投資顧問進行實時的交流,這樣才能夠去滿足客戶的需求,但是機器人卻不能做到這一點。
C. 大數據技術在金融行業有哪些應用前景
大數據金融市場前景廣闊,深度開發大數據金融工具,或將重構整個金融行業。預計未來5到10年,金融大數據產業將迎來黃金增長期,大數據也將成為助推「大眾創業、萬眾創新」浪潮的有力抓手。
據《大數據金融行業市場前瞻與投資分析報告》數據顯示,2016年我國大數據金融市場規模為15.84億元,隨著政策逐步實施與落地,以大數據為核心手段、核心驅動力的產業金融,將邁入時代發展正軌成為主流趨勢,預計2018年中國金融大數據應用市場會突破100億元,金融業開始進入了大數據時代快車道。
大數據金融作為一個綜合性的概念,在未來的發展中,企業坐擁數據將不再局限於單一業務,第三方支付、信息化金融機構以及互聯網金融門戶都將融入到大數據金融服務平台中,大數據金融服務將在各家機構各顯神通的基礎上,實現多元業務的融合。
伴隨互聯網金融縱深發展,大數據優勢越加凸顯。作為互聯網金融創新的驅動力,大數據金融帶來的方式革新,未來走向精細化和專業化。今後大數據金融行業的努力方向,應該是以完備的大數據為基礎,基於用戶需求提供智能化一站式產品購買及定製化服務,以及數據挖掘、數據整合、數據產品、數據應用及解決方案等。
D. 大數據發展前景如何
隨著信息技術和人類生產生活交匯融合,全球數據呈現爆發增長、海量集聚的特點。無論是國家、企業還是社會公眾,都越來越認識到數據的價值。因此,近年來,各地紛紛成立大數據發展局,企業紛紛推動數據資產治理,大數據輻射的行業也從傳統的電信、金融逐漸擴展到工業、醫療、教育等。一時間,彷彿各行各業都在談大數據,人人都在談大數據。但也有聲音說大數據迎來了「七年之癢」,面對大數據熱潮也需要一些「冷思考」。我國大數據究竟發展得如何?未來我國大數據發展還有哪些機遇和挑戰?
1、大數據產業進展顯著
過去幾年,大數據理念已經深入人心,「用數據說話」已經成為所有人的共識,數據也成了堪比石油、黃金、鑽石的戰略資源。五年來,我國大數據產業政策日漸完善,技術、應用和產業都取得了非常明顯的進展。
在政策方面,我國從中央到地方的大數據政策體系已經基本完善,目前已經進入落地實施階段。自從2014年「大數據」這個詞寫入政府工作報告以來,我國大數據發展的政策環境掀開了全新的篇章。在頂層設計上,國務院《促進大數據發展行動綱要》對政務數據共享開放、產業發展和安全三方面做了總體部署。《政務信息資源共享管理暫行辦法》《大數據產業發展規劃(2016-2020)》等文件也都已經出台。十九大報告中提出「推動大數據與實體經濟深度融合」,「十三五」規劃中提出「實施國家大數據戰略」。衛健、農業、環保、檢察、稅務等部門還出台了領域大數據發展的具體政策。截至2019年初,所有省級行政區都發布了大數據相關的發展規劃,十幾個省市設立了大數據管理局,8個國家大數據綜合試驗區、11個國家工程實驗室啟動建設。可以說,大數據的政策體系已經基本搭建完成,目前已經紛紛進入落地實施甚至評估檢查階段。
在技術方面,我國大數據技術發展屬於「全球第一梯隊」,但國產核心技術能力嚴重不足。我國獨有的大體量應用場景和多類型實踐模式,促進了大數據領域技術創新速度和能力水平,處於國際領先地位。在技術全面性上,我國平台類、管理類、應用類技術均具有大面積落地案例和研究;在應用規模方面,我國已經完成大數據領域的最大集群公開能力測試,達到了萬台節點;在效率能力方面,我國大數據產品在國際大數據技術能力競爭平台上也取得了前幾名的好成績;在知識產權方面,2018年我國大數據領域專利公開量約佔全球的40%,位居世界第二。但我國大數據技術大部分為基於國外開源產品的二次改造,核心技術能力亟待加強。例如,目前國內主流大數據平台技術中,自研比例不超過10%。
在產業方面,我國大數據產業多年來保持平穩快速增長,但面臨提質增效的關鍵轉型。2018年,我國大數據產業延續多年來的增速,繼續保持相對高速的增長。根據中國信息通信研究院的測算,2018年我國大數據產業整體規模有望達到5400億元,同比增長15%。然而,綜合國內外環境、新興技術發展等多種因素,大數據產業的增速出現了下滑。我國的大數據產業也面臨著從高速發展向高質量發展的關鍵轉型期。
在應用方面,大數據的行業應用更加廣泛,正加速滲透到經濟社會的方方面面。隨著大數據工具的門檻降低以及企業數據意識的不斷提升,越來越多的行業開始嘗到大數據帶來的「甜頭」。無論是從新增企業數量、融資規模還是應用熱度來說,與大數據結合緊密的行業正在從傳統的電信業、金融業擴展到政務、健康醫療、工業、交通物流、能源行業、教育文化等,行業應用「脫虛向實」趨勢明顯,與實體經濟的融合更加深入。
2、產業的五大困局
雖然我國大數據總體發展形勢良好,也面臨難得的發展機遇,但仍然存在一些困難和問題。
一是,涉及核心技術的產業發展薄弱,未能有效提升我國核心技術競爭力。核心技術的影響力在大數據產業有著極高的重要性。由於大數據企業在完成產品開發後,可以近乎零成本無限制的復制,因此擁有核心技術的大企業,很容易將技術優勢轉化為市場優勢,即憑借具體的信息產品贏得海量用戶獲得壟斷地位。當前,從大數據技術與產品的供給側看,我國雖然在局部技術實現了單點突破,但大數據領域系統性、平台級核心技術創新仍不多見。大數據處理工具都是「他山之石」,大部分企業用的都是國外的數據採集、數據處理、數據分析、數據可視化技術,自主核心技術突破還有待時日。尤其是開源產品的技術標准方面,我國的影響力尚亟待提升。
二是,數據孤島和壁壘降低了大數據產業資源配置效率。大數據產業發展必須實現數據信息的自由流動和共享,如果數據不開放、不共享,數據整合就不能實現,數據價值也會大大降低。無論是政府數據、互聯網數據還是其他數據,數據擁有者往往不願對其進行開放流通。受制於前期信息基礎設施建設,目前我國政府數據往往還存在著諸多「數據孤島」和「數據煙囪」,數據價值難以發揮。
三是,數據安全管理薄弱增加了大數據產業的發展風險。大數據技術為經濟社會發展帶來創新活力的同時,也使數據安全、個人信息保護乃至大數據平台安全等面臨新威脅與新風險。海量多源數據在大數據平台匯聚,來自多個用戶的數據可能存儲在同一個數據池中,並分別被不同用戶使用,極易引發數據泄露風險。利用大數據技術對海量數據(21.90 -5.19%,診股)進行挖掘分析所得結果可能包含涉及國家經濟社會等各方面的敏感信息,需要對分析結果的共享和披露加強安全管理。
四是,產業壟斷與惡性競爭現象頻發,「劣幣驅逐良幣」現象明顯。由於資源型產業門檻低、利潤高,新興的大數據企業往往首先將目光盯在獲取數據資源上面。大量依託數據資源優勢的企業誕生,為大數據產業帶來了低附加值的壟斷經濟模式,使得依靠技術壁壘打江山的企業不得不面對殘酷的市場競爭,放緩了技術研發的步伐。同時,數據壟斷問題也愈發明顯。少數互聯網巨頭企業擁有巨大數據,不但對產業發展不利,甚至存在巨大的數據聚集隱患。
五是,各地發展同質化嚴重,普遍存在重存儲輕應用的現象。由於缺乏統一的大數據產業分類統計體系和產業運行監測手段,各地大數據產業的定位相似,同質化競爭加劇。而盲目的重復建設,更是可能導致大數據產業過剩。同時,由於部分地區信息化發展程度有限,大數據應用場景不夠豐富,更是以數據中心等大數據存儲設施的建設作為發展大數據產業的關鍵,且規模巨大,目標動輒以百萬台計,後期若無法有效利用,將造成巨大的資源浪費。
E. 大數據技術在金融行業的典型應用
大數據技術在金融行業的典型應用
近年來,大數據技術結合雲計算、區塊鏈、人工智慧等新技術向金融領域滲透融合,釋放出裂變式的創新活力和應用潛能,為金融行業包括財務公司帶來巨大的機遇。
近年來,我國金融科技快速發展,在多個領域已經走在世界前列。大數據、人工智慧、雲計算、移動互聯網等技術與金融業務深度融合,大大推動了我國金融業轉型升級,助力金融更好地服務實體經濟,有效促進了金融業整體發展。在這一發展過程中,又以大數據技術發展最為成熟、應用最為廣泛。從發展特點和趨勢來看,「金融雲」快速建設落地奠定了金融大數據的應用基礎,金融數據與其他跨領域數據的融合應用不斷強化,人工智慧正在成為金融大數據應用的新方向,金融行業數據的整合、共享和開放正在成為趨勢,給金融行業帶來了新的發展機遇和巨大的發展動力。
大數據在金融行業的典型應用場景
大數據涉及的行業過於廣泛,除金融外,還包括政治、教育、傳媒、醫學、商業、工農業、互聯網等多個方面,各行業對大數據的定義目前尚未統一。大數據的特點可歸納為「4V」。
第一,數據體量大(Volume), 海量性也許是與大數據最相關的特徵。
第二,數據類型繁多(Variety),大數據既包括以事務為代表的傳統結構化數據,還包括以網頁為代表的半結構化數據和以視頻、語音信息為代表的非結構化數據。
第三,價值密度低(Value),大數據的體量巨大,但數據中的價值密度卻很低。比如幾個小時甚至幾天的監控視頻中,有價值的線索或許只有幾秒鍾。
第四,處理速度快(Velocity),大數據要求快速處理,時效性強,要進行實時或准實時的處理。
金融行業一直較為重視大數據技術的發展。相比常規商業分析手段,大數據可以使業務決策具有前瞻性, 讓企業戰略的制定過程更加理性化,實現生產資源優化分配,依據市場變化迅速調整業務策略,提高用戶體驗以及資金周轉率,降低庫存積壓的風險,從而獲取更高的利潤。
當前,大數據在金融行業典型的應用場景有以下幾個方面:
在銀行業的應用主要表現在兩個方面:一是信貸風險評估。以往銀行對企業客戶的違約風險評估多基於過往的信貸數據和交易數據等靜態數據,內外部數據資源整合後的大數據可提供前瞻性預測。二是供應鏈金融。利用大數據技術,銀行可以根據企業之間的投資、控股、借貸、擔保及股東和法人之間的關系,形成企業之間的關系圖譜,利於企業分析及風險控制。
在證券行業的應用主要表現為:
一是股市行情預測。大數據可以有效拓寬證券企業量化投資數據維度, 幫助企業更精準地了解市場行情,通過構建更多元的量化因子,投研模型會更加完善。
二是股價預測。大數據技術通過收集並分析社交網路如微博、朋友圈、專業論壇等渠道上的結構化和非結構化數據,形成市場主觀判斷因素和投資者情緒打分,從而量化股價中人為因素的變化預期。
三是智能投資顧問。智能投資顧問業務提供線上投資顧問服務,其基於客戶的風險偏好、交易行為等個性化數據,依靠大數據量化模型,為客戶提供低門檻、低費率的個性化財富管理方案。
在互聯網金融行業的應用,一是精準營銷。大數據通過用戶多維度畫像,對客戶偏好進行分類篩選,從而達到精準營銷的目的。二是消費信貸。基於大數據的自動評分模型、自動審批系統和催收系統可降低消費信貸業務違約風險。
金融大數據的典型案例分析
為實時接收電子渠道交易數據,整合銀行內系統業務數據。中國交通銀行通過規則欲實現快速建模、實時告警與在線智能監控報表等功能,以達到實時接收官網業務數據,整合客戶信息、設備畫像、位置信息、官網交易日誌、瀏覽記錄等數據的目的。
該系統通過為交通銀行卡中心構建反作弊模型、實時計算、實時決策系統,幫助擁有海量歷史數據,日均增長超過兩千萬條日誌流水的銀行卡中心,形成電子渠道實時反欺詐交易監控能力。利用分布式實時數據採集技術和實時決策引擎,幫助信用卡中心高效整合多系統業務數據,處理海量高並發線上行為數據,識別惡意用戶和欺詐行為,並實時預警和處置;通過引入機器學習框架,對少量數據進行分析、挖掘構建並周期性更新反欺詐規則和反欺詐模型。
系統上線後,該銀行迅速監控電子渠道產生的虛假賬號、偽裝賬號、異常登錄、頻繁登錄等新型風險和欺詐行為;系統穩定運行,日均處理逾兩千萬條日誌流水、實時識別出近萬筆風險行為並進行預警。數據接入、計算報警、案件調查的整體處理時間從數小時降低至秒級,監測時效提升近3000倍,上線3個月已幫助卡中心挽回數百萬元的風險損失。
網路的搜索技術正在全面注入網路金融。網路金融使用的梯度增強決策樹演算法可以分析大數據高維特點, 在知識分析、匯總、聚合、提煉等多個方面有其獨到之處,其深度學習能力利用數據挖掘演算法能夠較好地解決大數據價值密度低等問題。網路「磐石」系統基於每日100億次搜索行為,通過200多個維度為8.6億賬號精確畫像,高效劃分人群,能夠為銀行、互聯網金融機構提供身份識別、反欺詐、信息檢驗、信用分級等服務。該系統累計為網路內部信貸業務攔截數十萬欺詐用戶,攔截數十億不良資產、減少數百萬人力成本,累計合作近500 家社會金融機構,幫助其提升了整體風險防控水平。
金融大數據應用面臨的挑戰及對策
大數據技術為金融行業帶來了裂變式的創新活力,其應用潛力有目共睹,但在數據應用管理、業務場景融合、標准統一、頂層設計等方面存在的瓶頸也有待突破。
一是數據資產管理水平仍待提高。主要體現在數據質量不高、獲取方式單一、數據系統分散等方面。
二是應用技術和業務探索仍需突破。主要體現在金融機構原有的數據系統架構相對復雜,涉及的系統平台和供應商較多,實現大數據應用的技術改造難度很大。同時,金融行業的大數據分析應用模型仍處於起步階段,成熟案例和解決方案仍相對較少,需要投入大量的時間和成本進行調研和試錯。系統誤判率相對較高。
三是行業標准和安全規范仍待完善。金融大數據缺乏統一的存儲管理標准和互通共享平台,對個人隱私的保護上還未形成可信的安全機制。
四是頂層設計和扶持政策還需強化。體現在金融機構間的數據壁壘較為明顯,各自為戰問題突出,缺乏有效的整合協同。同時,行業應用缺乏整體性規劃,分散、臨時、應激等特點突出,信息價值開發仍有較大潛力。
以上問題,一方面需要國家出台促進金融大數據發展的產業規劃和扶持政策,同時,也需要行業分階段推動金融數據開放、共享和統一平台建設,強化行業標准和安全規范。只有這樣,大數據技術才能在金融行業中穩步應用發展,不斷推動金融行業的發展提升。
F. 大數據技術在量化交易的應用上有哪些
投資決策、風險管理等場景,重塑傳統金融服務等方面都有應用。
隨著大數據技術的廣泛普及和發展成熟,金融大數據應用已經成為行業熱點趨勢,在交易欺詐識別、精準營銷、黑產防範、消費信貸、信貸風險評估。
供應鏈金融、股市行情預測、股價預測、智能投顧、騙保識別、風險定價等涉及銀行、證券、保險等多領域的具體業務中,得到廣泛應用。對於大數據的應用分析能力,正在成為金融機構未來發展的核心競爭要素。
股市行情預測:
大數據可以有效拓寬證券企業量化投資數據維度,幫助企業更精準地了解市場行情。隨著大數據廣泛應用、數據規模爆發式增長以及數據分析及處理能力顯著提升,量化投資將獲取更廣闊的數據資源,構建更多元的量化因子,投研模型更加完善。
證券企業應用大數據對海量個人投資者樣本進行持續性跟蹤監測,對賬本投資收益率、持倉率、資金流動情況等一系列指標進行統計、加權匯總。
了解個人投資者交易行為的變化、投資信心的狀態與發展趨勢、對市場的預期以及當前的風險偏好等,對市場行情進行預測。
G. 如何用大數據炒股
我們如今生活在一個數據爆炸的世界裡。網路每天響應超過60億次的搜索請求,日處理數據超過100PB,相當於6000多座中國國家圖書館的書籍信息量總和。新浪微博每天都會發布上億條微博。在荒無人煙的郊外,暗藏著無數大公司的信息存儲中心,24小時夜以繼日地運轉著。
克托·邁爾-舍恩伯格在《大數據時代》一書中認為,大數據的核心就是預測,即只要數據豐富到一定程度,就可預測事情發生的可能性。例如,「從一個人亂穿馬路時行進的軌跡和速度來看他能及時穿過馬路的可能性」,或者通過一個人穿過馬路的速度,預測車子何時應該減速從而讓他及時穿過馬路。
那麼,如果把這種預測能力應用在股票投資上,又會如何?
目前,美國已經有許多對沖基金採用大數據技術進行投資,並且收獲甚豐。中國的中證廣發網路百發100指數基金(下稱百發100),上線四個多月以來已上漲68%。
和傳統量化投資類似,大數據投資也是依靠模型,但模型里的數據變數幾何倍地增加了,在原有的金融結構化數據基礎上,增加了社交言論、地理信息、衛星監測等非結構化數據,並且將這些非結構化數據進行量化,從而讓模型可以吸收。
由於大數據模型對成本要求極高,業內人士認為,大數據將成為共享平台化的服務,數據和技術相當於食材和鍋,基金經理和分析師可以通過平台製作自己的策略。
量化非結構數據
不要小看大數據的本領,正是這項剛剛興起的技術已經創造了無數「未卜先知」的奇跡。
2014年,網路用大數據技術預測命中了全國18卷中12卷高考作文題目,被網友稱為「神預測」。網路公司人士表示,在這個大數據池中,包含互聯網積累的用戶數據、歷年的命題數據以及教育機構對出題方向作出的判斷。
在2014年巴西世界盃比賽中,Google亦通過大數據技術成功預測了16強和8強名單。
從當年英格蘭報社的信鴿、費城股票交易所的信號燈到報紙電話,再到如今的互聯網、雲計算、大數據,前沿技術迅速在投資領域落地。在股票策略中,大數據日益嶄露頭角。
做股票投資策略,需要的大數據可以分為結構化數據和非結構化數據。結構化數據,簡單說就是「一堆數字」,通常包括傳統量化分析中常用的CPI、PMI、市值、交易量等專業信息;非結構化數據就是社交文字、地理位置、用戶行為等「還沒有進行量化的信息」。
量化非結構化就是用深度模型替代簡單線性模型的過程,其中所涉及的技術包括自然語言處理、語音識別、圖像識別等。
金融大數據平台-通聯數據CEO王政表示,通聯數據採用的非結構化數據可以分為三類:第一類和人相關,包括社交言論、消費、去過的地點等;第二類與物相關,如通過正在行駛的船隻和貨車判斷物聯網情況;第三類則是衛星監測的環境信息,包括汽車流、港口裝載量、新的建築開工等情況。
衛星監測信息在美國已被投入使用,2014年Google斥資5億美元收購了衛星公司Skybox,從而可以獲得實施衛星監測信息。
結構化和非結構化數據也常常相互轉化。「結構化和非結構化數據可以形象理解成把所有數據裝在一個籃子里,根據應用策略不同相互轉化。例如,在搜索頻率調查中,用戶搜索就是結構化數據;在金融策略分析中,用戶搜索就是非結構化數據。」網路公司人士表示。
華爾街拿著豐厚薪水的分析師們還不知道,自己的僱主已經將大量資本投向了取代自己的機器。
2014年11月23日,高盛向Kensho公司投資1500萬美元,以支持該公司的大數據平台建設。該平台很像iPhone里的Siri,可以快速整合海量數據進行分析,並且回答投資者提出的各種金融問題,例如「下月有颶風,將對美國建材板塊造成什麼影響?」
在Kensho處理的信息中,有80%是「非結構化」數據,例如政策文件、自然事件、地理環境、科技創新等。這類信息通常是電腦和模型難以消化的。因此,Kensho的CEO Daniel Nadler認為,華爾街過去是基於20%的信息做出100%的決策。
既然說到高盛,順便提一下,這家華爾街老牌投行如今對大數據可謂青睞有加。除了Kensho,高盛還和Fortress信貸集團在兩年前投資了8000萬美元給小額融資平台On Deck Capital。這家公司的核心競爭力也是大數據,它利用大數據對中小企業進行分析,從而選出值得投資的企業並以很快的速度為之提供短期貸款。
捕捉市場情緒
上述諸多非結構化數據,歸根結底是為了獲得一個信息:市場情緒。
在采訪中,2013年諾貝爾經濟學獎得主羅伯特•席勒的觀點被無數采訪對象引述。可以說,大數據策略投資的創業者們無一不是席勒的信奉者。
席勒於上世紀80年代設計的投資模型至今仍被業內稱道。在他的模型中,主要參考三個變數:投資項目計劃的現金流、公司資本的估算成本、股票市場對投資的反應(市場情緒)。他認為,市場本身帶有主觀判斷因素,投資者情緒會影響投資行為,而投資行為直接影響資產價格。
然而,在大數據技術誕生之前,市場情緒始終無法進行量化。
回顧人類股票投資發展史,其實就是將影響股價的因子不斷量化的過程。
上世紀70年代以前,股票投資是一種定性的分析,沒有數據應用,而是一門主觀的藝術。隨著電腦的普及,很多人開始研究驅動股價變化的規律,把傳統基本面研究方法用模型代替,市盈率、市凈率的概念誕生,量化投資由此興起。
量化投資技術的興起也帶動了一批華爾街大鱷的誕生。例如,巴克萊全球投資者(BGI)在上世紀70年代就以其超越同行的電腦模型成為全球最大的基金管理公司;進入80年代,另一家基金公司文藝復興(Renaissance)年均回報率在扣除管理費和投資收益分成等費用後仍高達34%,堪稱當時最佳的對沖基金,之後十多年該基金資產亦十分穩定。
「從主觀判斷到量化投資,是從藝術轉為科學的過程。」王政表示,上世紀70年代以前一個基本面研究員只能關注20隻到50隻股票,覆蓋面很有限。有了量化模型就可以覆蓋所有股票,這就是一個大的飛躍。此外,隨著計算機處理能力的發展,信息的用量也有一個飛躍變化。過去看三個指標就夠了,現在看的指標越來越多,做出的預測越來越准確。
隨著21世紀的到來,量化投資又遇到了新的瓶頸,就是同質化競爭。各家機構的量化模型越來越趨同,導致投資結果同漲同跌。「能否在看到報表數據之前,用更大的數據尋找規律?」這是大數據策略創業者們試圖解決的問題。
於是,量化投資的多米諾骨牌終於觸碰到了席勒理論的第三層變數——市場情緒。
計算機通過分析新聞、研究報告、社交信息、搜索行為等,藉助自然語言處理方法,提取有用的信息;而藉助機器學習智能分析,過去量化投資只能覆蓋幾十個策略,大數據投資則可以覆蓋成千上萬個策略。
基於互聯網搜索數據和社交行為的經濟預測研究,已逐漸成為一個新的學術熱點,並在經濟、社會以及健康等領域的研究中取得了一定成果。在資本市場應用上,研究發現搜索數據可有效預測未來股市活躍度(以交易量指標衡量)及股價走勢的變化。
海外就有學術研究指出,公司的名稱或者相關關鍵詞的搜索量,與該公司的股票交易量正相關。德國科學家Tobias Preis就進行了如此研究:Tobias利用谷歌搜索引擎和谷歌趨勢(Google Trends),以美國標普500指數的500隻股票為其樣本,以2004年至2010年為觀察區間,發現谷歌趨勢數據的公司名稱搜索量和對應股票的交易量,在每周一次的時間尺度上有高度關聯性。也就是說,當某個公司名稱在谷歌的搜索量活動增加時,無論股票的價格是上漲或者下跌,股票成交量與搜索量增加;反之亦然,搜索量下降,股票成交量下降。以標普500指數的樣本股為基礎,依據上述策略構建的模擬投資組合在六年的時間內獲得了高達329%的累計收益。
在美國市場上,還有多家私募對沖基金利用Twitter和Facebook的社交數據作為反映投資者情緒和市場趨勢的因子,構建對沖投資策略。利用互聯網大數據進行投資策略和工具的開發已經成為世界金融投資領域的新熱點。
保羅·霍丁管理的對沖基金Derwent成立於2011年5月,注冊在開曼群島,初始規模約為4000萬美元, 2013年投資收益高達23.77%。該基金的投資標的包括流動性較好的股票及股票指數產品。
通聯數據董事長肖風在《投資革命》中寫道,Derwent的投資策略是通過實時跟蹤Twitter用戶的情緒,以此感知市場參與者的「貪婪與恐懼」,從而判斷市場漲跌來獲利。
在Derwent的網頁上可以看到這樣一句話:「用實時的社交媒體解碼暗藏的交易機會。」保羅·霍丁在基金宣傳冊中表示:「多年以來,投資者已經普遍接受一種觀點,即恐懼和貪婪是金融市場的驅動力。但是以前人們沒有技術或數據來對人類情感進行量化。這是第四維。Derwent就是要通過即時關注Twitter中的公眾情緒,指導投資。」
另一家位於美國加州的對沖基金MarketPsych與湯普森·路透合作提供了分布在119個國家不低於18864項獨立指數,比如每分鍾更新的心情狀態(包括樂觀、憂郁、快樂、害怕、生氣,甚至還包括創新、訴訟及沖突情況等),而這些指數都是通過分析Twitter的數據文本,作為股市投資的信號。
此類基金還在不斷涌現。金融危機後,幾個台灣年輕人在波士頓組建了一家名為FlyBerry的對沖基金,口號是「Modeling the World(把世界建模)」。它的投資理念全部依託大數據技術,通過監測市場輿論和行為,對投資做出秒速判斷。
關於社交媒體信息的量化應用,在股票投資之外的領域也很常見:Twitter自己也十分注重信息的開發挖掘,它與DataSift和Gnip兩家公司達成了一項出售數據訪問許可權的協議,銷售人們的想法、情緒和溝通數據,從而作為顧客的反饋意見匯總後對商業營銷活動的效果進行判斷。從事類似工作的公司還有DMetics,它通過對人們的購物行為進行分析,尋找影響消費者最終選擇的細微原因。
回到股票世界,利用社交媒體信息做投資的公司還有StockTwits。打開這家網站,首先映入眼簾的宣傳語是「看看投資者和交易員此刻正如何討論你的股票」。正如其名,這家網站相當於「股票界的Twitter」,主要面向分析師、媒體和投資者。它通過機器和人工相結合的手段,將關於股票和市場的信息整理為140字以內的短消息供用戶參考。
此外,StockTwits還整合了社交功能,並作為插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,讓人們可以輕易分享投資信息。
另一家公司Market Prophit也很有趣。這家網站的宣傳語是「從社交媒體噪音中提煉市場信號」。和StockTwits相比,Market Prophit更加註重大數據的應用。它採用了先進的語義分析法,可以將Twitter里的金融對話量化為「-1(極度看空)」到「1(極度看多)」之間的投資建議。網站還根據語義量化,每天公布前十名和後十名的股票熱度榜單。網站還設計了「熱度地圖」功能,根據投資者情緒和意見,按照不同板塊,將板塊內的個股按照顏色深淺進行標注,誰漲誰跌一目瞭然。
中國原創大數據指數
盡管大數據策略投資在美國貌似炙手可熱,但事實上,其應用尚僅限於中小型對沖基金和創業平台公司。大數據策略投資第一次被大規模應用,應歸於中國的百發100。
網路金融中心相關負責人表示,與歐美等成熟資本市場主要由理性機構投資者構成相比,東亞尤其是中國的股票類證券投資市場仍以散戶為主,因此市場受投資者情緒和宏觀政策性因素影響很大。而個人投資者行為可以更多地反映在互聯網用戶行為大數據上,從而為有效地預測市場情緒和趨勢提供了可能。這也就是中國國內公募基金在應用互聯網大數據投資方面比海外市場並不落後、甚至領先的原因。
百發100指數由網路、中證指數公司、廣發基金聯合研發推出,於2014年7月8日正式對市場發布,實盤運行以來一路上漲,漲幅超過60%。跟蹤該指數的指數基金規模上限為30億份,2014年9月17日正式獲批,10月20日發行時一度創下26小時瘋賣18億份的「神話」。
外界都知道百發100是依託大數據的指數基金,但其背後的細節鮮為人知。
百發100數據層面的分析分為兩個層面,即數據工廠的數據歸集和數據處理系統的數據分析。其中數據工廠負責大數據的收集分析,例如將來源於互聯網的非結構化數據進行指標化、產品化等數據量化過程;數據處理系統,可以在數據工廠遞交的大數據中尋找相互統計關聯,提取有效信息,最終應用於策略投資。
「其實百發100是在傳統量化投資技術上融合了基於互聯網大數據的市場走勢和投資情緒判斷。」業內人士概括道。
和傳統量化投資類似,百發100對樣本股的甄選要考慮財務因子、基本面因子和動量因子,包括凈資產收益率(ROE)、資產收益率(ROA)、每股收益增長率(EPS)、流動負債比率、企業價值倍數(EV/EBITDA)、凈利潤同比增長率、股權集中度、自由流通市值以及最近一個月的個股價格收益率和波動率等。
此外,市場走勢和投資情緒是在傳統量化策略基礎上的創新產物,也是百發100的核心競爭力。接近網路的人士稱,市場情緒因子對百發100基金起決定性作用。
網路金融中心相關負責人是羅伯特•席勒觀點的支持者。他認為,投資者行為和情緒對資產價格、市場走勢有著巨大的影響。因此「通過互聯網用戶行為大數據反映的投資市場情緒、宏觀經濟預期和走勢,成為百發100指數模型引入大數據因子的重點」。
傳統量化投資主要著眼點在於對專業化金融市場基本面和交易數據的應用。但在網路金融中心相關業務負責人看來,無論是來源於專業金融市場的結構化數據,還是來源於互聯網的非結構化數據,都是可以利用的數據資源。因此,前文所述的市場情緒數據,包括來源於互聯網的用戶行為、搜索量、市場輿情、宏觀基本面預期等等,都被網路「變廢為寶」,從而通過互聯網找到投資者參與特徵,選出投資者關注度較高的股票。
「與同期滬深300指數的表現相較,百發100更能在股票市場振盪時期、行業輪動劇烈時期、基本面不明朗時期抓住市場熱點、了解投資者情緒、抗擊投資波動風險。」網路金融中心相關負責人表示。
百發100選取的100隻樣本股更換頻率是一個月,調整時間為每月第三周的周五。
業內人士指出,百發100指數的月收益率與中證100、滬深300、中證500的相關性依次提升,說明其投資風格偏向中小盤。
但事實並非如此。從樣本股的構成來說,以某一期樣本股為例,樣本股總市值6700億元,佔A股市值4.7%。樣本股的構成上,中小板21隻,創業板4隻,其餘75隻樣本股均為大盤股。由此可見,百發100還是偏向大盤為主、反映主流市場走勢。
樣本股每個月的改變比例都不同,最極端的時候曾經有60%進行了換倉。用大數據預測熱點變化,市場熱點往往更迭很快;但同時也要考慮交易成本。兩方面考慮,網路最後測算認為一個月換一次倉位為最佳。
樣本股對百發100而言是核心機密——據說「全世界只有基金經理和指數編制機構負責人兩個人知道」——都是由機器決定後,基金經理分配給不同的交易員建倉買入。基金經理也沒有改變樣本股的權利。
展望未來,網路金融中心相關負責人躊躇滿志,「百發100指數及基金的推出,只是我們的開端和嘗試,未來將形成多樣化、系列投資產品。」
除了百發100,目前市場上打著大數據旗幟的基金還有2014年9月推出的南方-新浪I100和I300指數基金。
南方-新浪I100和I300是由南方基金、新浪財經和深圳證券信息公司三方聯合編制的。和百發100類似,也是按照財務因子和市場情緒因子進行模型打分,按照分值將前100和前300名股票構成樣本股。推出至今,這兩個指數基金分別上漲了10%左右。
正如百發100的市場情緒因子來自網路,南方-新浪I100和I300的市場情緒因子全部來自新浪平台。其中包括用戶在新浪財經對行情的訪問熱度、對股票的搜索熱度;用戶在新浪財經對股票相關新聞的瀏覽熱度;股票相關微博的多空分析數據等。
此外,阿里巴巴旗下的天弘基金也有意在大數據策略上做文章。據了解,天弘基金將和阿里巴巴合作,推出大數據基金產品,最早將於2015年初問世。
天弘基金機構產品部總經理劉燕曾對媒體表示,「在傳統的調研上,大數據將貢獻於基礎資產的研究,而以往過度依賴線下研究報告。大數據將視野拓展至了線上的數據分析,給基金經理選股帶來新的邏輯。」
在BAT三巨頭中,騰訊其實是最早推出指數基金的。騰訊與中證指數公司、濟安金信公司合作開發的「中證騰安價值100指數」早在2013年5月就發布了,號稱是國內第一家由互聯網媒體與專業機構編制發布的A股指數。不過,業內人士表示,有關指數並沒有真正應用大數據技術。雖然騰訊旗下的微信是目前最熱的社交平台,蘊藏了大量的社交數據,但騰訊未來怎麼開發,目前還並不清晰。
大數據投資平台化
中歐商學院副教授陳威如在其《平台戰略》一書中提到,21世紀將成為一道分水嶺,人類商業行為將全面普及平台模式,大數據金融也不例外。
然而,由於大數據模型對成本要求極高,就好比不可能每家公司都搭建自己的雲計算系統一樣,讓每家機構自己建設大數據模型,從數據來源和處理技術方面看都是不現實的。業內人士認為,大數據未來必將成為平台化的服務。
目前,阿里、網路等企業都表示下一步方向是平台化。
螞蟻金服所致力搭建的平台,一方麵包括招財寶一類的金融產品平台,另一方麵包括雲計算、大數據服務平台。螞蟻金服人士說,「我們很清楚自己的優勢不是金融,而是包括電商、雲計算、大數據等技術。螞蟻金服希望用這些技術搭建一個基礎平台,把這些能力開放出去,供金融機構使用。」
網路亦是如此。接近網路的人士稱,未來是否向平台化發展,目前還在討論中,但可以確定的是,「網路不是金融機構,目的不是發產品,百發100的意義在於打造影響力,而非經濟效益。」
當BAT還在摸索前行時,已有嗅覺靈敏者搶佔了先機,那就是通聯數據。
通聯數據股份公司(DataYes)由曾任博時基金副董事長肖風帶隊創建、萬向集團投資成立,總部位於上海,公司願景是「讓投資更容易,用金融服務雲平台提升投資管理效率和投研能力」。該平台7月上線公測,目前已擁有130多家機構客戶,逾萬名個人投資者。
通聯數據目前有四個主要平台,分別是通聯智能投資研究平台、通聯金融大數據服務平台、通聯多資產投資管理平台和金融移動辦公平台。
通聯智能投資研究平台包括雅典娜-智能事件研究、策略研究、智能研報三款產品,可以對基於自然語言的智能事件進行策略分析,實時跟蹤市場熱點,捕捉市場情緒。可以說,和百發100類似,其核心技術在於將互聯網非結構化數據的量化使用。
通聯金融大數據服務平台更側重於專業金融數據的分析整理。它可以提供公司基本面數據、國內外主要證券、期貨交易所的行情數據、公司公告數據、公關經濟、行業動態的結構化數據、金融新聞和輿情的非結構化數據等。
假如將上述兩個平台比作「收割機」,通聯多資產投資管理平台就是「廚房」。在這個「廚房」里,可以進行全球跨資產的投資組合管理方案、訂單管理方案、資產證券化定價分析方案等。
通聯數據可以按照主題熱點或者自定義關鍵字進行分析,構建知識圖譜,將相關的新聞和股票提取做成簡潔的分析框架。例如用戶對特斯拉感興趣,就可以通過主題熱點看到和特斯拉相關的公司,並判斷這個概念是否值得投資。「過去這個搜集過程要花費幾天時間,現在只需要幾分鍾就可以完成。」王政表示。
「通聯數據就好比一家餐館,我們把所有原料搜集來、清洗好、准備好,同時准備了一個鍋,也就是大數據存儲平台。研究員和基金經理像廚師一樣,用原料、工具去『烹制』自己的策略。」王政形容道。
大數據在平台上扮演的角色,就是尋找關聯關系。人類總是習慣首先構建因果關系,繼而去倒推和佐證。機器學習則不然,它可以在海量數據中查獲超越人類想像的關聯關系。正如維克托`邁爾-舍恩伯格在《大數據時代》中所提到的,社會需要放棄它對因果關系的渴求,而僅需關注相互關系。
例如,美國超市沃爾瑪通過大數據分析,發現颶風用品和蛋撻擺在一起可以提高銷量,並由此創造了頗大的經濟效益。如果沒有大數據技術,誰能將這毫無關聯的兩件商品聯系在一起?
通聯數據通過機器學習,也能找到傳統量化策略無法發現的市場聯系。其中包括各家公司之間的資本關系、產品關系、競爭關系、上下游關系,也包括人與人之間的關系,例如管理團隊和其他公司有沒有關聯,是否牽扯合作等。
未來量化研究員是否將成為一個被淘汰的職業?目前研究員的主要工作就是收集整理數據,變成投資決策,而之後這個工作將更多由機器完成。
「當初醫療科技發展時,人們也認為醫生會被淘汰,但其實並不會。同理,研究員也會一直存在,但他們會更注重深入分析和調研,初級的數據搜集可以交給機器完成。」王政表示。
但當未來大數據平台並廣泛應用後,是否會迅速擠壓套利空間?這也是一個問題。回答根據網上資料整理
H. 可以利用大數據炒股嗎
大數據可以用於股票交易,所謂大數據,就是一個新的分析概念,利用新的系統、新的工具、新的模型來挖掘大量動態的、可持續的數據,從而獲得具有洞察力和新價值的東西。大數據已經在一些金融工具中有所體現,大數據會將股票之前的數據全都發布出來,股民可以根據這只股票之前的數據來進行對比。
其實大數據只能說是個趨勢,我們可以通過打數據讓投資者能夠有一個參考性,但不能夠過度依賴大數據,畢竟著只是數據,這些數據是死的,而股市卻是千變萬化的,我們不能過度的依賴大數據得出的分析與結論,大數據也只是作為一個參考數據。世事無絕對,更何況是股票,可能上一秒還是盈利的狀態,但是下一秒就已經處於虧損了,不少人也因為炒股傾家盪產,所以這邊還是要提醒大家一下,謹慎行事,不要盲目跟風。
I. 大數據技術在金融行業有哪些應用前景
具體來說,比如說實時欺詐檢測,大數據徵信,社交媒體的輿情分析等等。就個人經驗來說,用機器學習去檢測用戶的信用記錄,監管貸款的風險,增強風險控制等方面都很有可行性。其他因為不太了解金融這里指的是什麼,如果說指商業,bus之類的,那應用前景簡直太多了。最後聽說一個CS PhD學長,被我認識的一個長輩忽悠去金融領域做量化交易模型,寫了一個模型一個小時賺數十萬,現在已經移民英國。大數據的意義是什麼。有一個觀點,就是如果我能掌握這個世界上每一個粒子的狀態,我能夠預測未來。其實萬事萬物都是有跡可循的,只不過影響因素太多,人類的認知能力有限,所以就要提煉特徵,提取主要的影響因素。
J. 大數據在哪些領域有應用前景
近年來,大數據不斷向世界的各行各業滲透,影響著我們的衣食住行。例如,網上購物時,經常會發現電子商務門戶網站向我們推薦商品,往往這類商品都是我們最近需要的。這是因為用戶上網行為軌跡的相關數據都會被搜集記錄,並通過大數據分析,使用推薦系統將用戶可能需要的物品進行推薦,從而達到精準營銷的目的。下面簡單介紹幾種大數據的應用場景。
大數據讓就醫看病更簡單。過去,對於患者的治療方案,大多數都是通過醫師的經驗來進行,優秀的醫師固然能夠為患者提供好的治療方案,但由於醫師的水平不相同,所以很難保證患者都能夠接受最佳的治療方案。
而隨著大數據在醫療行業的深度融合,大數據平台積累了海量的病例、病例報告、治癒方案、葯物報告等信息資源.所有常見的病例、既往病例等都記錄在案,醫生通過有效、連續的診療記錄,能夠給病人優質、合理的診療方案。這樣不僅提高醫生的看病效率,而且能夠降低誤診率,從而讓患者在最短的時間接受最好的治療。下面列舉大數據在醫療行業的應用,具體如下。
(1) 優化醫療方案,提供最佳治療方法。
面對數目及種類眾多的病菌、病毒,以及腫瘤細胞時,疾病的確診和治療方案的確定也是很困難的。藉助於大數據平台,可以搜集不同病人的疾病特徵、病例和治療方案,從而建立醫療行業的病人分類資料庫。如果未來基因技術發展成熟,可以根據病人的基因序列特點進行分類,建立醫療行業的病人分類資料庫。在醫生診斷病人時可以參考病人的疾病特徵、化驗報告和檢測報告,參考疾病資料庫來快速幫助病人確診,明確地定位疾病。在制訂治療方案時,醫生可以依據病人的基因特點,調取相似基因、年齡、人種、身體情況相同的有效治療方案,制訂出適合病人的治療方案,幫助更多人及時進行治療。同時這些數據也有利於醫葯行業研發出更加有效的葯物和醫療器械。
(2)有效預防預測疾病。
解決患者的疾病,最為簡單的方式就是防患於未然。通過大數據對於群眾的人體數據監控,將各自的健康數據、生命體征指標都集合在資料庫和健康檔案中。通過大數據分析應用,推動覆蓋全生命周期的預防、治療、康復和健康管理的一體化健康服務,這是未來健康服務管理的新趨勢。當然,這一點不僅需 要醫療機構加快大數據的建設,還需要群眾定期去做檢查,及時更新數據,以便通過大數據來預防和預測疾病的發生,做到早治療、早康復。當然,隨著大數據的不斷發展,以及在各個領域的應用,一些大規模的流感也能夠通過大數據實現預測。
隨著大數據技術的應用,越來越多的金融企業也開始投身到大數據應用實踐中。麥肯錫的一份研究顯示,金融業在大數據價值潛力指數中排名第一。下面列舉若干大數據在金融行業的典型應用,具體如下。
(1) 精準營銷。
銀行在互聯網的沖擊下,迫切需要掌握更多用戶信息,繼而構建用戶360立體畫像,即可對細分的客戶進行精準營銷、實時營銷等個性化智慧營銷。
(2) 風險管控。
應用大數據平台,可以統一管理金融企業內部多源異構數據和外部徵信數據,更好地完善風控體系。內部可保證數據的完整性與安全性,外部可控制用戶風險。
(3) 決策支持。
通過大數據分析方法改善經營決策,為管理層提供可靠的數據支撐,從而使經營決策更高效、敏捷、精準。
(4) 服務創新。
通過對大數據的應用,改善與客戶之間的交互、增加用戶黏性,為個人與政府提供增值服務,不斷增強金融企業業務核心競爭力。
(5) 產品創新。
通過高端數據分析和綜合化數據分享,有效對接銀行、保險、信託、基金等各類金融產品,使金融企業能夠從其他領域借鑒並創造出新的金融產品。
美國零售業曾經有這樣一個傳奇故事,某家商店將紙尿褲和啤酒並排放在一起銷售,結果紙尿褲和啤酒的銷量雙雙增長!為什麼看起來風馬牛不相及的兩種商品搭配在一起,能取到如此驚人的效果呢?後來經過分析發現,這些購買者多數是已婚男士,這些男士在為小孩購買尿不濕的同時,會同時為自己購買一些啤酒。發現這個秘密後,沃爾瑪超市就大膽地將啤酒擺放在尿不濕旁邊,這樣顧客購買的時候更方便,銷量自然也會大幅上升。
之所以講「啤酒-尿布」這個例子,其實是想告訴大家,挖掘大數據潛在的價值,是零售業競爭的核心競爭力,下面列舉若干大數據在零售業的創新應用,具體如下。
(1) 精準定位零售行業市場。
企業想進人或開拓某一區域零售行業市場,首先要進行項目評估和可行性分析,只有通過項目評估和可行性分析才能最終決定是否適合進人或者開拓這塊市場。通常需要分析這個區域流動人口是多少?消費水平怎麼樣?客戶的消費習慣是什麼?市場對產品的認知度怎麼樣?當前的市場供需情況怎麼樣等等,這些問題背後包含的海量信息構成了零售行業市場調研的大數據,對這些大數據的分析就是市場定位過程。
(2) 支撐行業收益管理。
大數據時代的來臨,為企業收益管理工作的開展提供了更加廣闊的空間。需求預測、細分市場和敏感度分析對數據需求量很大,而傳統的數據分析大多採集的是企業自身的歷史數據來進行預測和分析,容易忽視整個零售行業信息數據,因此難免使預測結果存在偏差。企業在實施收益管理過程中如果能在自有數據的基礎上,依靠一些自動化信息採集軟體來收集更多的零售行業數據,了解更多的零售行業市場信息,這將會對制訂准確的收益策略,贏得更高的收益起到推進作用。
(3) 挖掘零售行業新需求。
作為零售行業企業,如果能對網上零售行業的評論數據進行收集,建立網評大資料庫,然後再利用分詞、聚類、情感分析了解消費者的消費行為、價值取向、評論中體現的新消費需求和企業產品質量問題,以此來改進和創新產品,量化產品價值,制定合理的價格及提高服務質量,從中獲取更大的收益。