① 基於微信大數據的股票預測研究
基於微信大數據的股票預測研究
大數據是近些年來的熱門話題,無論國際上還是國內,影響很大。經濟學、政治學、社會學和許多科學門類都會發生巨大甚至是本質上的變化和發展,進而影響人類的價值體系、知識體系和生活方式。而全球經濟目前生成了史無前例的大量數據,如果把每天產生的大量數據比作神話時期的大洪水是完全正確的,這個數據洪流是我們前所未見的,他是全新的、強大的、當然,也是讓人恐慌但又極端刺激的。
而我所分享的話題,正是在互聯網環境下,如何利用大數據技術,進行股票預測的研究。–今天,我想分享我認為有意義的四點。
1.大數據下的商業預測
根據大數據,我們可以有效地進行故障、人流、流量、用電量、股票市場、疾病預防、交通、食物配送、產業供需等方面的預測。而本文我們所關心的內容是股票市場的預測。
大數據的核心是預測,預測依賴於對數據的分析。那麼分析的方法是否是基於隨機采樣的結果而設計的,這樣的分析方法是否會有誤差?
從傳統認識上,由於資源和科技的局限,如人和計算資源受限、從計算機處理能力來講無法處理全部數據來獲取人們所關注的結果。因此隨機采樣應運而生,通過所選取的個體來代表全體,如使用隨機抽取的方式來使得推論結果更科學。但既然提到了大數據,它是資源發展到一定程度、以及技術發展到一定階段產生的一個新的認識。如同電力的出現,使人類進入了一個快速發展階段,大數據也一樣,它的含義是全體樣本,從整體樣本來做推論。在本文大數據的含義是所有股票在整個社交網路上的流動信息,從數據源上講,本文沒有採用所有社交網路上的數據,只分析了微信這個最具代表性的社交媒體作為信息源。
互動數據能反映用戶情緒,搜索數據能反映用戶的關注點和意圖,在股市預測時這兩種數據哪種更具有參考價值?
我認為都有價值,互動數據反映了用戶對某一特定股票的喜好和厭惡,可以簡單描述為對該股票的操作是繼續持有還是賣出;而搜索數據則代表用戶在收集該股票信息的過程,它是關注度的概念,某隻股票搜索度高則意味著消息的影響力大。互動代表著方向,搜索代表著振幅。
我們知道這兩種數據得出的結論會有差異,您是如何平衡這兩種數據反映的情況來進行預測的?
正如上一個問題里提到的,如果是股票推薦,買進賣出等原則問題,則應該考慮互動數據,但如果已經買到手了,搜索數據可以提供一個幅度的概念,類似債券評級A級、AA級、AAA級等,供投資者參考,因為不同投資者對風險的承受度是不同的。
將股票和市場的消息整理成140字的短消息發布,是否意味著主要發布渠道是微博?現在微信公眾號很火,有沒有考慮通過這個渠道也發布消息?
事實上,信息傳播的方式很多,微信作為新媒體當然影響力不容小覷,但目前技術投入最小的還是郵件、簡訊等方式,未來會考慮使用公眾號來推送股票和市場消息。
如果在未來通過微信公眾號推送消息,那麼推送的消息會不會作為數據來源被再次採集?這會有多大的影響?
會被採集,但互聯網上的每日關於個股的信息數量會達到很大,該推送會增加推薦股票1點權重,每隻股票的權重成百上千,因此影響極小。
數據來源是微信公眾號,除了准確性的考慮之外,是否還考慮過這樣收集數據會較少觸犯個人隱私?
從法律角度來看,搜索微信或其他個人聊天記錄,是侵犯個人隱私權的,因此如果騰訊開放了這樣的介面,每個公民都可以對這樣的行為進行投訴、抗議、甚至進行法律起訴直至其改正過錯、賠償損失的。
這樣是否意味著即使存在違法的行為,其結果也是由騰訊來承擔,而我們作為數據的使用方不需要承擔任何法律責任?
在整個社會,我們作為系統技術提供方,應恪守大數據的倫理道德,遵守國家法律,如侵犯個人隱私,系統不會採集,谷歌有一句座右銘「谷歌不作惡」,本文提到的系統也一樣。
2.基於大數據進行股票推薦實驗
股票的及時度反應了微信文章所發布的時效性,及時度越高,數據價值就越大。
股票的熱度反應了當前某隻股票被關注的頻度,關注頻度越大,上漲的可能性越高。
數據的完整性:我們採用循環的方式對所有深滬兩地發行約2236隻股票(創業版除外)在微信搜索網站上的搜索結果進行保存。
數據的一致性:文件格式由負責保存數據文件的程序決定,單一的流程保障了文件的一致性。
數據的准確性:由於所分析的訂閱號文章的是由微信公共平台的公眾號所提供,在一定程度上杜絕了虛假消息對於預測系統的破壞。
數據的及時性:考慮到磁碟讀寫以及採集程序所處的網路帶寬,以及搜索引擎對於採集程序的屏蔽,程序中採集兩條信息之間間隔了5秒,因此理論上11180秒(3.1個小時)可收集完當日推薦所需要的數據。對於每個交易日,在9點-9點30分之間採集所有數據,需要7台以上的設備可達到最佳效果。本次試驗受限於試驗設備,在一台設備上,交易日每天早六時開始進行數據採集,也滿足及時性要求。
數據分析:查看三個高優先順序的股票,該股票當日的開盤價與收盤價,再與當日(2015-4-8)上證綜指進行比較,可得在收益上該演算法是優於上證綜指為樣本的整體股票的股價差收益的。
實驗結論:按照上述方式,系統每天推薦出當日股票,在開盤時進行買進,在第二個交易日進行賣出。經過一個月21個交易日(2015-3-1至2015-3-31),系統的收益為20%/月。通過微信搜索公眾號來預測市場走勢和投資情緒呈現出正相關性,因此可以作為股票甄選的因子。
3.股票預測的大數據發展趨勢
網路數據分成三種:
一是瀏覽數據,主要用於電商領域的消費者行為分析,瀏覽數據反映了用戶每一步的訪問腳步,進一步刻畫出用戶的訪問路徑,分析不同頁面的跳轉概率等。
二是搜索數據,主要指搜索引擎記錄的關鍵詞被搜索頻次的時間序列數據,能反映數億用戶的興趣、關注點、意圖。
三是互動數據,主要是微博、微信、社交網站的數據,反映用戶的傾向性和情緒因素。
2013年諾貝爾經濟學獎得主羅伯特?席勒的觀點被無數采訪對象引述。席勒於上世紀80年代設計的投資模型至今仍被業內稱道。在他的模型中,主要參考三個變數:投資項目計劃的現金流、公司資本的估算成本、股票市場對投資的反應(市場情緒)。他認為,市場本身帶有主觀判斷因素,投資者情緒會影響投資行為,而投資行為直接影響資產價格。
計算機通過分析新聞、研究報告、社交信息、搜索行為等,藉助自然語言處理方法,提取有用的信息;而藉助機器學習智能分析,過去量化投資只能覆蓋幾十個策略,大數據投資則可以覆蓋成千上萬個策略。
基於互聯網搜索數據和社交行為的經濟預測研究,已逐漸成為一個新的學術熱點,並在經濟、社會以及健康等領域的研究中取得了一定成果。在資本市場應用上,研究發現搜索數據可有效預測未來股市活躍度(以交易量指標衡量)及股價走勢的變化。
對於搜索數據:互聯網搜索行為與股票市場的關聯機理。這個研究屬於行為金融與互聯網的交叉領域,其原理是:股票量價調整是投資者行為在股票市場上的反應;與此同時,投資者行為在互聯網搜索市場也有相應地行為跡象,我們要做到是:找到互聯網搜索市場中領先於股票交易的行為指標,綜合眾多投資者的先行搜索指標,對未來的股票交易做出預判。
如同天氣預報那樣,不斷優化模型、灌入海量信息,然後給出結果。並且在處理的信息中,有80%是「非結構化」數據,例如政策文件、自然事件、地理環境、科技創新等,這類信息通常是電腦和模型難以消化的。採用了語義分析法,可以將互動數據里的金融對話量化為「-1(極度看空)」到「1(極度看多)」之間的投資建議,通過分析互動數據的數據文本,作為股市投資的信號。
4.正在發生的未來
大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的將來。
大數據在實用層面的影響很廣泛,解決了大量的日常問題。大數據更是利害攸關的,它將重塑我們的生活、工作和思維方式。在某些方面,我們面臨著一個僵局,比其他劃時代創新引起的社會信息范圍和規模急劇擴大所帶來的影響更大。我們腳下的地面在移動。過去確定無疑的事情正在受到質疑。大數據需要人們重新討論決策、命運和正義的性質。擁有知識曾意味著掌握過去,現在則意味著能夠預測未來。
大數據並不是一個充斥著演算法和機器的冰冷世界,其中仍需要人類扮演重要角色。人類獨有的弱點、錯覺、錯誤都是十分必要的,因為這些特性的另一頭牽著的是人類的創造力、直覺和天賦。這提示我們應該樂於接受類似的不準確,因為不準確正是我們之所以為人的特徵之一。就好像我們學習處理混亂數據一樣,因為這些數據服務的是更加廣大的目標。必將混亂構成了世界的本質,也構成了人腦的本職,而無論是世界的混亂還是人腦的混亂,學會接受和應用他們才能得益。
我相信,利用基礎數據、搜索數據、互動數據再進行加權計算,可以對所有股票進行大數據遴選,從而給出投資建議。我認為,我們的肉身剛剛步入大數據時代,但我們的精神還滯留在小數據、采樣思維之中,率先用理性擊碎固有思維的人,也將率先獲得大數據帶來的益處。
② 什麼是股票數據源
什麼?
③ 股票市場一級、二級、三級是怎麼分的
一級--股份公司向社會公眾發行股份但還未上市交易。 二級--發行的股份在證券交易所上市交易。 三級--退市的股票和因歷史遺留問題而未能上市交易的股票。
④ 什麼叫一級股,二級股和三級股
根據股票交易價格的高低,我國投資者直觀地將股票分為一線股、二線股和三線股。
一線股通常指股票市場上價格較高的一類股票。這些股票業績優良或具有良
好的發展前景,股價領先於其他股票。大致上,一線股等同於績優股和藍籌股。一些高成長股,如我國證券中場上的一些高科技股,由於投資者對其發展前景充滿憧憬,它們也位於一線股之列。一線股享有良好的市場聲譽,為機構投資者和廣大中小投資者所熟知。
二線股是價格中等的股票。這類股票在市場上數量最多。二線股的業績參差不齊,但從整體上看,它們的業績也同股價一樣在全體上市公司中居中游。
三線股指價格低廉的股票。這些公司大多業績下好,前景不妙,有的甚至已
經到了虧損的境地。也有少數上市公司,因為發行量太大,或者身處夕陽行業,缺乏高速增長的可能,難以塑造出好的投資概念來吸引投資者。這些公司雖然業績尚可,但股價卻徘徊不前。也被投資者視為了三線股。
⑤ 上證指數反應的是幾級市場 股票分為一級市場,二級市場
二級市場。股市指數可以說是,就是由證券交易所或金融服務機構編制的、表明股票行市變動的一種供參考的數字。
通過觀察指數,我們可以對目前各個股票市場的漲跌情況有一個直觀的了解。
股票指數的編排原理事實上還是很繁瑣的,就不在這里多加贅述了,點擊下方鏈接,教你快速看懂指數:新手小白必備的股市基礎知識大全
一、國內常見的指數有哪些?
會對股票指數的編制方法和它的性質來進行一個分類,股票指數大概有這五大類:規模指數、行業指數、主題指數、風格指數和策略指數。
這五個里,規模指數是大家最常見到的,比如說,各位都很清楚的「滬深300」指數,反映的是300家大型企業的股票交易活躍度很好,且在滬深市場中具有很好的代表性和流動性。
當然還有,「上證50 」指數也是規模指數的一種,指的是上海證券市場機具代表性的50隻股票的整體情況。
行業指數所象徵的就是某一行業目前的整體情況。舉個例子,「滬深300醫葯」就是典型的行業指數,代表滬深300中的醫葯行業股票,同時也是在反映了這個行業公司股票的整體表現。
像人工智慧、新能源汽車等這些主題的整體狀況就是通過主題指數來反映,相關指數是「科技龍頭」、「新能源車」等。
想了解更多的指數分類,可以通過下載下方的幾個炒股神器來獲取詳細的分析:炒股的九大神器免費領取(附分享碼)
二、股票指數有什麼用?
前文告訴我們,指數實際上就是選擇了市場上有代表性的股票,因此通過指數,我們可以快速了解市場整體漲跌情況,進而了解市場的熱度,甚至可以預測未來的走勢是怎麼樣的。具體則可以點擊下面的鏈接,獲取專業報告,學習分析的思路:最新行業研報免費分享
應答時間:2021-09-06,最新業務變化以文中鏈接內展示的數據為准,請點擊查看
⑥ 股票一共分幾級市場有什麼區別
分一級市場、二級市場、 三級市場、 四級市場、 場外交易市場、 二板市場。
一級市場(Primary Market)也稱為發行市場(Issuance Market),它是指公司直接或通過中介機構向投資者出售新發行的股票的市場。所謂新發行的股票包括初次發行和再發行的股票,前者是公司第一次向投資者出售的原始股,後者是在原始股的基礎上增加新的份額。
一級市場的運作過程
(一)咨詢與管理
股份有限公司採取發起設立方式設立的,注冊資本為在公司登記機關登記的全體發起人認購的股本總額。為了徹底的開放市場經濟,2014年新公司法規定:有限公司和股份公司的成立不再有首次出資和繳納期限的限制。
股份有限公司採取募集方式設立的,注冊資本為在公司登記機關登記的實收股本總額。(2014新公司法實施後,股份公司和有限公司均取消最低注冊資本的限制) 法律、行政法規對股份有限公司注冊資本的最低限額有較高規定的,從其規定。
1. 募集資金的選擇:募集資金的方式一般可分成公募(Public Placement)和私募(Private Placement)兩類。公開募集需要核審,核審分為注冊制和核准制。
注冊制:發行人在發行新證券之前,首先必須按照有關法規向證券主管機關申請注冊,它要求發行人提供關於證券發行本身以及同證券發行有關的一切信息,並要求所提供的信息具有真實性、可靠性。——關鍵在於是否所有投資者在投資之前都掌握各證券發行者公布的所有信息,以及能否根據這些信息做出正確的投資決策。
核准制:又稱特許制,是發行者在發行新證券之前,不僅要公開有關真實情況,而且必須合乎公司法中的若干實質條件,如發行者所經營事業的性質、管理人員的資格、資本結構是否健全、發行者是否具備償債能力等,證券主管機關有權否決不符合條件的申請。—主管機關有權直接干預發行行為。
2. 選定作為承銷商的投資銀行。
3. 准備招股說明書。
4. 發行定價。
(二)認購與銷售
具體方式通常有以下幾種:1.包銷2.代銷3.備用包銷
二級市場(Secondary Market)也稱股票交易市場,是投資者之間買賣已發行股票的場所。這一市場為股票創造流動性,即能夠迅速脫手換取現值。
二級市場通常可分為有組織的證券交易所和場外交易市場,但也出現了具有混合特型的第三市場(The Third Market)和第四市場(The Fourth Market)。
第三市場是指原來在證交所上市的股票移到以場外進行交易而形成的市場,換言之,第三市場交易是既在證交所上市又在場外市場交易的股票,以區別於一般含義的櫃台交易。
第四市場指大機構(和富有的個人)繞開通常的經紀人,彼此之間利用電子通信網路(Electronic Communication Networks,ECNs)直接進行的證券交易。
場外交易是相對於證券交易所交易而言的,凡是在證券交易所之外的股票交易活動都可稱作場外交易。由於這種交易起先主要是在各證券商的櫃台上進行的,因而也稱為櫃台交易(OTC,Over -The-Counter);
場外交易市場與證交所相比,沒有固定的集中的場所,而是分散於各地,規模有大有小由自營商(Dealers)來組織交易;場外交易市場無法實行公開競價,其價格是通過商議達成的;場外交易比證交所上市所受的管制少,靈活方便。
二板市場(the Second Board)的規范名稱為「第二交易系統」,亦稱創業板(Growth Enterprise Market),主要是一些小型高科技公司的上市場所,是與現有主板(the Main Board)相對應的一個概念。
⑦ 股市裡的一級市場二級市場指的是什麼為什麼會有一二級之分
股市裡的一級市場是發行申購的股票
二級市場是流通上市交易的股票
⑧ 股票分為哪幾種,如何定義
這些是在網上找的,希望對你有用!!!股票的定義: 股票是一種有價證券,是股份有限公司在籌集資本時向出資人公開發行的、用以證明出資人的股本身份和權利,並根據股票持有人所持有的股份數享有權益和承擔義務的可轉證的書面憑證。股票代表其持有人(即股東)對股份公司的所有權,每一股股票所代表的公司所有權是相等的,即我們通常所說的「同股同權」。 股票的一級市場
一級市場(Primary Market)也稱為發行市場(Issuance Market),它是指公司直接或通過中介機構向投資者出售新發行的股票。所謂新發行的股票包括初次發行和再發行的股票,前者是公司第一次向投資者出售的原始股,後者是在原始股的基礎上增加新的份額
一級市場的運作過程
(一)咨詢與管理
1. 發行方式的選擇:股票發行的方式一般可分成公募(Public Placement)和私募(Private Placement)兩類。
2. 選定作為承銷商的投資銀行。
3. 准備招股說明書。
4. 發行定價。
(二)認購與銷售
具體方式通常有以下幾種:1.包銷 2.代銷 3.備用包銷
股票的二級市場
二級市場(Secondary Market)也稱交易市場,是投資者之間買賣已發行股票的場所。這一市場為股票創造流動性,即能夠迅速脫手換取現值。
二級市場通常可分為有組織的證券交易所和場外交易市場,但也出現了具有混合特型的第三市場(The Third Market)和第四市場(The Fourth Market)。
第三市場 第三市場是指原來在證交所上市的股票移到以場外進行交易而形成的市場,換言之,第三市場交易是既在證交所上市又在場外市場交易的股票,以區別於一般含義的櫃台交易。
第四市場
第四市場指大機構(和富有的個人)繞開通常的經紀人,彼此之間利用電子通信網路(Electronic Communication Networks, ECNs)直接進行的證券交易。 股票如何分類?
A股,B股,H股是按英文字母作為代稱的股票分類。A股是以人民幣計價,面對中國公民發行且在境內上市的股票;B股是以美元港元計價,面向境外投資者發行,但在中國境內上市的股票;H股是以港元計價在香港發行並上市的境內企業的股票。此外,中國企業在美國、新加坡、日本等地上市的股票,分別稱為N股、S股和T股。由於A股、B股及H股的計價和發行對象不同。另外,值得一提的是,滬市掛牌B股以美元計價,而深市B股以港元計價,故兩市股價差異較大,如果將美元、港元以人民幣進行換算,便知兩地股價大體一致。以字母代稱進行股票分類,不甚規范,根據中國證監會要求,股票簡稱必須統一、規范。可以相信,隨著我國股市的進一步發展,A股、B股、H股等稱謂將成為歷史。
香港股市有所謂「紅籌股」、「藍籌股」之分。紅籌股是指最大控股權直接或間接隸屬於中國內地有關部門或企業,並在香港聯合交易所上市的公司所發行的股份。即在港上市的中資企業。人們形容中國是紅色中國,而她的國旗又是五星紅旗,因此把中國相聯系的上市公司發行的股票稱為紅籌股;美國人打牌下賭注,藍色籌碼為最高,紅色籌碼為中等,白色籌碼為最低,後來人們就把股票市場上最有實力、最活躍的股票稱為藍籌股。藍籌股幾乎成了績優股的代名詞。隨著內地陸續赴港上市,現也有人將紅籌股做了更嚴謹的定義,即必須是母公司在港注冊,接受香港法律約束的中資企業才稱為紅籌股,而公司在內地注冊,只是借用香港資本市場籌資的企業,另稱為「H股」。但一般仍以紅籌股廣泛地作為在港上市的中資企業的代名。
所謂成長股,是指發行股票時規模並不大,但公司的業務蒸蒸日上,管理良好,利潤豐厚,產品在市場上有競爭力的公司的股票。
所謂熱門股是指交易量大、交易周轉率高、股價漲跌幅度也較大的股票。熱門股的形成往往有其特定的經濟、政治、社會上原因。
所謂績優股是指那些業績優良,但增長速度較慢的公司的股票。這類公司有實力抵抗經濟衰退,但這類公司並不能給你帶來振奮人心的利潤。
所謂周期股是指經營業績隨著經濟周期的漲縮而變動的公司的股票。航空工業、汽車工業、鋼鐵及化學工業都屬於此類。
所謂再生股是指經營發生困難甚至破產,經過整頓後重新獲得投資者認可的企業股票。
所謂防守性股。這些普通股股票同股價循環股正好相反,它們在面臨不確定性和商業衰退時收益和紅利卻要比社會平均的高,具有相對的穩定性。
所謂表現股(亦稱概念股)。是指能迎合某一時代潮流但未必能適應另一時代潮流的公司所發行的,股價呈巨幅起伏的股票。
所謂投機性股。是指那些價格很不穩定或公司前景很不確定的普通股。這主要是那些雄心很大,開發性或冒險性的公司的股票,熱門的新發行股以及一些面值較低的石油與礦業公司發行的普通股票。
⑨ 股票評級有幾個等級(什麼推薦,買入等)每個等級都有什麼意思
股票評級有5個等級.
1、強力買入
股票評級系數在1.00到1.09之間,是強力買入的信號。
2、買入
股票評級系數在1.10到2.09之間,是買入的信號。
3、觀望
股票評級系數在2.10到3.09之間,是觀望的信號。
4、適度減持
股票評級系數在3.10到4.09之間,是適度減持的信號。
5、賣出
股票評級系數在4.10~5.00之間,是賣出的信號。
(9)股票數據源分兩級擴展閱讀 :
股票評價通常被定義為對股票投資價值和投資風險的總體評價,而股票評級則是依據對股票投資價值和投資風險的判斷給出其投資級別。考慮到都是對股票投資價值和投資風險的評價或評級,實際上兩者從其內容和方法上來講是一致的。
但是,從其結果表現形式來看,前者沒有一定的嚴格形式,後者有一定的嚴格形式,其結果表現為一定的投資級別。如美林公司將股票簡單地分為"買進、中性與賣出",以及摩根士丹利將股票分為"增持、中性與減持"。因此,我們可以認為,前者強調的是一種過程和內容,而後者強調的則是一種結果和形式。
買入>增持>強烈推薦>推薦>優於大市
⑩ 股票市場分為哪幾個市場
股票市場是已經發行的股票轉讓、買賣和流通的場所,包括交易所市場和場外交易市場兩大類別。由於它是建立在發行市場基礎上的,因此又稱作二級市場。股票市場的結構和交易活動比發行市場(一級市場)更為復雜,其作用和影響力也更大。
股票市場一般分為股票發行市場和股票交易市場兩部分。兩個市場既有區別又有聯系。股票發行市場又稱一級市場或初級市場。股票發行是發行公司自己或通過證券承銷商(信託投資公司或證券公司)向投資者推銷新發行股票的活動。
股票發行大多無固定的場所,而在證券商品櫃台上或通過交易網路進行。發行市場的交易規模反映一國資本形成的規模。股票發行目的一是為新設立的公司籌措資金,二是為已有的公司擴充資本。
發行方式有兩種:1、由新建企業自己發行,或要求投資公司、信託公司以及其他承銷商給予適當協助;2、由證券承銷商承包發售。兩種方式各有利弊,前者發行費用較低,但籌資時間較長。後者籌資時間較短,但費用較高,需要付給投資公司、信託公司或承銷商一定的手續費。
股票交易市場又稱二級市場或流通市場,包括:
1、證券交易所市場,是專門經營股票、債券交易的有組織的市場,根據規定只有交易所的會員、經紀人、證券商才有資格進入交易大廳從事交易。進入交易的股票必須是在證券交易所登記並獲准上市的股票。
2、場外交易市場,又稱證券商櫃台市場或店頭市場。主要交易對象是未在交易所上市的股票。店頭市場股票行市價格由交易雙方協商決定。店頭市場都有固定的場所,一般只做即期交易,不做期貨交易。
這些可以慢慢去領悟,投資者進入股市之前最好對股市有些初步的了解。前期可用個牛股寶模擬炒股去看看,裡面有一些股票的知識資料是值得學習的,也可以通過上面相關知識來建立自己的一套成熟的炒股知識經驗。希望可以幫助到您,祝投資愉快!