⑴ 用人工智慧計算股票的漲和跌可行嗎
其實現在人工智慧發展的這么快,我們很多事情藉助電腦的幫助就可以完成了,但是股價這個波動性,隨機性這么強的東西,我覺得還是不行。只要把這個函數寫出來就可以預測股價了。這個函數是什麼樣子的? 我們可以嘗試用N個模型(線性,非線性, 概率)來進行逼近。如果股價的變化是符合這幾個模型的,那麼在有足夠多的訓練數據的情況下,股價將被模擬出來。但是事實是,在嘗試過許多許多模型的情況下,這些模型幾乎沒能預測股價的變化,有的模型只能在特定的區間能做一些不是十分精準的預測。
所以說,電腦是不能這么乾的。
⑵ 人工智慧可以用來炒股嗎
說的神乎其神,人工智慧能用來炒股嗎?
人工智慧在圍棋、象棋、德撲等領域都已經取得了碾壓式勝利,這已經是一個不爭的事實。事實上AlphaGo這樣的AI已經可以用於任何需要理解復雜模式、進行長期計劃、並制定決策的領域。人們不禁想問,還有什麼是人工智慧不能克服的嗎?譬如說,變幻莫測的A股?
對於這個問題,持各種觀點的都不乏其人。探討它實可以分為兩個部分:1. 股市可以預測嗎? 2、 假如可以預測,用機器學習的方法去預測可以嗎?
先回答第一個問題:股市的漲跌可以預測嗎?
如果將股市的價格變化看做一個隨時間變化的序列,Price = Market (t), 我們往往會發現,不管是嘗試用N個模型(線性,非線性, 概率)來進行逼近,即使是建立了符合股價變化的這樣的模型,並且在有足夠多的訓練數據的情況下模擬出了股價,但是這些模型最多隻能在特定的區間能做一些並不十分精準的預測。
美國矽谷「感知力」技術公司讓人工智慧程序全程負責股票交易,與其他一些運用人工智慧的投資公司不同,該公司交易部門只有兩名員工負責監控機器,以確保出現不可控情形時可通過關機終止交易。據報道,「感知力」公司的人工智慧投資系統可以通過經驗學習實現「自主進化」。公司在全球擁有數千台同時運行的機器,其獨特演算法創造了數萬億被稱為「基因」的虛擬交易者。系統利用歷史數據模擬交易,目前可在幾分鍾內模擬1800天的交易量,經過測試,不好的「基因」被剔除,好的「基因」被保留。通過考驗的好「基因」被用於真正的交易。公司員工只需設定好時間、回報率、風險指數等交易指標,剩下的一切都交由機器負責。
公司首席投資官傑夫·霍爾曼透露,目前機器在沒有人為干預情況下掌握著大量股票,每天完成數以百計的交易,持倉期限為數日到幾周。公司說機器的表現已超越他們設定的內部指標,但沒有透露指標的具體內容。
隨著人工智慧技術的持續進步,人工智慧投資成為被學術界和資本看好的領域。英國布里斯托爾大學教授克里斯蒂亞尼尼說,股票投資是十大最有可能被人工智慧改變的行業之一。另一方面,也不是所有的投資商都信任機器,英國對沖基金曼氏金融首席科學家萊德福警告說,不應過度信任人工智慧投資,該領域還遠沒有成熟。雖然有各種各樣具有迷惑性的承諾,很多投資人的錢卻有去無回。
⑶ 01 隱馬爾可夫模型 - 馬爾可夫鏈、HMM參數和性質
先直白得講性質: 當前的狀態只和上一時刻有關,在上一時刻之前的任何狀態都和我無關。我們稱其 符合 馬爾可夫性質。
下面是理論化的闡述:
設{X(t), t ∈ T}是一個 隨機過程 ,E為其狀態空間,若對於任意的t1<t2< ...<tn<t,任意的x1,x2,...,xn,x∈E,隨機變數X(t)在已知變數X(t1)=x1,...,X(tn)=xn之下的條件分布函數只與X(tn)=xn有關,而與X(t1)=x1,...,X(tn-1)=xn-1無關,即條件分布函數 滿足 下列等式,此性質稱為 馬爾可夫性 ;如果隨機過程 滿足 馬爾可夫性,則該過程稱為馬爾可夫過程。
馬爾可夫鏈 是指具有馬爾可夫性質的隨機過程。在過程中,在給定當前信息的情況下,過去的信息狀態對於預測將來 狀態 是無關的。
例子: 在今天這個時間點而言,過去的股價走勢對我預測未來的股價是毫無幫助的。
PS:上面馬爾可夫鏈中提到的 狀態 ,在本例指的是 股價 。
在馬爾可夫鏈的每一步,系統根據 概率分布 ,可以從一個狀態變成另外一個狀態,也可以保持當前狀態不變。狀態的改變叫做 轉移 ,狀態改變的相關概率叫做 轉移概率 。
例子: 當前時間狀態下的股價,可以轉變成下一時刻的股價,股價的轉變即 狀態的改變 。這個狀態現在可以上升(股價提高),狀態也可以下降。我可以根據當前股票的價格去決定下一刻股價上升、下降、不變的概率。這種股價變動的概率稱為 狀態轉移概率 。
馬爾可夫鏈中的 三元素是 :狀態空間S、轉移概率矩陣P、初始概率分布π。
1、狀態空間S - 例: S是一個集合,包含所有的狀態 S 股價 ={高,中,低} ;
2、初始概率分布π - 例:
股價剛發行的時候有一個初始價格,我們認為初始價格為高的概率為50%,初始價格為中的概率是30%,初始價格為低的概率是20%。我們記股票價格的初始概率分布為:π=(0.5,0.3,0.2);對應狀態:(高、中、低); 初始概率分布是一個向量 ,如果有n個狀態,π是n維向量。
3、轉移概率矩陣P - 例:
現在有個股價為中,下一個時刻狀態轉變的可能性有三種,中→高、中→低、中→中;將三種轉變的概率。此外當前時刻也有股票的價格屬於低,對應的轉變可能包括低→高、低→低、低→中;即每種狀態都有可能轉變成其他的狀態,若一共有n個狀態,形成的 轉移概率矩陣 應該是n×n階矩陣。這里需要注意的是,股價從高→低,和低→高的概率是不同的。
設將天氣狀態分為晴、陰、雨三種狀態,假定某天的天氣狀態只和上一天的天氣狀態有關,狀態使用1(晴)、2(陰)、3(雨)表示,轉移概率矩陣P如下:
第n+1天天氣狀態為j的概率為:
因此,矩陣P即為條件概率轉移矩陣。矩陣P的第i行元素表示,在上一個狀態為i的時候的分布概率,即每行元素的和必須為1。
隱馬爾可夫模型(Hidden Markov Model, HMM)是一種統計模型,在語音識別、行為識別、NLP、故障診斷等領域具有高效的性能。
HMM是關於時序的概率模型,描述一個含有未知參數的馬爾可夫鏈所生成的不可觀測的狀態隨機序列,再由各個狀態生成觀測隨機序列的過程。
HMM是一個雙重隨機過程---具有一定狀態的隱馬爾可夫鏈和隨機的觀測序列。
HMM隨機生成的狀態隨機序列被稱為狀態序列;每個狀態生成一個觀測,由此產生的觀測隨機序列,被稱為觀測序列。
思考: z1,z2...,zn是 不可觀測的狀態,x1,x2,...xn是 可觀測到的序列 ;不可觀測的狀態覺得可觀測序列的值(z的取值決定x的取值);
1、在 z1、z2 不可觀測 的情況下,x1和z2獨立嗎?x1和x2獨立嗎?
回答: 這個問題可以回顧之前的 貝葉斯網路 來理解。
首先z1,z2都是離散的值,但x1的值可能是離散的也可能是連續的。比如z是天氣情況,每天天氣的改變是離散的。x是因為天氣而改變的一些其他狀態,比如x=(地面是否潮濕、路上行人數量、雨傘銷售數量...);
在z1和z2不可觀測的情況下,x1和z2不獨立,x1和x2也是不獨立的。
2、 在 z1、z2可觀測 的情況下,x1和z2獨立嗎?x1和x2獨立嗎?
回答: 在z1和z2可觀測的情況下,因為x1和z2的取值只和z1有關,所以就獨立了。同樣在給定了z1和z2的情況下,x1和x2也獨立。
請回顧貝葉斯網路中的獨立性問題來思考這個問題。
04 貝葉斯演算法 - 貝葉斯網路
回顧:
一般而言,貝葉斯網路的有向無環圖中的節點表示隨機變數,可以是可觀察到的變數,或隱變數,未知參數等等。連接兩個節點之間的箭頭代表兩個隨機變數之間的因果關系(也就是這兩個隨機變數之間非條件獨立);如果兩個節點間以一個單箭頭連接在一起,表示其中一個節點是「因」,另外一個節點是「果」,從而兩節點之間就會產生一個條件概率值。
PS:每個節點在給定其直接前驅的時候,條件獨立於其非後繼。
HMM 由隱含狀態S、可觀測狀態O、初始狀態概率矩陣π、隱含狀態轉移概率矩陣A、可觀測值轉移矩陣B(又稱為混淆矩陣,Confusion Matrix);
π和A決定了狀態序列,B決定觀測序列,因此HMM可以使用三元符號表示,稱為HMM的三元素:
S可以統計歷史出現的所有狀態;
初始概率分布π,統計S中各個狀態各自出現的概率作為我們的初始概率分布π向量值;
S是所有可能的狀態集合,O是所有可能的觀測集合:
I是長度為T的狀態序列,Q是對應的觀測序列:
S={下雨,陰天,晴天};O={地上干,地上濕}
I = {晴,雨,雨,陰,晴,陰}
Q={干,濕,濕,濕,干,干}
A是隱含狀態轉移概率矩陣:
其中aij是在時刻t處於狀態si的條件下時刻t+1轉移到狀態sj的概率。
a 晴雨 = 某天是晴天條件下,下一天是雨天的概率。 (某一時刻→下一時刻)
B是可觀測值轉移概率矩陣:
其中bij是在時刻t處於狀態si的條件下生成觀測值oj的概率。
b 晴干 = 某天是晴天條件下,某天是地是乾的的概率。 (同一時刻)
π是初始狀態概率向量:
其中πi是在時刻t=1處於狀態si的概率。
π 晴 = 初始第一天是晴天的概率;
π 雨 = 初始第一天是雨天的概率;
p(i t | .....) 表示在從 t-1時刻的觀測值q t-1 ,一直到第1時刻觀測值q1 的條件下,在第t時刻發生狀態的概率。
性質1: 最終分析結果發現,在第t時刻發生狀態的概率it只和t-1時刻有關。
性質2: 第t時刻的觀測值qt只和第t時刻的狀態it有關。
假設有三個盒子,編號為1,2,3;每個盒子都裝有黑白兩種顏色的小球,球的比例。如下:
按照下列規則的方式進行有放回的抽取小球,得到球顏色的觀測序列:
1、按照π的概率選擇一個盒子,從盒子中隨機抽取出一個球,記錄顏色後放回盒子中;
2、按照某種條件概率選擇新的盒子,重復該操作;
3、最終得到觀測序列:「白黑白白黑」
例如: 每次抽盒子按一定的概率來抽,也可以理解成隨機抽。
第1次抽了1號盒子①,第2次抽了3號盒子③,第3次抽了2號盒子②.... ; 最終如下:
①→③→②→②→③ 狀態值
白→黑→白→白→黑 觀測值
1、 狀態集合: S={盒子1,盒子2,盒子3}
2、 觀測集合: O={白,黑}
3、 狀態序列和觀測序列的長度 T=5 (我抽了5次)
4、 初始概率分布: π 表示初次抽時,抽到1盒子的概率是0.2,抽到2盒子的概率是0.5,抽到3盒子的概率是0.3。
5、 狀態轉移概率矩陣 A:a11=0.5 表示當前我抽到1盒子,下次還抽到1盒子的概率是0.5;
6、 觀測概率矩陣 B:如最初的圖,b11=第一個盒子抽到白球概率0.4,b12=第一個盒子抽到黑球概率0.6;
在給定參數π、A、B的時候,得到觀測序列為「白黑白白黑」的概率是多少?
這個時候,我們不知道隱含條件,即不知道狀態值:①→③→②→②→③ ;
我們如何根據π、A、B求出測序列為「白黑白白黑」的概率?
02 隱馬爾可夫模型 - HMM的三個問題 - 概率計算、學習、預測