‘壹’ 时间序列基础
1.随机时序分析的基本概念
1)随机变量:简单的随机现象,如某班一天学生出勤人数,是静态的。
2)随机过程:随机现象的动态变化过程。动态的。如某一时期各个时刻的状态。
所谓随机过程,就是说现象的变化没有确定形式,没有必然的变化规律。用数学语言来说,就是事物变化的过程不能用一个(或几个)时间t的确定的函数来描述。
如果对于每一特定的t属于T(T是时间集合),X(t)是一个随机变量,则称这一族无穷多个随机变量{X(t),t属于T}是一个随机过程。
2.白噪声序列
1)纯随机过程:随机变量X(t)(t=1,2,3……),如果是由一个不相关的随机变量的序列构成的,即对于所有s不等于k,随机变量Xs和Xk的协方差为零,则称其为 纯随机过程 。
2)白噪声过程:如果一个纯随机过程的期望和方差均为常数,则称之为 白噪声过程 。白噪声过程的样本实称成为白噪声序列,简称白噪声。
3)高斯白噪声序列:如果白噪声具体是服从均值为0、方差为常数的正态分布,那就是 高斯白噪声序列 。
3.平稳性序列
1)平稳性可以说是时间序列分析的基础。平稳的通俗理解就是时间序列的一些行为不随时间改变, 所谓平稳过程就是其统计特性不随时间的平移而变化的过程。
2)即时间序列内含的规律和逻辑,要在被预测的未来时间段内能够延续下去。这样我们才能用历史信息去预测未来信息,类似机器学习中的训练集和测试集同分布。
3)如果时间序列的变化是没有规律的、完全随机的,那么预测模型也就没有用。
4)平稳性的数学表达:如果时间序列在某一常数附近波动且波动范围有限,即有常数均值和常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的或者说延迟k期的序列变量之间的影响程度是一样的,则称该序列为平稳序列。简单说就是没有明显趋势且波动范围有限。
4.严平稳/强平稳
1)通俗来说,就是时间序列的联合分布随着时间变化严格保持不变。
2)数学表达:如果对所有的时刻 t, (yt1,yt2,…ytm)的联合分布与(y(t1+k),(yt2+k),…y(tm+k))的联合分布相同,我们称时间序列 {yt} 是严平稳的。也就是时间序列的联合分布在时间的平移变换下保持不变。
5.弱平稳
1)数学表达:均值不变,协方差Cov(yt,y(t-k))=γk,γk依赖于k。
2)即协方差也不随时间改变,而仅与时间差k相关。
3)可以根据根据时间序列的折线图等大致观察数据的(弱)平稳性:*所有数据点在一个常数水平上下以相同幅度波动。
4)弱平稳的线性时间序列具有短期相关性(证明见参考书),即通常只有近期的序列值对现时值得影响比较明显,间隔越远的过去值对现时值得影响越小。至于这个间隔,也就是下面要提到的模型的阶数。
6.严平稳和弱平稳的关系
1)严平稳是一个很强的条件,难以用经验的方法验证,所以一般将弱平稳性作为模型的假设条件。
2)两者并不是严格的包含与被包含关系,但当时间序列是正态分布时,二者等价。
7.单位根非平稳序列(可转换为平稳序列的非平稳序列)
在金融数据中,通常假定资产收益率序列是弱平稳的。但还有一些研究对象,比如利率、汇率、资产的价格序列,往往不是平稳的。对于资产的价格序列,其非平稳性往往由于价格没有固定的水平,这样的非平稳序列叫做单位根(unit-root)非平稳序列。
1)最着名的单位根非平稳序列的例子是随机游走(random walk)模型:
pt=μ+p(t-1)+εt
μ是常数项(漂移:drift)。εt是白噪声序列,则pt就是一个随机游走。它的形式和AR模型很像,但不同之处在于,AR模型中,系数的模需要小于1,这是AR的平稳性条件,而随机游走相当于系数为1的AR公式,不满足AR模型的平稳性条件。
随机游走模型可作为(对数)股价运动的统计模型,在这样的模型下,股价是不可预测的。因为εt关于常数对称,所以在已知p(t-1)的条件下,pt上升或下降的概率都是50%,无从预测。
2)带趋势项的时间序列
pt=β0+β1*t+yt,yt是一个平稳时间序列。
带漂移的随机游走模型,其均值和方差都随时间变化;而带趋势项的时间序列,其均值随时间变化,但方差则是不变的常数。
单位根非平稳序列可以进行平稳化处理转换为平稳序列。比如用差分法处理随机游走序列,用用简单的回归分析移除时间趋势处理带趋势项的时间序列。
建立具体的模型,需解决如下三个问题模型的具体形式、时序变量的滞后期以及随机扰动项的结构。
μ是yt的均值;ψ是系数,决定了时间序列的线性动态结构,也被称为权重,其中ψ0=1;{εt}为高斯白噪声序列,它表示时间序列{yt}在t时刻出现了新的信息,所以εt称为时刻t的innovation(新信息)或shock(扰动)。
线性时间序列模型,就是描述线性时间序列的权重ψ的计量经济模型或统计模型,比如ARIMA。因为并非所有金融数据都是线性的,所以不是所有金融数据都适合ARIMA等模型。
①自回归模型(AR)
用变量自身的历史时间数据对变量进行回归,从而预测变量未来的时间数据。
p阶(滞后值,可暂理解为每个移动窗口有p期)自回归公式即AR(p):
②移动平均模型(MA)
移动平均模型关注的是误差项的累加,能够有效消除预测中的随机波动。
可以看作是白噪声序列的简单推广,是白噪声序列的有限线性组合。也可以看作是参数受到限制的无穷阶AR模型。
③自回归移动平均模型(ARMA)
有时候,要用很多阶数的AR和MA模型(见后面的定阶问题),为解决这个问题提出ARMA模型。
对于金融中的收益率序列,直接使用ARMA模型的时候较少,但其概念与波动率建模很相关,GARCH模型可以认为是对{εt}的ARMA模型。
④自回归差分移动平均模型(ARIMA)
ARIMA比ARMA仅多了个"I",代表的含义可理解为 差分。
一些非平稳序列经过d次差分后,可以转化为平稳时间序列。我们对差分1次后的序列进行平稳性检验,若果是非平稳的,则继续差分。直到d次后检验为平稳序列。
⑤一般分析过程
1、 平稳性检验
ADF检验(单位根检验):这是一种检查数据稳定性的统计测试。
原假设(无效假设):时间序列是不稳定的。
2、 平稳化处理
平稳化的基本思路是:通过建模并估计趋势和季节性这些因素,并从时间序列中移除,来获得一个稳定的时间序列,然后再使用统计预测技术来处理时间序列,最后将预测得到的数据,通过加入趋势和季节性等约束,来还原到原始时间序列数据。
2.0 对数变换
对某些时间序列需要取对数处理,一是可以将一些指数增长的时间序列变成线性增长,二是可以稳定序列的波动性。对数变换在经济金融类时间序列中常用。
2.1 差分法
如果是单位根非平稳的(比如随机游走模型),可以对其进行差分化。它能让数据呈现一种更加平稳的趋势。差分阶数的选择通常越小越好,只要能够使得序列稳定就行。
2.2 平滑法
移动平均、指数加权移动平均
注:经差分或平滑后的数据可能因包含缺失值而不能使用检验,需要将缺失值去除
2.3 分解法
建立有关趋势和季节性的模型,并从模型中删除它们。
3 、建立模型:模型选择和模型的定阶
模型的选择即在AR、MA、ARMA、ARIMA中间如何选择。
模型的定阶即指定上面过程中产生的超参数p、q和d(差分的阶数)。
(1)用ACF和PACF图判断使用哪种线性时间序列模型
AR模型:ACF拖尾,PACF截尾,看PACF定阶。
MA模型:ACF截尾,PACF拖尾,看ACF定阶。
ARMA模型:都拖尾。(EACF定阶)
截尾:在某阶后 迅速 趋于0(后面大部分阶的对应值在二倍标准差以内);
拖尾:按指数衰减或震荡,值到后面还有增大的情况。
ARIMA模型:适用于差分后平稳的序列。
(2)利用 信息准则 函数选择合适的阶
对于个数不多的时序数据,可以通过观察自相关图和偏相关图来进行模型识别,倘若要分析的时序数据量较多,例如要预测每只股票的走势,就不可能逐个去调参了。这时可以依据AIC或BIC准则识别模型的p, q值,通常认为AIC或BIC值越小的模型相对更优。
AIC或BIC准则综合考虑了残差大小和自变量的个数,残差越小AIC或BIC值越小,自变量个数越多AIC或BIC值越大。AIC或BIC准则可以说是对模型过拟合设定了一个标准。
AIC (Akaike information criterion,赤池信息度量准则)
AIC=2k-2ln(L)
· BIC (Bayesian information criterion,贝叶斯信息度量准则)
BIC=kln(n)-2ln(L)
k为模型的超参数个数,n为样本数量,L为似然函数。
类比机器学习中的损失函数=经验损失函数+正则化项。
模型选择标准:AIC和BIC越小越好(在保证精度的情况下模型越简单越好)
4 、模型检验和评估(之前应切分训练集和验证集)
检验残差是否符合标准(QQ图):是否服从均值为0,方差是常数的正态分布(εt是否是高斯白噪声序列)。
拟合优度检验(模型的评估):R 2和调整后的R 2(R^2只适用于平稳序列)。
5 、预测
如果之前进行了标准化、差分化等,需要进行还原:
标准化的还原要注意是log(x+1)还是log(x)。
1 、基础概念
波动率
在期权交易中,波动率是标的资产的收益率的条件标准差。之前的平稳序列假设方差为常数,但当序列的方差不是常数时,我们需要用波动率对其变化进行描述。
对于金融时间序列,波动率往往具有以下特征:
存在波动率聚集(volatility cluster)现象。 即波动率在一些 时间段 上高,一些时间段上低。
波动率以连续时间变化,很少发生跳跃。
波动率不会发散到无穷,而是在固定的范围内变化(统计学角度上说,其是平稳的)
杠杆效应:波动率对价格大幅上升和大幅下降的反应是不同的。
波动率模型/条件异方差模型
给资产收益率的波动率进行建模的模型叫做条件异方差模型。这些波动率模型试图刻画的数据有这样的特性: 它们是序列不相关或低阶序列相关的(比如股票的日收益率可能相关,但月收益率则无关),但又不是独立的 。波动率模型就是试图刻画序列的这种非独立性。
定义信息集F(t-1)是包含过去收益率的一切线性函数,假定F(t-1)给定,那么在此条件下时间序列yt的条件均值和条件方差分别表示为:
‘贰’ 上证指数日收益率怎样计算
上证指数日收益率怎样计算?1、上证指数日收益率的计算方法:(收盘价-昨收盘价)/昨收盘价*100%=日收益率。上海证券综合指数简称“上证综指”,其样本股是全部上市股票,包括A股和B股,反映了上海证券交易所上市股票价格的变动情况,自1991年7月15日起正式发布。
2、上海证券交易所(Shanghai Stock Exchange)是中国大陆两所证券交易所之一,位于上海浦东新区。上海证券交易所创立于1990年11月26日,同年12月19日开始正式营业。截至2009年年底,上证所拥有870家上市公司,上市证券数1351个,股票市价总值184655.23亿元。一大批国民经济支柱企业、重点企业、基础行业企业和高新科技企业通过上市,既筹集了发展资金,又转换了经营机制。看到上证指数的月收益率的方法:一般股票软件中都可以查看的。进入你所在的股票软件中,按下F3,再按下F5进入上证A股的日K线图,然后按F8,切换到月K线图,就可以清楚的看到月收益率。2、收益率是指投资的回报率,一般以年度百分比表达,根据当时市场价格、面值、息票利率以及距离到期日时间计算。对公司而言,收益率指净利润占使用的平均资本的百分比。收益率研究的是收益率作为一项个人投资的收益率的大小,可以分为个人收益率与社会收益率,主要关注的是前者。
‘叁’ 股票的周回报率数据是时间序列的吗
股票指数的周数据指的是当周所有交易日的数据, 不是当周所有交易日的平均值。
股市指数,简单来说,就是由证券交易所或金融服务机构编制的、表明股票行市变动的一种供参考的数字。
指数是各个股票市场涨跌的重要指标,通过观察指数,我们可以对当前整个股票市场的涨跌有直观的认识。
股票指数的编排原理对我们来说还是有点难度,我就不做过多的解释了,点击下方链接,教你快速看懂指数:
新手小白必备的股市基础知识大全
一、国内常见的指数有哪些?
会对股票指数的编制方法和它的性质来进行一个分类,股票指数有这五种形式的分类:规模指数、行业指数、主题指数、风格指数和策略指数。
其中,出现频率最多的是规模指数,比如说,各位都很清楚的“沪深300”指数,说明了交易比较活跃的300家大型企业的股票在沪深市场上都具有比较好的代表性和流动性一个整体状况。
再譬如说,“上证50 ”指数也是一个规模指数,说的是上证市场规模较大的50只股票的整体情况
‘肆’ 股票时间序列收益率序列是什么意思
119580专业理财,短线操作
‘伍’ 股票中的收益率是如何计算的呀
股票收益率是反映股票收益水平的指标。投资者购买股票或债券最关心的是能获得多少收益,衡量一项证券投资收益大小以收益率来表示。反映股票收益率的高低,一般有三个指标:①本期股利收益率。是以现行价格购买股票的预期收益率。②持有期收益率。股票没有到期,投资者持有股票的时间有长有短,股票在持有期间的收益率为持有期收益率。③折股后的持有期收益率。股份公司进行折股后,出现股份增加和股价下降的情况,因此,折股后股票的价格必须调整。“股票收益 是指收益占投资的 比例 ,一般以 百分比 表示。其计算公式为: 收益率=(股息+卖出价格-买进价格)/买进价格×100% 比如一位获得 收入 收益的 投资者 ,花8000元买进1000股某公司股票,一年中分得股息800元(每股0.8元),则: 收益率。
‘陆’ 股票日收益率 年收益率怎么算的
股票收益率是反映股票收益水平的指标。投资者购买股票或债券最关心的是能获得多少收益,衡量一项证券投资收益大小以收益率来表示。
股票收益率=收益额/原始投资额。
应答时间:2021-01-15,最新业务变化请以平安银行官网公布为准。
[平安银行我知道]想要知道更多?快来看“平安银行我知道”吧~
https://b.pingan.com.cn/paim/iknow/index.html
‘柒’ 股票日收益率 年收益率怎么算的
计算公式
r=[D+(P1-P0)/n]/P0
D是年现金股利额,P0是股票买入额,P1是股票卖出额,n是股票持有年数。
持有期收益率
Rhp
:
Rhp
=持有期期末价值/持有期期初价值-1
⑴
持有期收益率
Rhp
也可以转化为各时段相当收益率
Rg
.如果以复利计,则持有期收益率与相当收益率之间的关系可表示为:
(1
+
Rg)N
=
1
+
Rhp
⑵
其中,N为持有期内时段数目.
例题
假设某一种股票年初每股价值为45元,第一年度末支付股利2.00元,年底增值为50元;第二年度末支付股利2.50元,年底价值为58元.第一年度末收入的2.00元可购买同种股票0.04股(=2.00元/50元).当然,实际上这一金额只有在投资者持有大量股票,如100股的股利可以购买同种股票4股,才有意义.投资者第二年得到股利2.60元(=1.04
x
2.50元),第二年年底股票价值为60.32元(=1.04*58元).因而该股票期末价值为62.92元(=60.32元+2.60元),计算相对价值:(62.92元/45元)=1.3982
所以,该股票二年持有期的收益率为39.82%.
‘捌’ 您好,我想问问您的一个回答的论文题目,百度知道上的问题是:(以下补充)谢谢!
摘 要 研究了沪深300指数日收益率时间序列,经检验其具有马氏性,并建立了马尔可夫链模型。取交易日分时数据,根据分时数据确定状态初始概率分布,通过一步转移概率矩阵对下一交易日的日收益率进行了预测。对该模型分析和计算,得出其为有限状态的不可约、非周期马尔可夫链,求解其平稳分布,从而得到沪深300指数日收益率概率分布。并预测了沪深300指数上涨或下跌的概率,可为投资管理提供参考。
关键词 马尔可夫链模型 沪深300指数 日收益率概率分布 平稳分布
1 引言
沪深300指数于2005年4月正式发布,其成份股为市场中市场代表性好,流动性高,交易活跃的主流投资股票,能够反映市场主流投资的收益情况。众多证券投资基金以沪深300指数为业绩基准,因此对沪深300指数收益情况研究显得尤为重要,可为投资管理提供参考。
取沪深300指数交易日收盘价计算日收益率,可按区间将日收益率分为不同的状态,则日收益率时间序列可视为状态的变化序列,从而可以尝试采用马尔可夫链模型进行处理。马尔可夫链模型在证券市场的应用已取得了不少成果。参考文献[1]、[2]、[3]和[4]的研究比较类似,均以上证综合指数的日收盘价为对象,按涨、平和跌划分状态,取得了一定的成果。但只取了40~45个交易日的数据进行分析,历史数据过少且状态划分较为粗糙。参考文献[5]和[6]以上证综合指数周价格为对象,考察指数在的所定义区间(状态)的概率,然其状态偏少(分别只有6个和5个状态),区间跨度较大,所得结果实际参考价值有限。参考文献[7]对单只股票按股票价格划分状态,也取得了一定成果。
然而收益率是证券市场研究得更多的对象。本文以沪深300指数日收益率为对考察对象进行深入研究,采用matlab7.1作为计算工具,对较多状态和历史数据进行了处理,得出了沪深300指数日收益率概率分布,并对日收益率的变化进行了预测。
2 马尔可夫链模型方法
2.1 马尔可夫链的定义
设有随机过程{Xt,t∈T},T是离散的时间集合,即T={0,1,2,L},其相应Xt可能取值的全体组成状态空间是离散的状态集I={i0,i1,i2,L},若对于任意的整数t∈T和任意的i0,i1,L,it+1∈I,条件概率则称{Xt,t∈T}为马尔可夫链,简称马氏链。马尔可夫链的马氏性的数学表达式如下:
P{Xn+1=in+1|X0=i0,X1=i1,L,Xn=in}=P{Xn+1=in+1|Xn=in} (1)
2.2 系统状态概率矩阵估计
马尔可夫链模型方法的基本内容之一是系统状态的转移概率矩阵估算。估算系统状态的概率转移矩阵一般有主观概率法和统计估算法两种方法。主观概率法一般是在缺乏历史统计资料或资料不全的情况下使用。本文采用统计估算法,其主要过程如下:假定系统有m种状态S1,S2,L,Sm根据系统的状态转移的历史记录,可得到表1的统计表格。其中nij表示在考察的历史数据范围内系统由状态i一步转移到状态j的次数,以■ij表示系统由状态i一步转移到状态的转移概率估计量,则由表1的历史统计数据得到■ij的估计值和状态的转移概率矩阵P如下:
■ij=nij■nik,P=p11 K p1mM O Mpm1 L pmn(2)
2.3 马氏性检验
随机过程{Xt,t∈T}是否为马尔可夫链关键是检验其马氏性,可采用χ2统计量来检验。其步骤如下:(nij)m×m的第j列之和除以各行各列的总和所得到的值记为■.j,即:
■.j=■nij■■nik,且■ij=nij■nik(3)
当m较大时,统计量服从自由度为(m-1)2的χ2分布。选定置信度α,查表得χ2α((m-1)2),如果■2>χ2α((m-1)2),则可认为{Xt,t∈T}符合马氏性,否则认为不是马尔可夫链。
■2=2■■nijlog■ij■.j(4)
2.4 马尔可夫链性质
定义了状态空间和状态的转移概率矩阵P,也就构建了马尔可夫链模型。记Pt(0)为初始概率向量,PT(n)为马尔可夫链时刻的绝对概率向量,P(n)为马尔可夫链的n步转移概率矩阵,则有如下定理:
P(n)=PnPT(n)=PT(0)P(n)(5)
可对马尔可夫链的状态进行分类和状态空间分解,从而考察该马尔可夫链模型的不可约闭集、周期性和遍历性。马尔可夫链的平稳分布有定理不可约、非周期马尔可夫链是正常返的充要条件是存在平稳分布;有限状态的不可约、非周期马尔可夫链必定存在平稳过程。
3 马尔可夫链模型方法应用
3.1 观测值的描述和状态划分
取沪深300指数从2005年1月4日~2007年4月20日共555个交易日收盘价计算日收益率(未考虑分红),将日收益率乘以100并记为Ri,仍称为日收益率。计算公式为:
Ri=(Pi-Pi-1)×100/Pi-1(6)
其中,Pi为日收盘价。
沪深300指数运行比较平稳,在考察的历史数据范围内日收益率有98.38%在[-4.5,4.5]。可将此范围按0.5的间距分为18个区间,将小于-4.5和大于4.5各记1区间,共得到20个区间。根据日收益率所在区间划分为各个状态空间,即可得20个状态(见表2)。
3.2 马氏性检验
采用χ2统计量检验随机过程{Xt,t∈T}是否具有马氏性。用前述统计估算法得到频率矩阵(nij)20×20。
由(3)式和(4)式可得:■.j=■nij■■nik,且■ij=nij■nik,■2=2■■nijlog■ij■.j=446.96,令自由度为k=(m-1)2即k=361,取置信度α=0.01。由于k>45,χ2α(k)不能直接查表获得,当k充分大时,有:
χ2α(k)≈■(zα+■)2(7)
其中,zα是标准正态分布的上α分位点。查表得z0.01=2.325,故可由(1)、(7)式得,即统计量,随机过程{Xt,t∈T}符合马氏性,所得模型是马尔可夫链模型。
3.3 计算转移概率矩阵及状态一步转移
由频率矩阵(nij)20×20和(1)、(2)式得转移概率矩阵为P=(Pij)20×20。考察2007年4月20日分时交易数据(9:30~15:30共241个数据),按前述状态划分方法将分时交易数据收益率归于各状态,并记Ci为属于状态i的个数,初始概率向量PT(0)=(p1,p2,L,pt,L,p20),则:
pj=Cj/241,j=1,2,K,20(8)
下一交易日日收益率分布概率PT(0)={p1(1),p2(1),L,pi(1),L,p20(1)},且有PT(1)-PT(0)p,计算结果如表3所示。
3.4 马尔可夫链遍历性和平稳分布
可以分析该马尔可夫链的不可约集和周期性,从而进一步考察其平稳分布,然而其分析和求解非常复杂。本文使用matlab7.1采用如下算法进行求解:将一步转移概率矩阵P做乘幂运算,当时Pn+1=Pn停止,若n>5 000亦停止运算,返回Pn和n。计算发现当n=48时达到稳定,即有P(∞)=P(48)=P48。考察矩阵P(48)易知:各行数据都相等,不存在数值为0的行和列,且任意一行的行和为1。故该马尔可夫链{Xt,t∈T}只有一个不可约集,具有遍历性,且存在平稳分布{πj,j∈I},平稳分布为P(48)任意一行。从以上计算和分析亦可知该马尔可夫链是不可约、非周期的马尔可夫链,存在平稳分布。计算所得平稳分布如表4所示。
3.5 计算结果分析
表3、表4给出了由当日收益率统计出的初始概率向量PT(0),状态一步预测所得绝对概率向量PT(1)和日收益率平稳分布,由表3和表4综合可得图1。可以看出,虽然当日(2007年4月20日)收益率在区间(1.5,4.5)波动且在(2.5,4.5)内的概率达到了0.7261,表明在2007年4月20日,日收益率较高(实际收盘时,日收益率为4.41),但其下一交易日和从长远来看其日收益率概率分布依然可能在每个区间。这是显然的,因为日收益率是随机波动的。
对下一交易日收益率预测(PT(1)),发现在下一交易日收益率小于0的概率为0.4729,大于0的概率为0.5271,即下一交易日收益率大于0的概率相对较高,其中在区间(-2,-1.5)、(0.5,1)和(1,1.5)概率0.2675、0.161和0.1091依次排前三位,也说明下一交易日收益率在(-2,-1.5)的概率会比较高,有一定的风险。
从日收益率长远情况(平稳分布)来看,其分布类似正态分布但有正的偏度,说明其极具投资潜力。日收益率小于0的概率为0.4107,大于0的概率为0.5893,即日收益率大于0的概率相当的高于其小于0的概率。
4 结语
采用马尔可夫链模型方法可以依据某一交易日收益率情况向对下一交易日进行预测,也可得到从长远来看其日收益率的概率分布,定量描述了日收益率。通过对沪深300指数日收益率分析和计算,求得沪深300指数日收益率的概率分布,发现沪深300指数日收益率大于0的概率相对较大(从长远看,达到了0.5893,若考虑分红此概率还会变大),长期看来沪深300指数表现乐观。若以沪深300指数构建指数基金再加以调整,可望获得较好的回报。
笔者亦采用范围(-5,5)、状态区间间距为1和范围(-6,6)、状态区间间距为2进行运算,其所得结果类似。当采用更大的范围(如-10,10等)和不同的区间大小进行运算,计算发现若状态划分过多,所得模型不易通过马氏性检验,如何更合理的划分状态使得到的结果更精确是下一步的研究之一。在后续的工作中,采用ANN考察所得的日收益率预测和实际日收益率的关系也是重要的研究内容。马尔可夫链模型方法也可对上证指数和深证成指数进行类似分析。
参考文献
1 关丽娟,赵鸣.沪综指走势的马尔可夫链模型预测[J].山东行政学院,山东省经济管理干部学院学报,2005(4)
2 陈奕余.基于马尔可夫链模型的我国股票指数研究[J].商场现代化(学术研讨),2005(2)
3 肖泽磊,卢悉早.基于马尔可夫链系统的上证指数探讨[J].科技创业月刊,2005(9)
4 边廷亮,张洁.运用马尔可夫链模型预测沪综合指数[J].统计与决策,2004(6)
5 侯永建,周浩.证券市场的随机过程方法预测[J].商业研究,2003(2)
6 王新蕾.股指马氏性的检验和预测[J].统计与决策,2005(8)
7 张宇山,廖芹.马尔可夫链在股市分析中的若干应用[J].华南理工大学学报(自然科学版),2003(7)
8 冯文权.经济预测与决策技术[M].武汉:武汉大学出版社,2002
9 刘次华.随机过程[M].武汉:华中科技大学出版社,2001
10 盛千聚.概率论与数理统计[M].北京:高等教育出版社.1989转
‘玖’ 股票收益率为什么要用对数收益率,请问各位大侠,对数收益率有什么优势
因为常用的时间序列分析的模型,都要求随机变量是二阶矩平稳,很明显价格序列通常是I(1)过程,或者是广义维纳过程。这一类过程二阶矩不平稳,很多模型不适用,所以要进行对数转换,变成平稳的序列。
对数收益率的时序可加性能够使用另外两个利器:中心极限定理和大数定律。假设初始资金 X_0(假设等于 1),ln(X_T) = ln(X_T/X_0) 就是整个T期的对数收益率。对数收益率的最大好处是可加性,把单期的对数收益率相加就得到整体的对数收益率。
(9)股票日收益率是时间序列吗扩展阅读:
影响股票收益率的因素:
1、企业分配政策:由于不同企业所处发展阶段不同,经营效率不同,现金流量状况不同及规模扩张动力大小不同,因此会有不同的分配政策。这会直接影响红利分配的数量及红利分配的形式,也对资本增值收益产生间接影响。
2、企业所处行业特征:通常企业所处行业若为成长性行业、高科技行业,由于这些行业成长性高,发展前景广阔而被市场看好,因此市场预期趋同使这类股票受到追捧,从而有较高的市场价或存在着较高的价格上升潜力。反之处于传统产业甚至夕阳产业的企业,股票价格表现一般不会很好,从而投资难以获得差价收入。
3、宏观经济状况:宏观经济状况是股价变化的重要外部因素,具体包括经济增长周期、经济政策及经济指标变化特征等。宏观经济状况好,企业业绩增长外部环境好,股价容易上涨。
‘拾’ 如何用GARCH(1,1)求股票的具体波动率数据
以哈飞股份(600038)为例,运用GARCH(1,1)模型计算股票市场价值的波动率。
GARCH(1,1)模型为:
(1)
(2)
其中, 为回报系数, 为滞后系数, 和 均大于或等于0。
(1)式给出的均值方程是一个带有误差项的外生变量的函数。由于是以前面信息为基础的一期向前预测方差,所以称为条件均值方程。
(2)式给出的方程中: 为常数项, (ARCH项)为用均值方程的残差平方的滞后项, (GARCH项)为上一期的预测方差。此方程又称条件方差方程,说明时间序列条件方差的变化特征。
通过以下六步进行求解:
本文选取哈飞股份2009年全年的股票日收盘价,采用Eviews 6.0的GARCH工具预测股票收益率波动率。具体计算过程如下:
第一步:计算日对数收益率并对样本的日收益率进行基本统计分析,结果如图1和图2。
日收益率采用JP摩根集团的对数收益率概念,计算如下:
其中Si,Si-1分别为第i日和第i-1日股票收盘价。
图1 日收益率的JB统计图
对图1日收益率的JB统计图进行分析可知:
(1)标准正态分布的K值为3,而该股票的收益率曲线表现出微量峰度(Kurtosis=3.748926>3),分布的凸起程度大于正态分布,说明存在着较为明显的“尖峰厚尾”形态;
(2)偏度值与0有一定的差别,序列分布有长的左拖尾,拒绝均值为零的原假设,不属于正态分布的特征;
(3)该股票的收益率的JB统计量大于5%的显着性水平上的临界值5.99,所以可以拒绝其收益分布正态的假设,并初步认定其收益分布呈现“厚尾”特征。
以上分析证明,该股票收益率呈现出非正态的“尖峰厚尾”分布特征,因此利用GARCH模型来对波动率进行拟合具有合理性。
第二步:检验收益序列平稳性
在进行时间序列分析之前,必须先确定其平稳性。从图2日收益序列的路径图来看,有比较明显的大的波动,可以大致判断该序列是一个非平稳时间序列。这还需要严格的统计检验方法来验证,目前流行也是最为普遍应用的检验方法是单位根检验,鉴于ADF有更好的性能,故本文采用ADF方法检验序列的平稳性。
从表1可以看出,检验t统计量的绝对值均大于1%、5%和10%标准下的临界值的绝对值,因此,序列在1%的显着水平下拒绝原假设,不存在单位根,是平稳序列,所以利用GARCH(1,1)模型进行检验是有效的。
图2 日收益序列图
表1ADF单位根检验结果
第三步:检验收益序列相关性
收益序列的自相关函数ACF和偏自相关函数PACF以及Ljung-Box-Pierce Q检验的结果如表3(滞后阶数 =15)。从表4.3可以看出,在大部分时滞上,日收益率序列的自相关函数和偏自相关函数值都很小,均小于0.1,表明收益率序列并不具有自相关性,因此,不需要引入自相关性的描述部分。Ljung-Box-Pierce Q检验的结果也说明日收益率序列不存在明显的序列相关性。
表2自相关检验结果
第四步:建立波动性模型
由于哈飞股份收益率序列为平稳序列,且不存在自相关,根据以上结论,建立如下日收益率方程:
(3)
(4)
第五步:对收益率残差进行ARCH检验
平稳序列的条件方差可能是常数值,此时就不必建立GARCH模型。故在建模前应对收益率的残差序列εt进行ARCH检验,考察其是否存在条件异方差,收益序列残差ARCH检验结果如表3。可以发现,在滞后10阶时,ARCH检验的伴随概率小于显着性水平0.05,拒绝原假设,残差序列存在条件异方差。在条件异方差的理论中,滞后项太多的情况下,适宜采用GARCH(1,1)模型替代ARCH模型,这也说明了使用GARCH(1,1)模型的合理性。
表3日收益率残差ARCH检验结果
第六步:估计GARCH模型参数,并检验
建立GARCH(1,1)模型,并得到参数估计和检验结果如表4。其中,RESID(-1)^2表示GARCH模型中的参数α,GARCH(-1)表示GARCH模型中的参数β,根据约束条件α+β<1,有RESID(-1)^2+GARCH(-1)=0.95083<1,满足约束条件。同时模型中的AIC和SC值比较小,可以认为该模型较好地拟合了数据。
表4日收益率波动率的GARCH(1,1)模型的参数估计