㈠ 什么是股票量化交易
股票量化交易,顾名思义,是运用计算机技术和数学模型,将投资理念与策略数字化的过程。它区别于传统的基本面分析和技术分析,更侧重数据和模型在投资决策中的作用。
量化投资策略多样,主要包括五个方面:首先,量化选股,通过估值法、趋势法和资金法来筛选股票,如基本面量化(评估公司价值与市场定价)、技术面量化(分析市场趋势)和交易行为量化(跟随市场主力资金)。通过轮换策略,有望实现超额收益。
其次,量化择时策略挑战了有效市场假说,利用技术工具如Hurst指数预测市场波动,进行高抛低吸,如在市场底部抄底和顶部抛售。
对冲套利则是寻找相关品种价差的异常,通过多空操作来锁定收益,如ETF套利、跨品种套利等,即便市场波动,也能实现相对稳定收益。例如,东海恒信因ETF套利策略在2013-2015年间获利显着。
期权套利则涉及多种期权交易策略,利用期权的杠杆特性在熊市也能获取高收益。而资产配置,作为投资成功的关键,量化投资将其与传统理论相结合,强调通过科学的资产组合选择而非频繁交易来实现财富增值。
总的来说,股票量化交易是一种利用科技与模型优化投资决策,实现策略执行的高效投资方式。
㈡ r/s分析法计算hurst指数
Hurst指数是衡量不同频率下分形布朗运动(FBM)增量波动与频率关系的指标。波动性指的是FBM在不同频率下的增量分布的宽度,描述这个宽度通常使用重标极差或标准差等指标,形成了计算Hurst指数的不同方法。
当使用重标极差来描述波动分布宽度时,该方法称为重标极差分析(R/S分析),由Hurst于1951年发明,这是业界最普遍的计算方法。在国内投资研究报告中,计算Hurst指数时常用这种方法。
理解R/S分析对完全理解Hurst指数和FBM至关重要。例如,在投资领域,虽然研究的是价格序列,但讨论的是收益率的Hurst指数而非价格序列,这是为什么?又如,日收益率和周收益率的Hurst指数有何区别与联系?为解答这些问题,本节参考Peters(1994)的步骤介绍了如何使用R/S分析方法计算Hurst指数。
在金融市场中,FBM用于描述投资品的对数价格,因此FBM的增量是投资品的对数收益率。对数价格的目的是将价格标准化,使时间序列在不同绝对价格下具有可比性。例如,100点波动对于3000点和6000点的上证指数是不同的,不可比。
由于FBM的性质,其增量满足平稳性,投资品的对数收益率也满足平稳性。长记忆性,即Hurst指数,刻画了平稳时间序列的自相关性(Beran,1994)。因此,Hurst指数描述的是对数收益率的自相关性,而不是价格序列。
R/S分析包括以下步骤:
第一步:输入数据为长度为N的股票价格序列,将其取对数、做差分,转换为长度为N的对数差分序列。
第二步:将对数收益率序列分为多个子集,计算每个子集的均值。
第三步:在每个子集中,计算累积离差。
第四步:计算每个子集的波动范围和标准差。
第五步:对每个子集的波动范围进行标准化,得到重标极差。
第六步:计算不同长度的重标极差均值。
第七步:增大子集长度,重复前六步。
第八步:使用Hurst指数定义,进行双对数回归,得到斜率作为Hurst指数。
Hurst指数描述的是时间跨度和重标极差之间的正比关系。通过计算不同时间跨度的重标极差,可以分析收益率序列在不同频率下的自相关性。
随着时间跨度的增加,分析从高频扩展到低频,Hurst指数描述的是从高频到某个特定频率(通常为一年)之间所有频率的收益率序列的相关性。不同频率的收益率自相关性由共同的Hurst指数刻画。
计算Hurst指数时,频率提高意味着更多随机扰动,导致高频收益率之间的相关性降低。因此,更高频率的数据会降低描绘更大频率范围内收益率自相似性的Hurst指数。
关于Hurst指数与分数布朗运动的更多说明,请参阅相关文献。
㈢ 什么是R/S分析法
R/S分析法通常用来分析时间序列的分形特征和长期记忆过程,最初由英国水文学家赫斯特(Hurst,1951年)在研究尼罗河水坝工程时提出的方法。后来,它被用在各种时间序列的分析之中。
曼德尔布罗特(Mandelbrot)在1972年首次将R/S分析应用于美国证券市场,分析股票收益的变化,彼得斯(Peters)把这种方法作为其分形市场假说最重要的研究工具进行了详细的讨论和发展,并做了很多实证研究。R/S分析方法的基本内容是:对于一个时间序列{xt},把它分为N个长度为A的等长子区间,对于每一个子区间,设:
对于独立随机过程的时间序列来说,Vn关于log(n)的曲线是一条直线。如果序列具有状态持续性,即当H>0.5时,Vn关log(n)是向上倾斜的;如果序列具有逆状态持续性,即当H<0.5 时,Vn关于log(n)是向下倾斜的。当Vn 图形形状改变时,就产生了突变,长期记忆消失。因此,用Vn关于log(n)的关系曲线就可以直观地看出一个时间序列某一时刻的值对以后值的影响时间的界限。
为了测算序列对随机游走的偏离,Peters还引入了E(R / S)n统计量,它的计算公式为:
(6)
对于一个时间序列,当H≠0.5时,对应于方差比分析中VR(q)≠1时的情况,收益率不再呈正态分布,时间序列各个观测值之间不是互相独立的,后面的观测值都带着在它之前的观测值的“记忆”,这就是我们所说的长期记忆性,从理论上来说它是存在的。随时间延长,前面观测值对后面观测值影响越来越少。因此,时间序列是一长串相互联系的事件叠加起来的结果。为了描述现在对未来的影响,Mandelbrot引进了一个相关性度量的指标CM,它表示的意思和H是对应的。
CM = 2(2H − 1) − 1(7)
其中CM表示在期间M上的相关性。所以,当H=0.5时,序列不相关;当C>0时,序列正相关;当C<0时,序列负相关。
R/S分析法的实证检验及结果
在检验过程中,我们使用对数收益率,即对502个周收盘价数据按公式(8)进行处理,得到501个数据组成的周收益率序列。为了消除序列的线性依赖,一般分析收益率序列的AR(1)残差,因为线性依赖会使分析偏离Hurst指数或导致第一类错误的发生。以St为因变量,St − 1为自变量,St对St − 1进行回归,就可以得到St的残差序列。
(8)Xt = St − (a + bSt − 1)(9)
按照以上方法,我们用Gauss5.0编写计算机程序进行计算,得到表1的结果。
表1:沪深两市周收益率序列(R/S)n计算结果
n
log(n)
R/S
log(R/S)
E(R/S)
V统计量
R/SE(R/S)上海41.38631.44310.36681.15520.72160.577651.60941.71190.53761.45840.76560.6522102.30263.00251.09942.65030.94950.8381202.99574.80361.56944.32471.07410.9670253.21895.13801.63674.99611.02760.9992503.91208.47172.13677.61851.19811.07741004.605211.64602.455011.31031.16461.13101254.828313.83082.626912.79521.23711.14442505.521520.21013.006218.61381.27821.1772深圳41.38631.45420.37441.15520.72710.577651.60941.72260.54391.45840.77040.6522102.30262.8.04822.65030.90210.8381202.99574.57951.52164.32471.02400.9670253.21895.36731.68034.99611.07350.9992503.91208.58692.15027.61851.21441.07741004.605213.58962.609311.31031.35901.13101254.828314.55472.677912.79521.30181.14442505.521523.60863.161618.61381.49311.1772
表2:沪深两市Hurst指数估算表
区间
截距
Hurst指数
估计的标准差
观察个数
R2
P 值(>F)
CM
上海4≤n≤250-0.42500.63400.073490.99450.00000.2044≤n≤20-0.59660.71160.053040.99380.00020.34125≤n≤250-0.01240.54460.033450.99440.00280.064深圳4≤n≤250-0.51660.67210.038090.99870.00000.2694≤n≤100-0.56840.69430.016970.99970.00000.309
注:因为在深圳证券市场的区间125≤n≤250 内,只有两个观测数据,回归结果不具有现实意义,故未加列示。
按照(4)式分别对沪深两市的log(n)和log(R/S)进行回归,得到上海证券市场的Hurst指数为0.6340,深圳证券市场的Hurst指数为0.6721(表2),都明显大于随机游走假设的临界值0.5,说明沪深两市都存在明显的持久性和分形结构。股票的周收益序列不同于普通的随机游走,是一个有偏的随机游走过程,这是因为序列的前后的记忆性在起作用。
图1、2分别给出了沪深两市V统计量相对于log(n)的变化趋势。因为V统计量是(R/S)n相对于n0.5的变化率,所以当时间序列呈现出持续性(H>0.5)时,比率就会增加,V统计量曲线就会一直上升;如果序列呈现出随机游走(H=0.5)或反持续性(H<0.5),V统计量将大致保持不变或单调下降。所以,V统计量曲线由上升转而为保持大致不变或下降的分界点就是序列长期记忆的消失点。如图1、2所示,沪深两市分别在n=20和n=100处V统计量停止增长,所以,n=20和n=100即为两个市场的分界点。分别就分界点前后的log(n)和log(R/S)序列进行回归,可以计算分界点前后的Hurst指数(表2)。以上海证券市场为例,分界点前,Hurst指数为0.7116,相关系数CM为34.1%,远高于随机游走时的情况;分界点后,Hurst指数仅有0.5446,接近随机游走时的0.5。这表明序列中非周期成分是存在的,分界点处n=20,即20周就是非周期循环的长度。这与文献中对上证综合指数从1990.3.26至1999.3.26间的周收益率进行分析所得结果是相同的。同样,100周则是深圳证券市场的非周期循环的长度。文献中,对深证1991年—1998年的日收益率进行了R/S分析,虽然计算出Hurst指数为0.643,大于0.5,但没有得出深证的非周期循环的长度,这可能与样本期太短有关,由这里的结果来看,说明深证的非周期循环的长度确实比上证要长得多。
参考文献
㈣ 几何布朗运动和分数布朗运动有什么区别
几何布朗运动 (GBM) (也叫做指数布朗运动) 是连续时间情况下的随机过程,其中随机变量的对数遵循布朗运动,[1] also called aWiener process.几何布朗运动在金融数学中有所应用,用来在布莱克-舒尔斯定价模型中模仿股票价格。
分数布朗运动
世界是非线性的,宇宙万物绝大部分不是有序的、线性的、稳定的,而是混沌的、非线性的、非稳定和涨落不定的沸腾世界。有序的、线性的、稳定的只存在于我们自己构造的理论宫殿,而现实宇宙充满了分形。在股票市场的价格波动、心率及脑波的波动、电子元器件中的噪声、自然地貌等大量的自然现象和社会现象中存在着一类近乎全随机的现象,它们具有如下特性:在时域或空域上有自相似性和长时相关性和继承性;在频域上,其功率谱密度在一定频率范围内基本符合1/f的多项式衰减规律。因此被称为1/f族随机过程。Benoit Mandelbrot和Van Ness 提出的分数布朗运动(fractional Brownian motion,FBM)模型是使用最广泛的一种,它具有自相似性、非平稳性两个重要性质,是许多自然现象和社会现象的内在特性。分数布朗运动被赋予不同的名称,如分形布朗运动、有偏的随机游走(Biased Random walk)、分形时间序列(Fractional time serial)、分形维纳过程等。其定义如下:
设0<H<1,Hurst参数为H的分数布朗运动为一连续Gaussian过程,且 ,协方差为 。H=1/2时, 即为标准布朗运动 。
分数布朗运动特征是时间相关函数C(t)≠0,即有持久性或反持久性,或者说有“长程相关性”,不失一般性,可以给出一维情形的布朗运动及分数布朗运动的定义。分数布朗运动既不是马尔科夫过程,又不是半鞅,所以不能用通常的随机来分析。分数布朗运动与布朗运动之间的主要区别为:分数布朗运动中的增量是不独立的,而布朗运动中的增量是独立的;分数布朗运动的深层次上和布朗运动的层次上它们的分维值是不同的,分数布朗运动(分形噪声)的分维值alpha等于1/H,H为Hurst指数,而布朗运动(白噪声)的分维值都是2。
Hurst在一系列的实证研究中发现,自然现象都遵循“有偏随机游走”,即一个趋势加上噪声,并由此提出了重标极差分析法(Rescaled Range Analysis,R/S分析)。设R/S表示重标极差,N表示观察次数,a是固定常数,H表示赫斯特指数,在长达40多年的研究中,通过大量的实证研究,赫斯特建立了以下关系:
R/S=(aN)H
通过对上式取对数,可得:
log(R/S)=H(logN十loga)
只要找出R/S关于N的log/log图的斜率,就可以来估计H的值。 Hurst指数H用来度量序列相关性和趋势强度:当H=0.5时,标准布朗运动,时间序列服从随机漫步;当H≠0.5时,C(t)≠0,且与时间无关,正是分数布朗运动的特征。当0.5<H<1时,序列是趋势增强的,遵循有偏随机游走过程;当0<H<0.5时,序列是反持续性的。可以看出,Hurst指数能够很好地刻画证券市场的波动特征,将R/S分析应用于金融市场,可以判断收益率序列是否具有记忆性,记忆性是持续性的还是反持续性的。所以,分数布朗运动是复杂系统科学体系下的数理金融学的一个合适的工具,作为对描述金融市场价格波动行为模型的维纳过程的一般化、深刻化具有重要的理论与现实意义。