❶ 大数据股票有哪些
大数据概念股 : 就主题投资而言,"大数据"概念2012年有望成为具有较强冲击力的新主题,大数据概念实际上是从海量数据有效利用的角度对云计算、物联网等概念的综合,更加准确地抓住了云计算、物联网的本质,以数据处理和数据中心建设与运维为主要业务的公司是最为贴切的投资标的。 "大数据"产业链条包含了从数据生成、数据存储、数据处理和数据展示等多个环节。完整的生态系统还应当包括大数据处理结果的应用。 "大数据"时代更多的商机来自于应用,我们认为国内企业有机会获得较大的发展空间。与大数据相关的投资标的有以下几类。 第一类是与海量数据的存储和处理相关的公司,关注拓尔思、美亚柏科、恒泰艾普、潜能恒信、天泽信息。 第二类是与数据中心建设与运营维护相关的公司,包括荣之联、天玑科技、银信科技。 第三类是与视频化应用相关的公司,包括视频监控业务为主的海康威视、大华股份、威创股份、华平股份。 第四类是与智能化和人机交互概念相关的公司,关注科大讯飞、用友软件、东方国信等。 (南方股票频道)
❷ 统计学在股票中的应用有那些方面
股票价格指数(以下有时简称股价指数)是我们统计学里指数中的一种。它反映一定时期内某一证券市场上股票价格的综合变动方向和程度的动态相对数。由于政治经济,市场及心理等各种因素的影响,每种股票的价格均处于不断变动之中;而市场上每时每刻都有许多股票在进行交易。为了从众多个别股票纷繁复杂的价格变动中判断和把握整个股票市场的价格变动水平与变动趋势,美国道.琼斯公司的创始人之一查尔斯.亨利.道第一个提出了平均股票价格指数作为衡量尺度,这就是久负盛名的道.琼斯平均股价指数。如今,世界各国的股价市场几乎都编有股票价格指数,较有影响的除道.琼斯指数以外,还有美国的标准.普尔股价指数(有时记为S&P500指数)、纽约证券交易所票价指数,英国的《金融时报》股价指数、日本的经济新闻社道氏平均股价指数以及香港的恒生指数等。股价指数可以为投资者和分析家研究,判断股市动态提供信息。它不仅反映股票市场行情变动的重要指标,而且是观测经济形势和周期状况参考指标,被视为股市行情的“指示器”和经济景气变化的“晴雨表”。在我国大陆,主要有上证指数和深证指数。
编制股票价格指数的意义在于
(1)综合反映股票市场股票价格的变动方向和变动程度。(2)据此进行因素分析,分析各种股价对股票市场股价总水平的影响程度。(3)分析股价长期内的变动趋势。(4)在宏观上,股指可以预测国民经济景气情况和企业经营业绩。
(一)股票价格指数的一般概念
1.股价平均数:它是用来反映多种股票价格变动的一般水平。股票价格平均数由证券交易所、金融服务公司、银行或新闻机构编制的,用以反映证券市场股票价格行市变动的一种价格平均数。
由于股票市场上各上市公司股票价格变动的方向和幅度不可能一致,为了衡量由各种股票共同组成的大市整体价格水平和整个市场总体变动方向,一些组织开始编制了股票价格平均数。1981年6月,“道.琼斯公司”的共同创立者之一——查尔斯.亨利.道在《客户午后通讯》上首先发表了一组后来被称为“道.琼斯工业股股票价格平均数”,是世界上最早的股票价格平均数,一般计算步骤是:先选定一些有代表性的样本公司,再通过简单算术平均法,以这些公司股票收盘价之和除以样本公司数得出。计算公式为:
P=(ΣPi)/N
其中,P代表股票价格平均数,N代表样本公司个数,Pi代表第i家公司股票计算期的收盘价。
2.基期:指在编制股票价格指数时,被确定作为对比基础的时期。这个时期可以是某一日,也可以是某一年或若干年。例如,意大利商业银行股票价格指数基期是一年,即以某一年全年股票价格平均数作为对比的基础;标准.普尔500种和400种工业股股价指数则以1941—1943年为基期。通常较多采用以某一日作为计算基期。由于股票价格指数是由现期水平同基期水平相比较得出,因此,基期的选择对指数绝对数大小具有重要影响。影响股票价格指数绝对水平大小的另一个重要因素是基数。
3.基数:指股票价格指数在基期的数值。在大多数国家中,基数都定为100,也有定为10(如标准.普尔500种股票价格指数)、50(如纽约证券交易所综合股价指数),还有的定为500(如澳大利亚证券交易所有普通股股价指数)、1000(如香港远东指数,加拿大多伦多300种股票价格综合指数)等。基数有大小,对股票价格指数绝对数大小有重要影响。
4.点:是股票价格指数的计算单位,在采用股票价格平均数和股票价格指数衡量股市行情变动的情况下,作为计算单位的“点”具有不同含义。在前一情况下,“点”代表的是平均水平的价格单位,是一个金额概念,同货币单位(如元)在类似的含义上运用,如平均价格指数为150点,即意味着市场上股票价格的平均水平为150元。在后一情况下,“点”反映的是计算期价格水平相对于基期价格水平变动的幅度,是指“百分点”(或“千分点”等)的意思,一般不能直接同金额概念等同起来,如基期指数定为100点,计算期指数为150点,即意味着计算期股票价格水平是基期水平的150%。但无论在任何场合,“点”总是衡量股票价格行情起落变动的尺度。由于世界各国的股票市场都编制有若干不同的股票价格指数,其选定的基期、确定的基数不同,尤其是计算方法的差异,针对不同股票市场的股票价格指数,与同一股票市场的不同股票价格指数,在绝对数上并没有可比性。但是随着资本主义经济一体化趋势的加强,各国不同股票价格指数变动趋势在一定程度上具有了“联运性”,这一点尤其是在1987年10月的世界股市崩溃时得到了印证。
❸ 如何用大数据炒股
我们如今生活在一个数据爆炸的世界里。网络每天响应超过60亿次的搜索请求,日处理数据超过100PB,相当于6000多座中国国家图书馆的书籍信息量总和。新浪微博每天都会发布上亿条微博。在荒无人烟的郊外,暗藏着无数大公司的信息存储中心,24小时夜以继日地运转着。
克托·迈尔-舍恩伯格在《大数据时代》一书中认为,大数据的核心就是预测,即只要数据丰富到一定程度,就可预测事情发生的可能性。例如,“从一个人乱穿马路时行进的轨迹和速度来看他能及时穿过马路的可能性”,或者通过一个人穿过马路的速度,预测车子何时应该减速从而让他及时穿过马路。
那么,如果把这种预测能力应用在股票投资上,又会如何?
目前,美国已经有许多对冲基金采用大数据技术进行投资,并且收获甚丰。中国的中证广发网络百发100指数基金(下称百发100),上线四个多月以来已上涨68%。
和传统量化投资类似,大数据投资也是依靠模型,但模型里的数据变量几何倍地增加了,在原有的金融结构化数据基础上,增加了社交言论、地理信息、卫星监测等非结构化数据,并且将这些非结构化数据进行量化,从而让模型可以吸收。
由于大数据模型对成本要求极高,业内人士认为,大数据将成为共享平台化的服务,数据和技术相当于食材和锅,基金经理和分析师可以通过平台制作自己的策略。
量化非结构数据
不要小看大数据的本领,正是这项刚刚兴起的技术已经创造了无数“未卜先知”的奇迹。
2014年,网络用大数据技术预测命中了全国18卷中12卷高考作文题目,被网友称为“神预测”。网络公司人士表示,在这个大数据池中,包含互联网积累的用户数据、历年的命题数据以及教育机构对出题方向作出的判断。
在2014年巴西世界杯比赛中,Google亦通过大数据技术成功预测了16强和8强名单。
从当年英格兰报社的信鸽、费城股票交易所的信号灯到报纸电话,再到如今的互联网、云计算、大数据,前沿技术迅速在投资领域落地。在股票策略中,大数据日益崭露头角。
做股票投资策略,需要的大数据可以分为结构化数据和非结构化数据。结构化数据,简单说就是“一堆数字”,通常包括传统量化分析中常用的CPI、PMI、市值、交易量等专业信息;非结构化数据就是社交文字、地理位置、用户行为等“还没有进行量化的信息”。
量化非结构化就是用深度模型替代简单线性模型的过程,其中所涉及的技术包括自然语言处理、语音识别、图像识别等。
金融大数据平台-通联数据CEO王政表示,通联数据采用的非结构化数据可以分为三类:第一类和人相关,包括社交言论、消费、去过的地点等;第二类与物相关,如通过正在行驶的船只和货车判断物联网情况;第三类则是卫星监测的环境信息,包括汽车流、港口装载量、新的建筑开工等情况。
卫星监测信息在美国已被投入使用,2014年Google斥资5亿美元收购了卫星公司Skybox,从而可以获得实施卫星监测信息。
结构化和非结构化数据也常常相互转化。“结构化和非结构化数据可以形象理解成把所有数据装在一个篮子里,根据应用策略不同相互转化。例如,在搜索频率调查中,用户搜索就是结构化数据;在金融策略分析中,用户搜索就是非结构化数据。”网络公司人士表示。
华尔街拿着丰厚薪水的分析师们还不知道,自己的雇主已经将大量资本投向了取代自己的机器。
2014年11月23日,高盛向Kensho公司投资1500万美元,以支持该公司的大数据平台建设。该平台很像iPhone里的Siri,可以快速整合海量数据进行分析,并且回答投资者提出的各种金融问题,例如“下月有飓风,将对美国建材板块造成什么影响?”
在Kensho处理的信息中,有80%是“非结构化”数据,例如政策文件、自然事件、地理环境、科技创新等。这类信息通常是电脑和模型难以消化的。因此,Kensho的CEO Daniel Nadler认为,华尔街过去是基于20%的信息做出100%的决策。
既然说到高盛,顺便提一下,这家华尔街老牌投行如今对大数据可谓青睐有加。除了Kensho,高盛还和Fortress信贷集团在两年前投资了8000万美元给小额融资平台On Deck Capital。这家公司的核心竞争力也是大数据,它利用大数据对中小企业进行分析,从而选出值得投资的企业并以很快的速度为之提供短期贷款。
捕捉市场情绪
上述诸多非结构化数据,归根结底是为了获得一个信息:市场情绪。
在采访中,2013年诺贝尔经济学奖得主罗伯特•席勒的观点被无数采访对象引述。可以说,大数据策略投资的创业者们无一不是席勒的信奉者。
席勒于上世纪80年代设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。
然而,在大数据技术诞生之前,市场情绪始终无法进行量化。
回顾人类股票投资发展史,其实就是将影响股价的因子不断量化的过程。
上世纪70年代以前,股票投资是一种定性的分析,没有数据应用,而是一门主观的艺术。随着电脑的普及,很多人开始研究驱动股价变化的规律,把传统基本面研究方法用模型代替,市盈率、市净率的概念诞生,量化投资由此兴起。
量化投资技术的兴起也带动了一批华尔街大鳄的诞生。例如,巴克莱全球投资者(BGI)在上世纪70年代就以其超越同行的电脑模型成为全球最大的基金管理公司;进入80年代,另一家基金公司文艺复兴(Renaissance)年均回报率在扣除管理费和投资收益分成等费用后仍高达34%,堪称当时最佳的对冲基金,之后十多年该基金资产亦十分稳定。
“从主观判断到量化投资,是从艺术转为科学的过程。”王政表示,上世纪70年代以前一个基本面研究员只能关注20只到50只股票,覆盖面很有限。有了量化模型就可以覆盖所有股票,这就是一个大的飞跃。此外,随着计算机处理能力的发展,信息的用量也有一个飞跃变化。过去看三个指标就够了,现在看的指标越来越多,做出的预测越来越准确。
随着21世纪的到来,量化投资又遇到了新的瓶颈,就是同质化竞争。各家机构的量化模型越来越趋同,导致投资结果同涨同跌。“能否在看到报表数据之前,用更大的数据寻找规律?”这是大数据策略创业者们试图解决的问题。
于是,量化投资的多米诺骨牌终于触碰到了席勒理论的第三层变量——市场情绪。
计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。
基于互联网搜索数据和社交行为的经济预测研究,已逐渐成为一个新的学术热点,并在经济、社会以及健康等领域的研究中取得了一定成果。在资本市场应用上,研究发现搜索数据可有效预测未来股市活跃度(以交易量指标衡量)及股价走势的变化。
海外就有学术研究指出,公司的名称或者相关关键词的搜索量,与该公司的股票交易量正相关。德国科学家Tobias Preis就进行了如此研究:Tobias利用谷歌搜索引擎和谷歌趋势(Google Trends),以美国标普500指数的500只股票为其样本,以2004年至2010年为观察区间,发现谷歌趋势数据的公司名称搜索量和对应股票的交易量,在每周一次的时间尺度上有高度关联性。也就是说,当某个公司名称在谷歌的搜索量活动增加时,无论股票的价格是上涨或者下跌,股票成交量与搜索量增加;反之亦然,搜索量下降,股票成交量下降。以标普500指数的样本股为基础,依据上述策略构建的模拟投资组合在六年的时间内获得了高达329%的累计收益。
在美国市场上,还有多家私募对冲基金利用Twitter和Facebook的社交数据作为反映投资者情绪和市场趋势的因子,构建对冲投资策略。利用互联网大数据进行投资策略和工具的开发已经成为世界金融投资领域的新热点。
保罗·霍丁管理的对冲基金Derwent成立于2011年5月,注册在开曼群岛,初始规模约为4000万美元, 2013年投资收益高达23.77%。该基金的投资标的包括流动性较好的股票及股票指数产品。
通联数据董事长肖风在《投资革命》中写道,Derwent的投资策略是通过实时跟踪Twitter用户的情绪,以此感知市场参与者的“贪婪与恐惧”,从而判断市场涨跌来获利。
在Derwent的网页上可以看到这样一句话:“用实时的社交媒体解码暗藏的交易机会。”保罗·霍丁在基金宣传册中表示:“多年以来,投资者已经普遍接受一种观点,即恐惧和贪婪是金融市场的驱动力。但是以前人们没有技术或数据来对人类情感进行量化。这是第四维。Derwent就是要通过即时关注Twitter中的公众情绪,指导投资。”
另一家位于美国加州的对冲基金MarketPsych与汤普森·路透合作提供了分布在119个国家不低于18864项独立指数,比如每分钟更新的心情状态(包括乐观、忧郁、快乐、害怕、生气,甚至还包括创新、诉讼及冲突情况等),而这些指数都是通过分析Twitter的数据文本,作为股市投资的信号。
此类基金还在不断涌现。金融危机后,几个台湾年轻人在波士顿组建了一家名为FlyBerry的对冲基金,口号是“Modeling the World(把世界建模)”。它的投资理念全部依托大数据技术,通过监测市场舆论和行为,对投资做出秒速判断。
关于社交媒体信息的量化应用,在股票投资之外的领域也很常见:Twitter自己也十分注重信息的开发挖掘,它与DataSift和Gnip两家公司达成了一项出售数据访问权限的协议,销售人们的想法、情绪和沟通数据,从而作为顾客的反馈意见汇总后对商业营销活动的效果进行判断。从事类似工作的公司还有DMetics,它通过对人们的购物行为进行分析,寻找影响消费者最终选择的细微原因。
回到股票世界,利用社交媒体信息做投资的公司还有StockTwits。打开这家网站,首先映入眼帘的宣传语是“看看投资者和交易员此刻正如何讨论你的股票”。正如其名,这家网站相当于“股票界的Twitter”,主要面向分析师、媒体和投资者。它通过机器和人工相结合的手段,将关于股票和市场的信息整理为140字以内的短消息供用户参考。
此外,StockTwits还整合了社交功能,并作为插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,让人们可以轻易分享投资信息。
另一家公司Market Prophit也很有趣。这家网站的宣传语是“从社交媒体噪音中提炼市场信号”。和StockTwits相比,Market Prophit更加注重大数据的应用。它采用了先进的语义分析法,可以将Twitter里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资建议。网站还根据语义量化,每天公布前十名和后十名的股票热度榜单。网站还设计了“热度地图”功能,根据投资者情绪和意见,按照不同板块,将板块内的个股按照颜色深浅进行标注,谁涨谁跌一目了然。
中国原创大数据指数
尽管大数据策略投资在美国貌似炙手可热,但事实上,其应用尚仅限于中小型对冲基金和创业平台公司。大数据策略投资第一次被大规模应用,应归于中国的百发100。
网络金融中心相关负责人表示,与欧美等成熟资本市场主要由理性机构投资者构成相比,东亚尤其是中国的股票类证券投资市场仍以散户为主,因此市场受投资者情绪和宏观政策性因素影响很大。而个人投资者行为可以更多地反映在互联网用户行为大数据上,从而为有效地预测市场情绪和趋势提供了可能。这也就是中国国内公募基金在应用互联网大数据投资方面比海外市场并不落后、甚至领先的原因。
百发100指数由网络、中证指数公司、广发基金联合研发推出,于2014年7月8日正式对市场发布,实盘运行以来一路上涨,涨幅超过60%。跟踪该指数的指数基金规模上限为30亿份,2014年9月17日正式获批,10月20日发行时一度创下26小时疯卖18亿份的“神话”。
外界都知道百发100是依托大数据的指数基金,但其背后的细节鲜为人知。
百发100数据层面的分析分为两个层面,即数据工厂的数据归集和数据处理系统的数据分析。其中数据工厂负责大数据的收集分析,例如将来源于互联网的非结构化数据进行指标化、产品化等数据量化过程;数据处理系统,可以在数据工厂递交的大数据中寻找相互统计关联,提取有效信息,最终应用于策略投资。
“其实百发100是在传统量化投资技术上融合了基于互联网大数据的市场走势和投资情绪判断。”业内人士概括道。
和传统量化投资类似,百发100对样本股的甄选要考虑财务因子、基本面因子和动量因子,包括净资产收益率(ROE)、资产收益率(ROA)、每股收益增长率(EPS)、流动负债比率、企业价值倍数(EV/EBITDA)、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的个股价格收益率和波动率等。
此外,市场走势和投资情绪是在传统量化策略基础上的创新产物,也是百发100的核心竞争力。接近网络的人士称,市场情绪因子对百发100基金起决定性作用。
网络金融中心相关负责人是罗伯特•席勒观点的支持者。他认为,投资者行为和情绪对资产价格、市场走势有着巨大的影响。因此“通过互联网用户行为大数据反映的投资市场情绪、宏观经济预期和走势,成为百发100指数模型引入大数据因子的重点”。
传统量化投资主要着眼点在于对专业化金融市场基本面和交易数据的应用。但在网络金融中心相关业务负责人看来,无论是来源于专业金融市场的结构化数据,还是来源于互联网的非结构化数据,都是可以利用的数据资源。因此,前文所述的市场情绪数据,包括来源于互联网的用户行为、搜索量、市场舆情、宏观基本面预期等等,都被网络“变废为宝”,从而通过互联网找到投资者参与特征,选出投资者关注度较高的股票。
“与同期沪深300指数的表现相较,百发100更能在股票市场振荡时期、行业轮动剧烈时期、基本面不明朗时期抓住市场热点、了解投资者情绪、抗击投资波动风险。”网络金融中心相关负责人表示。
百发100选取的100只样本股更换频率是一个月,调整时间为每月第三周的周五。
业内人士指出,百发100指数的月收益率与中证100、沪深300、中证500的相关性依次提升,说明其投资风格偏向中小盘。
但事实并非如此。从样本股的构成来说,以某一期样本股为例,样本股总市值6700亿元,占A股市值4.7%。样本股的构成上,中小板21只,创业板4只,其余75只样本股均为大盘股。由此可见,百发100还是偏向大盘为主、反映主流市场走势。
样本股每个月的改变比例都不同,最极端的时候曾经有60%进行了换仓。用大数据预测热点变化,市场热点往往更迭很快;但同时也要考虑交易成本。两方面考虑,网络最后测算认为一个月换一次仓位为最佳。
样本股对百发100而言是核心机密——据说“全世界只有基金经理和指数编制机构负责人两个人知道”——都是由机器决定后,基金经理分配给不同的交易员建仓买入。基金经理也没有改变样本股的权利。
展望未来,网络金融中心相关负责人踌躇满志,“百发100指数及基金的推出,只是我们的开端和尝试,未来将形成多样化、系列投资产品。”
除了百发100,目前市场上打着大数据旗帜的基金还有2014年9月推出的南方-新浪I100和I300指数基金。
南方-新浪I100和I300是由南方基金、新浪财经和深圳证券信息公司三方联合编制的。和百发100类似,也是按照财务因子和市场情绪因子进行模型打分,按照分值将前100和前300名股票构成样本股。推出至今,这两个指数基金分别上涨了10%左右。
正如百发100的市场情绪因子来自网络,南方-新浪I100和I300的市场情绪因子全部来自新浪平台。其中包括用户在新浪财经对行情的访问热度、对股票的搜索热度;用户在新浪财经对股票相关新闻的浏览热度;股票相关微博的多空分析数据等。
此外,阿里巴巴旗下的天弘基金也有意在大数据策略上做文章。据了解,天弘基金将和阿里巴巴合作,推出大数据基金产品,最早将于2015年初问世。
天弘基金机构产品部总经理刘燕曾对媒体表示,“在传统的调研上,大数据将贡献于基础资产的研究,而以往过度依赖线下研究报告。大数据将视野拓展至了线上的数据分析,给基金经理选股带来新的逻辑。”
在BAT三巨头中,腾讯其实是最早推出指数基金的。腾讯与中证指数公司、济安金信公司合作开发的“中证腾安价值100指数”早在2013年5月就发布了,号称是国内第一家由互联网媒体与专业机构编制发布的A股指数。不过,业内人士表示,有关指数并没有真正应用大数据技术。虽然腾讯旗下的微信是目前最热的社交平台,蕴藏了大量的社交数据,但腾讯未来怎么开发,目前还并不清晰。
大数据投资平台化
中欧商学院副教授陈威如在其《平台战略》一书中提到,21世纪将成为一道分水岭,人类商业行为将全面普及平台模式,大数据金融也不例外。
然而,由于大数据模型对成本要求极高,就好比不可能每家公司都搭建自己的云计算系统一样,让每家机构自己建设大数据模型,从数据来源和处理技术方面看都是不现实的。业内人士认为,大数据未来必将成为平台化的服务。
目前,阿里、网络等企业都表示下一步方向是平台化。
蚂蚁金服所致力搭建的平台,一方面包括招财宝一类的金融产品平台,另一方面包括云计算、大数据服务平台。蚂蚁金服人士说,“我们很清楚自己的优势不是金融,而是包括电商、云计算、大数据等技术。蚂蚁金服希望用这些技术搭建一个基础平台,把这些能力开放出去,供金融机构使用。”
网络亦是如此。接近网络的人士称,未来是否向平台化发展,目前还在讨论中,但可以确定的是,“网络不是金融机构,目的不是发产品,百发100的意义在于打造影响力,而非经济效益。”
当BAT还在摸索前行时,已有嗅觉灵敏者抢占了先机,那就是通联数据。
通联数据股份公司(DataYes)由曾任博时基金副董事长肖风带队创建、万向集团投资成立,总部位于上海,公司愿景是“让投资更容易,用金融服务云平台提升投资管理效率和投研能力”。该平台7月上线公测,目前已拥有130多家机构客户,逾万名个人投资者。
通联数据目前有四个主要平台,分别是通联智能投资研究平台、通联金融大数据服务平台、通联多资产投资管理平台和金融移动办公平台。
通联智能投资研究平台包括雅典娜-智能事件研究、策略研究、智能研报三款产品,可以对基于自然语言的智能事件进行策略分析,实时跟踪市场热点,捕捉市场情绪。可以说,和百发100类似,其核心技术在于将互联网非结构化数据的量化使用。
通联金融大数据服务平台更侧重于专业金融数据的分析整理。它可以提供公司基本面数据、国内外主要证券、期货交易所的行情数据、公司公告数据、公关经济、行业动态的结构化数据、金融新闻和舆情的非结构化数据等。
假如将上述两个平台比作“收割机”,通联多资产投资管理平台就是“厨房”。在这个“厨房”里,可以进行全球跨资产的投资组合管理方案、订单管理方案、资产证券化定价分析方案等。
通联数据可以按照主题热点或者自定义关键字进行分析,构建知识图谱,将相关的新闻和股票提取做成简洁的分析框架。例如用户对特斯拉感兴趣,就可以通过主题热点看到和特斯拉相关的公司,并判断这个概念是否值得投资。“过去这个搜集过程要花费几天时间,现在只需要几分钟就可以完成。”王政表示。
“通联数据就好比一家餐馆,我们把所有原料搜集来、清洗好、准备好,同时准备了一个锅,也就是大数据存储平台。研究员和基金经理像厨师一样,用原料、工具去‘烹制’自己的策略。”王政形容道。
大数据在平台上扮演的角色,就是寻找关联关系。人类总是习惯首先构建因果关系,继而去倒推和佐证。机器学习则不然,它可以在海量数据中查获超越人类想象的关联关系。正如维克托`迈尔-舍恩伯格在《大数据时代》中所提到的,社会需要放弃它对因果关系的渴求,而仅需关注相互关系。
例如,美国超市沃尔玛通过大数据分析,发现飓风用品和蛋挞摆在一起可以提高销量,并由此创造了颇大的经济效益。如果没有大数据技术,谁能将这毫无关联的两件商品联系在一起?
通联数据通过机器学习,也能找到传统量化策略无法发现的市场联系。其中包括各家公司之间的资本关系、产品关系、竞争关系、上下游关系,也包括人与人之间的关系,例如管理团队和其他公司有没有关联,是否牵扯合作等。
未来量化研究员是否将成为一个被淘汰的职业?目前研究员的主要工作就是收集整理数据,变成投资决策,而之后这个工作将更多由机器完成。
“当初医疗科技发展时,人们也认为医生会被淘汰,但其实并不会。同理,研究员也会一直存在,但他们会更注重深入分析和调研,初级的数据搜集可以交给机器完成。”王政表示。
但当未来大数据平台并广泛应用后,是否会迅速挤压套利空间?这也是一个问题。回答根据网上资料整理
❹ 大数据相关概念股票有哪些
1、拓尔思( 300229 )。北京拓尔思信息技术股份有限公司是第一家在A股上市的大数据技术企业,公司资产近20亿元人民币。
公司已在全国主要中心城市设立了分公司或办事处。自主研发的TRS系列产品和服务已被国内外4000多家企业级机构客户广泛使用,在中国非结构化中文信息智能应用软件市场的占有率位居第一。大数据技术领先,长期价值凸显,大数据处理技术业内领先,技术完善产品市场空间广阔。
2、科华恒盛( 002335 )。厦门科华恒盛股份有限公司成立于1999年,是一家以研究电力电子技术为核心的高科技企业,是中国本土最大的高端UPS电源制造商与提供商。
科华定位“数据中心基础设施解决方案提供商”,在中大型数据中心市场打破外资垄断优势,实现高端突破。即使2016年占数据中心市场10%份额,也有2倍以上成长空间。
3、万达信息( 300168 )。万达信息是以公共事务为核心的城市信息化领域的软件和服务提供商,依托在大型应用软件开发、复杂系统集成和先进软件架构等方面的领先水平,公司已发展成为国内城市信息化领域的领先企业。
4、榕基软件( 002474 )。榕基软件成立于1993年10月,2007年10月整体改制变更为股份有限公司。公司专注于发展软件产品的开发和销售、计算机系统集成及技术支持和服务业务,是行业内取得资质和认证种类最齐全、等级最高的企业之一。
5、太极股份(政务云服务及政务大数据服务优质运营商)
6、汉得信息(智能制造应用软件服务商)
7、启明星辰(信息安全龙头企业,核心客户集中于党政军领域,全面布局城市级安全运营中心)
❺ 如何使用统计学方法和机器学习技术来预测未来股市的走势
预测未来股市的走势是一个非常复杂的问题,需要综合运用统计学方法和机器学习技术。以下是一些方法:
1.基于时间序列分析的方法:通过对历史股市数据的分析,构建时间序列模型,预测未来的价格、波动率等指标。
2.基于神经网络的方法:将历史股市数据作为输入,训练神经网络模型,以预测未来的价格、涨跌等指标。
3.基于支持向量机的方法:利用支持向量机算法建立分类模型衫则,根据历史数据和市场指标,将股票分为涨和跌两类,以预测未来的走势。
4.基于深度学习的方法:如基于卷积神经网络的技术,可以从股市数据中提取特游滑征,进行分析和预测。
5.基于贝叶斯模型的方法:利用贝叶斯理论,将历史数据和市场指标进行概率建模,以预测未来的股市走势。
需要注意的是,股市走势的预测或磨棚具有不确定性和风险,需要谨慎处理。
❻ 什么是大数据概念股票中国A股有哪些大数据概念股
英国作家菲利普?鲍尔(Philip Ball)在《预知社会:群体行为的内在法则》一书阐述了一种观点,即个体行为是无法预知的,但当个体数量达到一定程度时,群体行为往往会表现出一定规律,通过统计物理和生物化学中的种种自然规律,可大致预知社会群体行为的运行法则。
数年来这个困惑一直存在。不久前,IBM技术创新全球副总裁伯纳德?梅耶森博士(Dr.Bernard S.Meyerson)的一篇演讲令笔者产生了醍醐灌顶之感。
梅耶森博士在演讲中表示,
这是个很诱人的话题。早在原始社会时期,能比常人早知道天气变化规律,用于指导生产劳作,就有可能成为部落巫师甚至是首领。而巫师未必真具有法力,或许只是比常人掌握了更高层次的知识而已,同时利用了这种信息判断能力的不对称。之后算命这个行当经久不息,也大致继承于此。而当代社会热衷的分析预测,不过也是巫师算命的行当罢了。可以说,任何成功的预测,都是基于对大量有效信息的掌握和准确分析。
基于大数据的智慧产业的重要意义在于,可以更准确地把握市场需求和预测社会群体行为,在此基础上优化各个产业企业环节的生产效率,并以此提升整个社会的生产力。
人类从狩猎到耕种,是利用了土地资源升级了社会生产力;进入工业时代,是利用机器解放了人类的双手升级了社会生产力;电子通信和互联网的出现,大大提升了全球资讯的使用效用,并以此进一步提升了社会生产力。在经历了2008年金融危机后,在欧债危机的影响下,下一个产业升级出自于哪里众说纷纭,而智慧产业很可能成为下一个产业革命的关键。
以工业企业为例,对于社会信息的有效掌握和分析,有助于企业准确把握市场下一个热点或趋势,降低创新过程中的失败概率,也有助于提升企业在市场营销和销售过程中的效率,避免泛广告投放的效率低下。反之,作为消费者,也会更有效率地找到自己想要的商品。现在网购平台构建的你可能喜欢的产品功能,就是这种效率提升的初级应用。
大数据产业链有很多环节,未来都可能面临较大的发展机遇。首先,信息数据产生将会是第一个环节。
信息的产生很好理解,比如,现在公众每天使用的互联网和无限通讯,即时通讯、微博、手机电话、短信、彩信甚至是每一个互联网点击(通过点击习惯可以分析经常浏览某类网站,喜欢某类商品,以及上网时间等使用习惯),都是数据的产生。现在数据产生最多的领域是物联网,根据IBM的分析,上网人数和手机人数在过去最多是2-5倍的增长,而物联网上连接设备的数量在过去5年增加了2000倍。上述领域拥有大量的数据,企业可以依靠这些数据,或进行分析自我提升效率,或出售这些数据(当然,前提是不涉及个人私密信息的数据)给专业分析机构。其次,信息数据的大量产生需要存储。
存储设备领域的增长潜力同样不容忽视。虽然存储设备是整个产业链中技术含量最少的,同时发展空间也可能没有其他子行业充满想象力,但却可能是增长最稳定的子行业。再次,信息数据需要采集整理。
这个环节是整个大数据产业链的最末端,也可能是最具技术含量和产业附加值的子行业。任何数据不经过分析这一环节,都无法落实到实际应用。而且,在同样的数据面前,谁分析出的结果最有效,将决定谁才是真正的大数据智能产业领跑者。
因此,挖掘A股上市公司中的
大数据概念股
(在中国大数据成熟之前,相信会有不少个股仅属于概念股)显得至关重要。
在国金证券、中信证券和光大证券等研究机构的报告中,确实有不少上市公司被列入大数据关注标的。这三家机构选出的标的有:
超图软件、科大讯飞、拓尔思、汉得信息、太极股份、用友软件、东方国信、久其软件、广联达、大智慧、四维图新、威创股份、卫士通、天玑科技、远光软件、美亚柏科、恒泰艾普、华胜天成等。
中国大数据时代还刚刚开启,上述这些上市公司中,谁是真正的大数据受益股,谁压根就想不到进入大数据领域,又或者谁真正拥有大数据所需的技术优势,还得是骡子是马拉出来溜溜。
不过,在大数据浪潮下,相信上述上市公司中会有真正的受益者脱颍而出,但究竟是谁这需要投资者密切跟踪和下功夫研究了。
❼ 统计学中股市变动属于什么变动
属于波动性变动。
在社会主义市场经济条件下,股票日益深入人们的日常经济生活。只有从历史和发展的角度辩证、科学地看待股票与统计的关系,才能更好地运用统计知识研究股票市场的变化规律,从而增加组织和个人收入,促进社会的更大发展
拓展资料
一、股票在现实中的意义
几乎所有关于市场的学术研究都涉及股票收益。波动性是金融市场最重要的特征之一。一方面,它直接关系到市场的不确定性和风险,是反映金融市场质量和效率的指标之一;另一方面,波动率也是投资组合理论、资本资产定价模型和套利定价模型的核心变量。
二、对我国股市波动性的统计分析
衡量中国股市波动性的指标很多。本文选取了对股票市场波动性分析有较大影响的两个指标,即股票价格指数和股票价格幅度。前者综合反映了股票价格水平和价格变化,后者可以反映股票价格或股票价格指数的波动。纵观世界股票市场的发展历史,不难发现,股票市场的异常波动和市场运行是不可避免的现象。股票价格的波动与投资者在股票市场的投资密切相关。市场总是恰当地反映各种经济信息,并以股价波动的形式表现出来。
三、分析结论及投资建议
根据对中国股市波动的统计分析可以看出,中国股市具有非常鲜明的特点:两市综合指数波动幅度较大,但逐渐放缓;股票市场波动频率高;交易量随着股市的上涨而逐渐扩大,随着股市的下跌而减少;存货的年周转率太高。年周转率是年周转率与平均市场资本的比率,是市场流动性的一个指标。成交量过大,说明市场投机过度。
首先,我想我们都知道统计学是收集、分析、表达和解释数据的科学和艺术。特别是在商业和经济活动中,统计可以更好地帮助管理者和决策者了解商业和经济环境的变化,从而做出更科学、更正确的决策。我个人认为,统计在金融业中发挥着不可替代的作用,它在股市中的作用不容低估。
❽ 股票怎样区间统计
在K线图和分时图里都能统计区间内的涨跌、振幅、换手等数据,帮助投资者迅速地统计出一个股票在一段时间内的各项数据,而且还提供阶段统计表格,这样就能对一个时间段内的数据在不同股票之间进行排序、比较。点击“工具”菜单下的“区间统计”,鼠标变成“统计”字样,按住鼠标左键,点住测量起点拖动到终点,就会拉出一个框,系统将对这个框所对应时间段里股票的涨跌幅、总成交量、换手率等指标做出统计,让您简单、快捷地分析股票的走势。在出现“区间统计表格”之后只用在空白处点击鼠标,表格就会自动消失。鼠标点中起点或者终点的边框线上,“区间统计表格”又会出现。点中起点或者终点边框线,点击鼠标右键选择“删除”即可删除。“区间统计”功能在分时走势页面和技术分析页面都可以使用。在K线图页面使用鼠标右键拖动也可以选择使用“区间统计”功能,还有一个“放大”K线的功能。在分时图使用鼠标右键拖动则只实现“区间统计”功能。
技术分析是指以市场行为为研究对象,以判断市场趋势并跟随趋势的周期性变化来进行股票及一切金融衍生物交易决策的方法的总和。技术分析认为市场行为包容消化一切信息、价格以趋势方式波动、历史会重演。
自股票市场产生以来,人们就开始了对于股票投资理论的探索,形成了多种多样的理论成果。实际上,技术分析是100多年前蒙昧时期创建的股票投资理论( Stock Investment Theory),是精明的投资者对股价变化进行长期观察并积累经验,逐步归纳总结出来的有关股市波动的若干所谓的“规律”。
经过长期发展和演变,技术分析形成了众多的门类,其中有代表性的是道氏理论和波浪理论。