① 大数据时代应该如何投资股票
给一篇关于【如何使用大数据进行A股行业投资】的教程给你参考一下~
好的投资,首先是选好行业
红杉资本曾经有一条着名的投资经验,大意是:好的投资,首先是选好赛道,其次是赛道上的选手。对于每天活跃于资本市场上的投资者而言,赛道所指的正是你正在投资、或者将要投资的那家公司它所在的行业,更直接的说,你投资于什么行业,投资于这个行业的哪家公司,决定了你最终能获得什么样的收益表现。
那么,红杉资本的这条投资经验是否适用于A股市场,并给我们带来可观的投资收益呢?本文试图通过量化分析和交易回测来验证这一投资模式是否真正有效,所采用的数据取自于聚宽数据出品的JQData本地量化金融数据,通过梳理出自2010年以来A股市场上不同行业的发展情况,进一步构建出一个优质行业龙头组合,观察其从2015年股灾至今的收益表现。最终发现,这样一个优质行业的龙头组合,从股灾至今大幅跑赢了上证指数和沪深300指数高达30%的以上的收益率,可以说是超乎预期的。以下是具体分析过程。
2010 ~ 2017 沪深A股各行业量化分析
在开始各行业的量化分析之前,我们需要先弄清楚两个问题:
第一,A股市场上都有哪些行业;
第二,各行业自2010年以来的营收、净利润增速表现如何?
第一个问题:
很好回答,我们使用JQData提供的获取行业成分股的方法,输入get_instries(name='sw_l1')
得到申万一级行业分类结果如下:它们分别是:【农林牧渔、采掘、化工、钢铁、有色金属、电子、家用电器、食品饮料、纺织服装、轻工制造、医药生物、公用事业、交通运输、房地产、商业贸易、休闲服务、综合、建筑材料、建筑装饰、电器设备、国防军工、计算机、传媒、通信、银行、非银金融、汽车、机械设备】共计28个行业。
第二个问题:
要知道各行业自2010年以来的营收、净利润增速表现,我们首先需要知道各行业在各个年度都有哪些成分股,然后加总该行业在该年度各成分股的总营收和净利润,就能得到整个行业在该年度的总营收和总利润了。这部分数据JQData也为我们提供了方便的接口:通过调用get_instry_stocks(instry_code=‘行业编码’, date=‘统计日期’),获取申万一级行业指定日期下的行业成分股列表,然后再调用查询财务的数据接口:get_fundamentals(query_object=‘query_object’, statDate=year)来获取各个成分股在对应年度的总营收和净利润,最后通过加总得到整个行业的总营收和总利润。这里为了避免非经常性损益的影响,我们对净利润指标最终选取的扣除非经常性损益的净利润数据。
我们已经获取到想要的行业数据了。接下来,我们需要进一步分析,这些行业都有什么样的增长特征。
我们发现,在28个申万一级行业中,有18个行业自2010年以来在总营收方面保持了持续稳定的增长。它们分别是:【农林牧渔,电子,食品饮料,纺织服装,轻工制造,医药生物,公用事业,交通运输,房地产,休闲服务,建筑装饰,电气设备,国防军工,计算机,传媒,通信,银行,汽车】;其他行业在该时间范围内出现了不同程度的负增长。
那么,自2010年以来净利润保持持续增长的行业又会是哪些呢?结果是只有5个行业保持了基业长青,他们分别是医药生物,建筑装饰,电气设备,银行和汽车。(注:由于申万行业在2014年发生过一次大的调整,建筑装饰,电气设备,银行和汽车实际从2014年才开始统计。)
从上面的分析结果可以看到,真正能够保持持续稳定增长的行业并不多,如果以扣非净利润为标准,那么只有医药生物,建筑装饰,电气设备,银行和汽车这五个行业可以称之为优质行业,实际投资中,就可以只从这几个行业中去投资。这样做的目的是,一方面,能够从行业大格局层面避免行业下行的风险,绕开一个可能出现负增长的的行业,从而降低投资的风险;另一方面,也大大缩短了我们的投资范围,让投资者能够专注于从真正好的行业去挑选公司进行投资。
选好行业之后,下面进入选公司环节。我们知道,即便是一个好的行业也仍然存在表现不好的公司,那么什么是好的公司呢,本文试图从营业收入规模和利润规模和来考察以上五个基业长青的行业,从它们中去筛选公司作为投资标的。
1、按营业收入规模构建的行业龙头投资组合
首先,我们按照营业收入规模,筛选出以上5个行业【医药生物,建筑装饰,电气设备,银行和汽车】从2010年至今的行业龙头如下表所示:
通过以上行业分析和投资组合的历史回测可以看到:
先选行业,再选公司,即使是从2015年股灾期间开始投资,至2018年5月1号,仍然能够获得相对理想的收益,可以说,红杉资本的赛道投资法则对于一般投资者还是比较靠谱的。
在构建行业龙头投资组合时,净利润指标显着优于营业收入指标,获得的投资收益能够更大的跑赢全市场收益率
市场是不断波动的,如果一个投资者从股灾期间开始投资,那么即使他买入了上述优质行业的龙头组合,在近3年也只能获得12%左右的累计收益;而如果从2016年5月3日开始投资,那么至2018年5月2日,2年时间就能获得超过50%以上的收益了。所以,在投资过程中选择时机也非常重要~
② 大数据概念股票有哪些
拓尔思:技术变现和数据变现双轮驱动
科华恒盛:投资备忘录签订,数据中心运营有望超预期
银之杰:互联网保险牌照获批,大数据+两张稀缺性牌照价值巨大
宜通世纪:主营业务维持快速增长,智慧医疗+大数据拓展成长空间
亨通光电:内生动力充足,外延增长可期
盛洋科技:射频电缆内资主要厂商,着力数据电缆产能扩张
大唐电信:芯片王者归来,移动互联异军突起
东方国信:四大领域布局厚积薄发、领跑“大数据+N”新时代
积成电子:电改电气新时代系列报告15-稀缺的能源互联网大数据平台
恒宝股份:华丽转型商户服务领域,大数据布局蓄势待发
初灵信息:一季度亏损非常态,看好公司发展
三维通信:网优回暖驱动业绩持续同比改善,新业务拓展奠定公司长期成长基石
美亚柏科:传统行业稳步快速增长,打造基于大数据平台的大安全新市场
③ 利用大数据炒股会赚吗
随着科学技术的发展,现在很多炒股软件都可以方便快捷地找到上市公司的关键数据。用大数据分析找出大股东的持仓成本,就等于看到了经销商的底牌。购买价格接近或低于市场平均持仓成本。利润机会越大,安全系数越高。
因为大数据分析人们的常识性需求或一些习惯性行为,只能通过多次或多次发生的常见行为事件找出一些规律。上述行为事件是相对固定时间或基本需求或习惯的单一行为的结果。作为股东,没有人能够预测未来。我们不否认这一点。然而,很少有人会否认每个人都可以回顾历史。我们不知道未来会上升还是下降。我们不知道如何波动。然而,如果一个好故事讲得很辛苦,说书人肯定会得到好处。粉丝越多,他得到的好处就越多。
④ 大数据股票龙头股票
大数据龙头股票有:
1、福田汽车600166:
大数据龙头。2020年报显示,公司的营业收入577.7亿元,同比增长22.99%,近3年复合增长18.63%。公司是网络Apollo的合作伙伴,与网络就车联网、大数据、智能汽车和无人驾驶展开全面合作,共同打造面向未来的智能互联网商用汽车。
2、高鸿股份000851:
大数据龙头。公司2020年实现总营收70.18亿,同比增长-38.49%。2014年6月17日晚间公告称,公司拟联合贵州旅游投资控股有限责任公司、贵州产业技术发展研究院,合计认缴资5000万元发起方式设立贵州大数据旅游产业股份有限公司,立足贵州,面向全国打造知名的大数据旅游平台运营公司。
3、神州数码000034:双方将聚焦金融、税务、医疗大数据、农业等领域构建差异化云服务,未来将带动上百万企业和代理商客户向云转型。
4、中国长城000066:采用新一代的人工智能和大数据技术,为传统智慧城市提供全新的一揽子解决方案,促进关键行业的产业升级。
5、华数传媒000156:公司处于大数据产业链的数据端(影音数据),公司通过有线电视网络业务逐步辐射互动电视/IPTV、手机电视、互联网电视和互联网视听等新媒体业务,同时公司于阿里合作推出阿里盒子,掌控电视屏入口。
6、常山北明000158:中标舞钢市智慧城市项目;通过整合云计算、大数据、物联网、移动互联网和人工智能等领域技术、业务成果,融合成国内领先的智慧城市总体解决方案。
7、美的集团000333:2014年3月,公司与阿里云签署《框架合作协议》,就构建基于云平台的物联网智慧系统及大数据应用达成框架合作意向 。
拓展资料:
股票投资注意事项
1、股票价格。购买股票时要观察的第一件事是每只股票的价格。这不仅决定了自己是否负担得起该股票投资,还决定了购买每种证券的数量。如果自己是通过经纪人购买股票,则平均每购买一股股票就需要支付一定的佣金。
2、收益。即使自己负担得起某只股票,也不意味着该证券值得购买。因为如果自己认为该企业将来会获得高利润,则100元的股票可能会显得便宜。
3、股利。当自己购买股票时应该先查找这些公司是否有向投资者支付股息的历史。这是公司在有足够现金储备的前提下可以选择向股东支付现金。即使股票下跌一段时间,股息也可以为自己提供一定的收益。并且需要注意公司是否有提高股息金额的历史。
4、股票风险。如果自己要购买大量股票,应该要俩接公司交易所在行业的市场风险。
⑤ 如何用大数据炒股
我们如今生活在一个数据爆炸的世界里。网络每天响应超过60亿次的搜索请求,日处理数据超过100PB,相当于6000多座中国国家图书馆的书籍信息量总和。新浪微博每天都会发布上亿条微博。在荒无人烟的郊外,暗藏着无数大公司的信息存储中心,24小时夜以继日地运转着。
克托·迈尔-舍恩伯格在《大数据时代》一书中认为,大数据的核心就是预测,即只要数据丰富到一定程度,就可预测事情发生的可能性。例如,“从一个人乱穿马路时行进的轨迹和速度来看他能及时穿过马路的可能性”,或者通过一个人穿过马路的速度,预测车子何时应该减速从而让他及时穿过马路。
那么,如果把这种预测能力应用在股票投资上,又会如何?
目前,美国已经有许多对冲基金采用大数据技术进行投资,并且收获甚丰。中国的中证广发网络百发100指数基金(下称百发100),上线四个多月以来已上涨68%。
和传统量化投资类似,大数据投资也是依靠模型,但模型里的数据变量几何倍地增加了,在原有的金融结构化数据基础上,增加了社交言论、地理信息、卫星监测等非结构化数据,并且将这些非结构化数据进行量化,从而让模型可以吸收。
由于大数据模型对成本要求极高,业内人士认为,大数据将成为共享平台化的服务,数据和技术相当于食材和锅,基金经理和分析师可以通过平台制作自己的策略。
量化非结构数据
不要小看大数据的本领,正是这项刚刚兴起的技术已经创造了无数“未卜先知”的奇迹。
2014年,网络用大数据技术预测命中了全国18卷中12卷高考作文题目,被网友称为“神预测”。网络公司人士表示,在这个大数据池中,包含互联网积累的用户数据、历年的命题数据以及教育机构对出题方向作出的判断。
在2014年巴西世界杯比赛中,Google亦通过大数据技术成功预测了16强和8强名单。
从当年英格兰报社的信鸽、费城股票交易所的信号灯到报纸电话,再到如今的互联网、云计算、大数据,前沿技术迅速在投资领域落地。在股票策略中,大数据日益崭露头角。
做股票投资策略,需要的大数据可以分为结构化数据和非结构化数据。结构化数据,简单说就是“一堆数字”,通常包括传统量化分析中常用的CPI、PMI、市值、交易量等专业信息;非结构化数据就是社交文字、地理位置、用户行为等“还没有进行量化的信息”。
量化非结构化就是用深度模型替代简单线性模型的过程,其中所涉及的技术包括自然语言处理、语音识别、图像识别等。
金融大数据平台-通联数据CEO王政表示,通联数据采用的非结构化数据可以分为三类:第一类和人相关,包括社交言论、消费、去过的地点等;第二类与物相关,如通过正在行驶的船只和货车判断物联网情况;第三类则是卫星监测的环境信息,包括汽车流、港口装载量、新的建筑开工等情况。
卫星监测信息在美国已被投入使用,2014年Google斥资5亿美元收购了卫星公司Skybox,从而可以获得实施卫星监测信息。
结构化和非结构化数据也常常相互转化。“结构化和非结构化数据可以形象理解成把所有数据装在一个篮子里,根据应用策略不同相互转化。例如,在搜索频率调查中,用户搜索就是结构化数据;在金融策略分析中,用户搜索就是非结构化数据。”网络公司人士表示。
华尔街拿着丰厚薪水的分析师们还不知道,自己的雇主已经将大量资本投向了取代自己的机器。
2014年11月23日,高盛向Kensho公司投资1500万美元,以支持该公司的大数据平台建设。该平台很像iPhone里的Siri,可以快速整合海量数据进行分析,并且回答投资者提出的各种金融问题,例如“下月有飓风,将对美国建材板块造成什么影响?”
在Kensho处理的信息中,有80%是“非结构化”数据,例如政策文件、自然事件、地理环境、科技创新等。这类信息通常是电脑和模型难以消化的。因此,Kensho的CEO Daniel Nadler认为,华尔街过去是基于20%的信息做出100%的决策。
既然说到高盛,顺便提一下,这家华尔街老牌投行如今对大数据可谓青睐有加。除了Kensho,高盛还和Fortress信贷集团在两年前投资了8000万美元给小额融资平台On Deck Capital。这家公司的核心竞争力也是大数据,它利用大数据对中小企业进行分析,从而选出值得投资的企业并以很快的速度为之提供短期贷款。
捕捉市场情绪
上述诸多非结构化数据,归根结底是为了获得一个信息:市场情绪。
在采访中,2013年诺贝尔经济学奖得主罗伯特•席勒的观点被无数采访对象引述。可以说,大数据策略投资的创业者们无一不是席勒的信奉者。
席勒于上世纪80年代设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。
然而,在大数据技术诞生之前,市场情绪始终无法进行量化。
回顾人类股票投资发展史,其实就是将影响股价的因子不断量化的过程。
上世纪70年代以前,股票投资是一种定性的分析,没有数据应用,而是一门主观的艺术。随着电脑的普及,很多人开始研究驱动股价变化的规律,把传统基本面研究方法用模型代替,市盈率、市净率的概念诞生,量化投资由此兴起。
量化投资技术的兴起也带动了一批华尔街大鳄的诞生。例如,巴克莱全球投资者(BGI)在上世纪70年代就以其超越同行的电脑模型成为全球最大的基金管理公司;进入80年代,另一家基金公司文艺复兴(Renaissance)年均回报率在扣除管理费和投资收益分成等费用后仍高达34%,堪称当时最佳的对冲基金,之后十多年该基金资产亦十分稳定。
“从主观判断到量化投资,是从艺术转为科学的过程。”王政表示,上世纪70年代以前一个基本面研究员只能关注20只到50只股票,覆盖面很有限。有了量化模型就可以覆盖所有股票,这就是一个大的飞跃。此外,随着计算机处理能力的发展,信息的用量也有一个飞跃变化。过去看三个指标就够了,现在看的指标越来越多,做出的预测越来越准确。
随着21世纪的到来,量化投资又遇到了新的瓶颈,就是同质化竞争。各家机构的量化模型越来越趋同,导致投资结果同涨同跌。“能否在看到报表数据之前,用更大的数据寻找规律?”这是大数据策略创业者们试图解决的问题。
于是,量化投资的多米诺骨牌终于触碰到了席勒理论的第三层变量——市场情绪。
计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。
基于互联网搜索数据和社交行为的经济预测研究,已逐渐成为一个新的学术热点,并在经济、社会以及健康等领域的研究中取得了一定成果。在资本市场应用上,研究发现搜索数据可有效预测未来股市活跃度(以交易量指标衡量)及股价走势的变化。
海外就有学术研究指出,公司的名称或者相关关键词的搜索量,与该公司的股票交易量正相关。德国科学家Tobias Preis就进行了如此研究:Tobias利用谷歌搜索引擎和谷歌趋势(Google Trends),以美国标普500指数的500只股票为其样本,以2004年至2010年为观察区间,发现谷歌趋势数据的公司名称搜索量和对应股票的交易量,在每周一次的时间尺度上有高度关联性。也就是说,当某个公司名称在谷歌的搜索量活动增加时,无论股票的价格是上涨或者下跌,股票成交量与搜索量增加;反之亦然,搜索量下降,股票成交量下降。以标普500指数的样本股为基础,依据上述策略构建的模拟投资组合在六年的时间内获得了高达329%的累计收益。
在美国市场上,还有多家私募对冲基金利用Twitter和Facebook的社交数据作为反映投资者情绪和市场趋势的因子,构建对冲投资策略。利用互联网大数据进行投资策略和工具的开发已经成为世界金融投资领域的新热点。
保罗·霍丁管理的对冲基金Derwent成立于2011年5月,注册在开曼群岛,初始规模约为4000万美元, 2013年投资收益高达23.77%。该基金的投资标的包括流动性较好的股票及股票指数产品。
通联数据董事长肖风在《投资革命》中写道,Derwent的投资策略是通过实时跟踪Twitter用户的情绪,以此感知市场参与者的“贪婪与恐惧”,从而判断市场涨跌来获利。
在Derwent的网页上可以看到这样一句话:“用实时的社交媒体解码暗藏的交易机会。”保罗·霍丁在基金宣传册中表示:“多年以来,投资者已经普遍接受一种观点,即恐惧和贪婪是金融市场的驱动力。但是以前人们没有技术或数据来对人类情感进行量化。这是第四维。Derwent就是要通过即时关注Twitter中的公众情绪,指导投资。”
另一家位于美国加州的对冲基金MarketPsych与汤普森·路透合作提供了分布在119个国家不低于18864项独立指数,比如每分钟更新的心情状态(包括乐观、忧郁、快乐、害怕、生气,甚至还包括创新、诉讼及冲突情况等),而这些指数都是通过分析Twitter的数据文本,作为股市投资的信号。
此类基金还在不断涌现。金融危机后,几个台湾年轻人在波士顿组建了一家名为FlyBerry的对冲基金,口号是“Modeling the World(把世界建模)”。它的投资理念全部依托大数据技术,通过监测市场舆论和行为,对投资做出秒速判断。
关于社交媒体信息的量化应用,在股票投资之外的领域也很常见:Twitter自己也十分注重信息的开发挖掘,它与DataSift和Gnip两家公司达成了一项出售数据访问权限的协议,销售人们的想法、情绪和沟通数据,从而作为顾客的反馈意见汇总后对商业营销活动的效果进行判断。从事类似工作的公司还有DMetics,它通过对人们的购物行为进行分析,寻找影响消费者最终选择的细微原因。
回到股票世界,利用社交媒体信息做投资的公司还有StockTwits。打开这家网站,首先映入眼帘的宣传语是“看看投资者和交易员此刻正如何讨论你的股票”。正如其名,这家网站相当于“股票界的Twitter”,主要面向分析师、媒体和投资者。它通过机器和人工相结合的手段,将关于股票和市场的信息整理为140字以内的短消息供用户参考。
此外,StockTwits还整合了社交功能,并作为插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,让人们可以轻易分享投资信息。
另一家公司Market Prophit也很有趣。这家网站的宣传语是“从社交媒体噪音中提炼市场信号”。和StockTwits相比,Market Prophit更加注重大数据的应用。它采用了先进的语义分析法,可以将Twitter里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资建议。网站还根据语义量化,每天公布前十名和后十名的股票热度榜单。网站还设计了“热度地图”功能,根据投资者情绪和意见,按照不同板块,将板块内的个股按照颜色深浅进行标注,谁涨谁跌一目了然。
中国原创大数据指数
尽管大数据策略投资在美国貌似炙手可热,但事实上,其应用尚仅限于中小型对冲基金和创业平台公司。大数据策略投资第一次被大规模应用,应归于中国的百发100。
网络金融中心相关负责人表示,与欧美等成熟资本市场主要由理性机构投资者构成相比,东亚尤其是中国的股票类证券投资市场仍以散户为主,因此市场受投资者情绪和宏观政策性因素影响很大。而个人投资者行为可以更多地反映在互联网用户行为大数据上,从而为有效地预测市场情绪和趋势提供了可能。这也就是中国国内公募基金在应用互联网大数据投资方面比海外市场并不落后、甚至领先的原因。
百发100指数由网络、中证指数公司、广发基金联合研发推出,于2014年7月8日正式对市场发布,实盘运行以来一路上涨,涨幅超过60%。跟踪该指数的指数基金规模上限为30亿份,2014年9月17日正式获批,10月20日发行时一度创下26小时疯卖18亿份的“神话”。
外界都知道百发100是依托大数据的指数基金,但其背后的细节鲜为人知。
百发100数据层面的分析分为两个层面,即数据工厂的数据归集和数据处理系统的数据分析。其中数据工厂负责大数据的收集分析,例如将来源于互联网的非结构化数据进行指标化、产品化等数据量化过程;数据处理系统,可以在数据工厂递交的大数据中寻找相互统计关联,提取有效信息,最终应用于策略投资。
“其实百发100是在传统量化投资技术上融合了基于互联网大数据的市场走势和投资情绪判断。”业内人士概括道。
和传统量化投资类似,百发100对样本股的甄选要考虑财务因子、基本面因子和动量因子,包括净资产收益率(ROE)、资产收益率(ROA)、每股收益增长率(EPS)、流动负债比率、企业价值倍数(EV/EBITDA)、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的个股价格收益率和波动率等。
此外,市场走势和投资情绪是在传统量化策略基础上的创新产物,也是百发100的核心竞争力。接近网络的人士称,市场情绪因子对百发100基金起决定性作用。
网络金融中心相关负责人是罗伯特•席勒观点的支持者。他认为,投资者行为和情绪对资产价格、市场走势有着巨大的影响。因此“通过互联网用户行为大数据反映的投资市场情绪、宏观经济预期和走势,成为百发100指数模型引入大数据因子的重点”。
传统量化投资主要着眼点在于对专业化金融市场基本面和交易数据的应用。但在网络金融中心相关业务负责人看来,无论是来源于专业金融市场的结构化数据,还是来源于互联网的非结构化数据,都是可以利用的数据资源。因此,前文所述的市场情绪数据,包括来源于互联网的用户行为、搜索量、市场舆情、宏观基本面预期等等,都被网络“变废为宝”,从而通过互联网找到投资者参与特征,选出投资者关注度较高的股票。
“与同期沪深300指数的表现相较,百发100更能在股票市场振荡时期、行业轮动剧烈时期、基本面不明朗时期抓住市场热点、了解投资者情绪、抗击投资波动风险。”网络金融中心相关负责人表示。
百发100选取的100只样本股更换频率是一个月,调整时间为每月第三周的周五。
业内人士指出,百发100指数的月收益率与中证100、沪深300、中证500的相关性依次提升,说明其投资风格偏向中小盘。
但事实并非如此。从样本股的构成来说,以某一期样本股为例,样本股总市值6700亿元,占A股市值4.7%。样本股的构成上,中小板21只,创业板4只,其余75只样本股均为大盘股。由此可见,百发100还是偏向大盘为主、反映主流市场走势。
样本股每个月的改变比例都不同,最极端的时候曾经有60%进行了换仓。用大数据预测热点变化,市场热点往往更迭很快;但同时也要考虑交易成本。两方面考虑,网络最后测算认为一个月换一次仓位为最佳。
样本股对百发100而言是核心机密——据说“全世界只有基金经理和指数编制机构负责人两个人知道”——都是由机器决定后,基金经理分配给不同的交易员建仓买入。基金经理也没有改变样本股的权利。
展望未来,网络金融中心相关负责人踌躇满志,“百发100指数及基金的推出,只是我们的开端和尝试,未来将形成多样化、系列投资产品。”
除了百发100,目前市场上打着大数据旗帜的基金还有2014年9月推出的南方-新浪I100和I300指数基金。
南方-新浪I100和I300是由南方基金、新浪财经和深圳证券信息公司三方联合编制的。和百发100类似,也是按照财务因子和市场情绪因子进行模型打分,按照分值将前100和前300名股票构成样本股。推出至今,这两个指数基金分别上涨了10%左右。
正如百发100的市场情绪因子来自网络,南方-新浪I100和I300的市场情绪因子全部来自新浪平台。其中包括用户在新浪财经对行情的访问热度、对股票的搜索热度;用户在新浪财经对股票相关新闻的浏览热度;股票相关微博的多空分析数据等。
此外,阿里巴巴旗下的天弘基金也有意在大数据策略上做文章。据了解,天弘基金将和阿里巴巴合作,推出大数据基金产品,最早将于2015年初问世。
天弘基金机构产品部总经理刘燕曾对媒体表示,“在传统的调研上,大数据将贡献于基础资产的研究,而以往过度依赖线下研究报告。大数据将视野拓展至了线上的数据分析,给基金经理选股带来新的逻辑。”
在BAT三巨头中,腾讯其实是最早推出指数基金的。腾讯与中证指数公司、济安金信公司合作开发的“中证腾安价值100指数”早在2013年5月就发布了,号称是国内第一家由互联网媒体与专业机构编制发布的A股指数。不过,业内人士表示,有关指数并没有真正应用大数据技术。虽然腾讯旗下的微信是目前最热的社交平台,蕴藏了大量的社交数据,但腾讯未来怎么开发,目前还并不清晰。
大数据投资平台化
中欧商学院副教授陈威如在其《平台战略》一书中提到,21世纪将成为一道分水岭,人类商业行为将全面普及平台模式,大数据金融也不例外。
然而,由于大数据模型对成本要求极高,就好比不可能每家公司都搭建自己的云计算系统一样,让每家机构自己建设大数据模型,从数据来源和处理技术方面看都是不现实的。业内人士认为,大数据未来必将成为平台化的服务。
目前,阿里、网络等企业都表示下一步方向是平台化。
蚂蚁金服所致力搭建的平台,一方面包括招财宝一类的金融产品平台,另一方面包括云计算、大数据服务平台。蚂蚁金服人士说,“我们很清楚自己的优势不是金融,而是包括电商、云计算、大数据等技术。蚂蚁金服希望用这些技术搭建一个基础平台,把这些能力开放出去,供金融机构使用。”
网络亦是如此。接近网络的人士称,未来是否向平台化发展,目前还在讨论中,但可以确定的是,“网络不是金融机构,目的不是发产品,百发100的意义在于打造影响力,而非经济效益。”
当BAT还在摸索前行时,已有嗅觉灵敏者抢占了先机,那就是通联数据。
通联数据股份公司(DataYes)由曾任博时基金副董事长肖风带队创建、万向集团投资成立,总部位于上海,公司愿景是“让投资更容易,用金融服务云平台提升投资管理效率和投研能力”。该平台7月上线公测,目前已拥有130多家机构客户,逾万名个人投资者。
通联数据目前有四个主要平台,分别是通联智能投资研究平台、通联金融大数据服务平台、通联多资产投资管理平台和金融移动办公平台。
通联智能投资研究平台包括雅典娜-智能事件研究、策略研究、智能研报三款产品,可以对基于自然语言的智能事件进行策略分析,实时跟踪市场热点,捕捉市场情绪。可以说,和百发100类似,其核心技术在于将互联网非结构化数据的量化使用。
通联金融大数据服务平台更侧重于专业金融数据的分析整理。它可以提供公司基本面数据、国内外主要证券、期货交易所的行情数据、公司公告数据、公关经济、行业动态的结构化数据、金融新闻和舆情的非结构化数据等。
假如将上述两个平台比作“收割机”,通联多资产投资管理平台就是“厨房”。在这个“厨房”里,可以进行全球跨资产的投资组合管理方案、订单管理方案、资产证券化定价分析方案等。
通联数据可以按照主题热点或者自定义关键字进行分析,构建知识图谱,将相关的新闻和股票提取做成简洁的分析框架。例如用户对特斯拉感兴趣,就可以通过主题热点看到和特斯拉相关的公司,并判断这个概念是否值得投资。“过去这个搜集过程要花费几天时间,现在只需要几分钟就可以完成。”王政表示。
“通联数据就好比一家餐馆,我们把所有原料搜集来、清洗好、准备好,同时准备了一个锅,也就是大数据存储平台。研究员和基金经理像厨师一样,用原料、工具去‘烹制’自己的策略。”王政形容道。
大数据在平台上扮演的角色,就是寻找关联关系。人类总是习惯首先构建因果关系,继而去倒推和佐证。机器学习则不然,它可以在海量数据中查获超越人类想象的关联关系。正如维克托`迈尔-舍恩伯格在《大数据时代》中所提到的,社会需要放弃它对因果关系的渴求,而仅需关注相互关系。
例如,美国超市沃尔玛通过大数据分析,发现飓风用品和蛋挞摆在一起可以提高销量,并由此创造了颇大的经济效益。如果没有大数据技术,谁能将这毫无关联的两件商品联系在一起?
通联数据通过机器学习,也能找到传统量化策略无法发现的市场联系。其中包括各家公司之间的资本关系、产品关系、竞争关系、上下游关系,也包括人与人之间的关系,例如管理团队和其他公司有没有关联,是否牵扯合作等。
未来量化研究员是否将成为一个被淘汰的职业?目前研究员的主要工作就是收集整理数据,变成投资决策,而之后这个工作将更多由机器完成。
“当初医疗科技发展时,人们也认为医生会被淘汰,但其实并不会。同理,研究员也会一直存在,但他们会更注重深入分析和调研,初级的数据搜集可以交给机器完成。”王政表示。
但当未来大数据平台并广泛应用后,是否会迅速挤压套利空间?这也是一个问题。回答根据网上资料整理
⑥ 金融行业有哪些领域需要大量运用数据分析
前瞻产业研究院《2016-2021年中国大数据金融行业市场前瞻与投资战略规划分析报告》希望有用。
第1章:大数据金融行业发展概述
1.1 大数据产业发展背景概述
1.1.1 大数据产业的概念
(1)数据产生与集聚层
(2)数据组织与管理层
(3)数据分析与发现层
(4)数据应用与服务层
1.1.2 大数据的生态系统
1.1.3 大数据的商业价值
(1)大数据的商业价值杠杆
(2)大数据创造的商业价值
1.2 大数据产业行业应用情况
1.2.1 大数据产业各个行业应用情况
(1)不同领域潜在价值评估
(2)不同领域投资结构分布
1.2.2 大数据产业金融领域应用情况
1.3 大数据金融概念及其特点
1.3.1 大数据金融基本定义
1.3.2 大数据金融主要特征
1.4 大数据金融主要发展模式
1.4.1 平台金融发展模式
1.4.2 供应链金融发展模式
第2章:大数据金融发展环境分析
2.1 大数据金融行业政策环境分析
2.1.1 行业监管体系概述
2.1.2 行业主要政策分析
2.1.3 政策环境对行业发展影响
2.2 大数据金融行业经济环境分析
2.2.1 国内经济走势分析
(1)国内GDP增速情况
(2)工业生产增速情况
(3)固定资产投资情况
2.2.2 国内金融市场分析
(1)银行资产负债规模分析
(2)银行贷款规模分析
(3)银行风险能力分析
2.2.3 国内经济发展趋势
2.2.4 经济环境对行业发展影响
2.3 大数据金融行业技术环境分析
2.3.1 大数据与云计算
2.3.2 大数据处理工具
2.3.3 技术环境对行业发展影响
2.4 大数据金融行业社会环境分析
2.4.1 互联网行业发展现状
(1)互联网网民规模分析
(2)互联网资源规模分析
2.4.2 社交媒体发展现状
(1)新闻网站
(2)网络视频
(3)搜索引擎
(4)即时通信
(5)微博客
(6)博客/个人空间
2.4.3 移动设备发展现状
2.4.4 社会环境对行业发展影响
2.5 大数据金融国际发展分析
2.5.1 银行大数据全球发展现状
(1)海外银行大数据发展分析
(2)银行大数据建设案例分析
2.5.2 保险大数据全球发展现状
(1)海外保险大数据发展分析
(2)保险大数据建设案例分析
2.5.3 国外大数据金融发展启示
第3章:大数据金融创新分析
3.1 大数据金融三大创新支点
3.2 大数据金融基础设施创新
3.2.1 支付体系建设分析
(1)支付行业用户规模
(2)支付行业交易规模
(3)支付行业模式分析
(4)支付行业市场规模预测
3.2.2 征信体系建设分析
(1)征信机构业务规模分析
(2)征信机构数据库建设情况
(3)征信行业数据端商业模式
(4)大数据征信发展趋势分析
3.2.3 资产交易平台分析
(1)资产交易平台发展规模
(2)资产交易平台主要类别
1)银行系P2P网贷平台
2)民营系P2P网贷平台
3)国资系P2P网贷平台
4)上市公司系P2P网贷平台
5)风投系P2P网贷平台
(3)资产交易平台商业模式
3.2.4 基础设施创新方向
(1)支付体系介质创新
(2)征信体系多元发展
(3)交易平台去中介化
3.3 大数据金融平台创新分析
3.3.1 电商平台发展现状分析
(1)电商平台客户结构分析
(2)电商市场竞争格局分析
(3)电商领先企业优势分析
(4)电商行业投资并购分析
3.3.2 社交平台发展现状分析
(1)社交网络流量统计排名分析
(2)社交网络市场竞争格局分析
(3)社交网络领先企业优势分析
(4)社交网络平台投资并购分析
3.3.3 信息服务平台发展现状
(1)门户网站竞争格局分析
(2)门户网站投资并购分析
3.3.4 平台建设创新发展方向
(1)用户积累方式革新
(2)平台个性定制革新
3.4 大数据金融渠道创新升级分析
3.4.1 银行业渠道互联网化发展现状
(1)电子银行的交易规模
(2)电子银行的模式分析
3.4.2 保险业渠道互联网化发展现状
(1)保险业网销交易规模
(2)保险业网销模式分析
3.4.3 证券业渠道互联网化发展现状
(1)互联网证券交易情况
(2)互联网证券模式分析
3.4.4 渠道创新升级策略分析
(1)渠道定位转型
(2)实体渠道转型
第4章:大数据金融具体应用领域
4.1 银行业大数据金融应用分析
4.1.1 银行业大数据金融发展历程
4.1.2 银行业大数据金融创新模式
(1)风险控制模式创新
(2)产品营销模式创新
(3)银行运营模式创新
(4)银行服务模式创新
4.1.3 银行业大数据金融应用现状
4.1.4 银行业大数据金融经典案例
(1)花旗银行大数据金融案例分析
(2)中信银行大数据金融案例分析
(3)浦发银行大数据金融案例分析
(4)民生银行大数据金融案例分析
4.1.5 银行业大数据金融发展潜力
4.1.6 银行业大数据金融发展前景
4.2 保险业大数据金融应用分析
4.2.1 保险业大数据金融发展历程
4.2.2 保险业大数据金融创新模式
(1)赔付管理模式创新
(2)业务定价模式创新
(3)险企运营模式创新
(4)产品营销模式创新
4.2.3 保险业大数据金融发展现状
4.2.4 保险业大数据金融经典案例
(1)平安保险大数据金融案例分析
(2)泰康人寿大数据金融案例分析
4.2.5 保险业大数据金融发展前景
4.3 证券业大数据金融应用分析
4.3.1 证券业大数据金融发展历程
4.3.2 证券业大数据金融创新模式
(1)客户关系管理模式创新
(2)证券监管模式创新
(3)市场预期模式创新
4.3.3 证券业大数据金融发展现状
4.3.4 证券业大数据金融经典案例
(1)海通证券大数据金融案例分析
(2)国泰君安大数据金融案例分析
(3)中信证券大数据金融案例分析
4.3.5 证券业大数据金融发展前景
4.4 其他领域大数据金融应用情况
4.4.1 信托业大数据金融应用分析
4.4.2 小额贷款领域大数据金融应用分析
4.4.3 担保业大数据金融应用分析
4.4.4 P2P网贷大数据金融应用分析
第5章:大数据金融领先服务商分析
5.1 国外领先大数据金融服务商
5.1.1 IBM
(1)企业基本信息概述
(2)企业大数据布局
(3)企业平台资源分析
(4)企业主营业务分析
1)利润分析
2)资产负债分析
3)现金流量分析
(5)企业大数据收入分析
(6)企业竞争策略分析
(7)企业最新发展动向
(8)企业发展优劣势分析
5.1.2 甲骨文股份有限公司
(1)企业基本信息概述
(2)企业大数据布局
(3)企业平台资源分析
(4)企业主营业务分析
1)利润分析
2)资产负债分析
3)现金流量分析
(5)企业大数据收入分析
(6)企业发展战略分析
(7)企业最新发展动向
5.1.3 英特尔
(1)企业基本信息概述
(2)企业大数据布局
(3)企业平台资源分析
(4)企业主营业务分析
1)利润分析
2)资产负债分析
3)现金流量分析
(5)企业大数据收入分析
(6)企业发展战略分析
(7)企业最新发展动向
5.1.4 SAP公司
(1)企业基本信息概述
(2)企业大数据布局
(3)企业大数据解决方案
(4)企业主营业务分析
1)利润分析
2)资产负债分析
3)现金流量分析
(5)企业大数据收入分析
(6)企业大数据价值分析
(7)企业最新发展动向
5.1.5 文思海辉技术有限公司
(1)企业基本信息概述
(2)企业大数据布局
(3)企业平台资源分析
(4)企业主营业务分析
1)利润分析
2)资产负债分析
3)现金流量分析
(5)企业相关案例分析
(6)企业发展战略分析
(7)企业最新发展动向
(8)企业发展优劣势分析
5.2 国内领先大数据金融服务商
5.2.1 荣之联
(1)企业基本信息概述
(2)企业大数据布局
(3)企业平台资源分析
(4)企业主营业务分析
1)主要经济指标
2)运营能力分析
3)盈利能力分析
4)偿债能力分析
5)发展能力分析
(5)企业研发能力分析
(6)企业发展战略分析
(7)企业最新发展动向
(8)企业发展优劣势分析
5.2.2 九次方
(1)企业基本信息概述
(2)企业大数据布局
(3)企业平台资源分析
(4)企业主营业务分析
(5)企业大数据解决方案分析
(6)企业发展战略分析
(7)企业最新发展动向
(8)企业发展优劣势分析
5.2.3 贝格数据
(1)企业基本信息概述
(2)企业平台资源分析
(3)企业主营业务分析
(4)企业典型案例分析
(5)企业最新发展动向
(6)企业发展优劣势分析
5.2.4 中国保信
(1)企业基本信息概述
(2)企业组织架构分析
(3)企业平台资源分析
(4)企业主营业务分析
(5)企业最新发展动向
5.2.5 Talking Data
(1)企业基本信息概述
(2)企业发展大事记
(3)企业平台资源分析
(4)企业主营业务分析
(5)企业主要客户分析
(6)企业所获荣誉介绍
(7)企业最新发展动向
第6章:互联网企业大数据金融战略布局分析
6.1 阿里巴巴大数据金融布局分析
6.1.1 企业基本信息概述
6.1.2 企业主营业务分析
(1)企业主营业务类型
(2)企业经营业绩分析
(3)企业金融业务分析
6.1.3 企业战略发展布局
6.1.4 企业基础资源分析
(1)企业数据资源分析
(2)企业平台资源分析
(3)企业金融资源分析
6.1.5 企业网站流量分析
6.1.6 企业风险管理体系
6.1.7 企业投资并购动向
(1)2014年阿里巴巴投资布局
(2)2015年阿里巴巴投资布局
6.1.8 业务发展优劣势分析
6.1.9 企业大数据金融业务发展前景
6.2 腾讯公司大数据金融布局分析
6.2.1 企业基本信息概述
6.2.2 企业主营业务分析
(1)企业主营业务类型
(2)企业经营业绩分析
(3)企业金融业务分析
6.2.3 企业战略发展布局
6.2.4 企业基础资源分析
(1)企业数据资源分析
(2)企业平台资源分析
(3)企业金融资源分析
6.2.5 企业网站流量分析
6.2.6 企业风险管理体系
6.2.7 企业投资并购动向
(1)2014年腾讯公司投资布局
(2)2015年腾讯公司投资布局
6.2.8 业务发展优劣势分析
6.2.9 企业大数据金融业务发展前景
6.3 网络公司大数据金融布局分析
6.3.1 企业基本信息概述
6.3.2 企业主营业务分析
(1)企业主营业务类型
(2)企业经营业绩分析
(3)企业金融业务分析
6.3.3 企业战略发展布局
6.3.4 企业基础资源分析
(1)企业数据资源分析
(2)企业平台资源分析
(3)企业金融资源分析
6.3.5 企业网站流量分析
6.3.6 企业风险管理体系
6.3.7 企业投资并购动向
(1)2014年网络公司投资布局
(2)2015年网络公司投资布局
6.3.8 业务发展优劣势分析
6.3.9 企业大数据金融业务发展前景
6.4 京东商城大数据金融布局分析
6.4.1 企业基本信息概述
6.4.2 企业主营业务分析
(1)企业主营业务类型
(2)企业经营业绩分析
(3)企业金融业务分析
6.4.3 企业战略发展布局
6.4.4 企业基础资源分析
(1)企业数据资源分析
(2)企业平台资源分析
(3)企业金融资源分析
6.4.5 企业网站流量分析
6.4.6 企业风险管理体系
6.4.7 企业投资并购动向
(1)2014年京东公司投资布局
(2)2015年京东公司投资布局
6.4.8 业务发展优劣势分析
6.4.9 企业大数据金融业务发展前景
6.5 苏宁云商大数据金融布局分析
6.5.1 企业基本信息概述
6.5.2 企业主营业务分析
(1)企业主营业务类型
(2)企业经营业绩分析
(3)企业金融业务经营效益
6.5.3 企业战略发展布局
6.5.4 企业基础资源分析
(1)企业数据资源分析
(2)企业平台资源分析
(3)企业金融资源分析
6.5.5 企业网站流量分析
6.5.6 企业风险管理体系
6.5.7 企业投资并购动向
6.5.8 业务发展优劣势分析
6.5.9 企业大数据金融业务发展前景
第7章:金融机构大数据金融战略布局分析
7.1 银行大数据金融领先应用机构
7.1.1 建设银行大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业基础建设情况
1)企业数据资源分析
2)企业金融资源分析
(4)企业平台建设情况
(5)企业渠道建设情况
(6)企业风险管理情况
(7)企业投资并购动向
(8)业务发展优劣势分析
7.1.2 工商银行大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业基础建设情况
1)企业数据资源分析
2)企业金融资源分析
(4)企业平台建设情况
(5)企业渠道建设情况
(6)企业风险管理情况
(7)企业投资并购动向
(8)业务发展优劣势分析
7.1.3 中国银行大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业基础建设情况
1)企业数据资源分析
2)企业金融资源分析
(4)企业平台建设情况
(5)企业渠道建设情况
(6)企业风险管理情况
(7)企业投资并购动向
(8)业务发展优劣势分析
7.1.4 农业银行大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业基础建设情况
1)企业数据资源分析
2)企业金融资源分析
(4)企业平台建设情况
(5)企业渠道建设情况
(6)企业风险管理情况
(7)企业投资并购动向
(8)业务发展优劣势分析
7.1.5 交通银行大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
(3)企业基础建设情况
(4)企业平台建设情况
(5)企业渠道建设情况
(6)企业风险管理情况
(7)业务发展优劣势分析
7.1.6 招商银行大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业基础建设情况
1)企业数据资源分析
2)企业金融资源分析
(4)企业平台建设情况
(5)企业渠道建设情况
(6)企业风险管理情况
(7)企业投资并购动向
(8)业务发展优劣势分析
7.1.7 中信银行大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业基础建设情况
1)企业数据资源分析
2)企业金融资源分析
(4)企业平台建设情况
(5)企业渠道建设情况
(6)企业风险管理情况
(7)企业投资并购动向
(8)业务发展优劣势分析
7.1.8 平安银行大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
(3)企业基础建设情况
1)企业数据资源分析
2)企业金融资源分析
(4)企业平台建设情况
(5)企业渠道建设情况
(6)企业风险管理情况
(7)企业投资并购动向
(8)业务发展优劣势分析
7.2 保险大数据金融领先应用机构
7.2.1 中国人寿大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业大数据金融布局路径
(4)企业大数据金融发展模式
(5)企业大数据金融业务优劣势分析
7.2.2 中国人保大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业大数据金融布局路径
(4)企业大数据金融发展模式
(5)企业大数据金融业务优劣势分析
7.2.3 平安保险大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业大数据金融布局路径
(4)企业大数据金融发展模式
(5)企业大数据金融业务优劣势分析
7.2.4 泰康人寿大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业大数据金融布局路径
(4)企业大数据金融发展模式
(5)企业大数据金融业务优劣势分析
7.2.5 太平保险大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业大数据金融布局路径
(4)企业大数据金融发展模式
(5)企业大数据金融业务优劣势分析
7.2.6 阳光保险大数据金融布局分析
(1)企业基本信息概述
(2)企业主营业务分析
1)企业主营业务类型
2)企业经营业绩分析
(3)企业大数据金融布局路径
(4)企业大数据金融发展模式
(5)企业大数据金融业务优劣势分析
7.3 证券大数据金融领先应用机构
7.3.1 国金证券大数据金融布局分析
(1)企业基本信息概述
(2)企业基础资源分析
(3)企业市场预期水平
1)企业大数据金融发展现状
2)企业大数据金融发展前景
(4)企业经营业绩分析
(5)企业营业网点分析
(6)业务发展优劣势分析
7.3.2 中信证券大数据金融布局分析
(1)企业基本信息概述
(2)企业基础资源分析
(3)企业市场预期水平
1)企业大数据金融发展现状
2)企业大数据金融发展前景
(4)企业经营业绩分析
(5)企业营业网点分析
(6)业务发展优劣势分析
7.3.3 国泰君安大数据金融布局分析
(1)企业基本信息概述
(2)企业基础资源分析
(3)企业市场预期水平
1)企业大数据金融发展现状
2)企业大数据金融发展前景
(4)企业经营业绩分析
(5)企业营业网点分析
(6)业务发展优劣势分析
7.3.4 海通证券大数据金融布局分析
(1)企业基本信息概述
(2)企业基础资源分析
(3)企业市场预期水平
1)企业大数据金融发展现状
2)企业大数据金融发展前景
(4)企业经营业绩分析
(5)企业营业网点分析
(6)业务发展优劣势分析
………………
⑦ 基于微信大数据的股票预测研究
基于微信大数据的股票预测研究
大数据是近些年来的热门话题,无论国际上还是国内,影响很大。经济学、政治学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。而全球经济目前生成了史无前例的大量数据,如果把每天产生的大量数据比作神话时期的大洪水是完全正确的,这个数据洪流是我们前所未见的,他是全新的、强大的、当然,也是让人恐慌但又极端刺激的。
而我所分享的话题,正是在互联网环境下,如何利用大数据技术,进行股票预测的研究。–今天,我想分享我认为有意义的四点。
1.大数据下的商业预测
根据大数据,我们可以有效地进行故障、人流、流量、用电量、股票市场、疾病预防、交通、食物配送、产业供需等方面的预测。而本文我们所关心的内容是股票市场的预测。
大数据的核心是预测,预测依赖于对数据的分析。那么分析的方法是否是基于随机采样的结果而设计的,这样的分析方法是否会有误差?
从传统认识上,由于资源和科技的局限,如人和计算资源受限、从计算机处理能力来讲无法处理全部数据来获取人们所关注的结果。因此随机采样应运而生,通过所选取的个体来代表全体,如使用随机抽取的方式来使得推论结果更科学。但既然提到了大数据,它是资源发展到一定程度、以及技术发展到一定阶段产生的一个新的认识。如同电力的出现,使人类进入了一个快速发展阶段,大数据也一样,它的含义是全体样本,从整体样本来做推论。在本文大数据的含义是所有股票在整个社交网络上的流动信息,从数据源上讲,本文没有采用所有社交网络上的数据,只分析了微信这个最具代表性的社交媒体作为信息源。
互动数据能反映用户情绪,搜索数据能反映用户的关注点和意图,在股市预测时这两种数据哪种更具有参考价值?
我认为都有价值,互动数据反映了用户对某一特定股票的喜好和厌恶,可以简单描述为对该股票的操作是继续持有还是卖出;而搜索数据则代表用户在收集该股票信息的过程,它是关注度的概念,某只股票搜索度高则意味着消息的影响力大。互动代表着方向,搜索代表着振幅。
我们知道这两种数据得出的结论会有差异,您是如何平衡这两种数据反映的情况来进行预测的?
正如上一个问题里提到的,如果是股票推荐,买进卖出等原则问题,则应该考虑互动数据,但如果已经买到手了,搜索数据可以提供一个幅度的概念,类似债券评级A级、AA级、AAA级等,供投资者参考,因为不同投资者对风险的承受度是不同的。
将股票和市场的消息整理成140字的短消息发布,是否意味着主要发布渠道是微博?现在微信公众号很火,有没有考虑通过这个渠道也发布消息?
事实上,信息传播的方式很多,微信作为新媒体当然影响力不容小觑,但目前技术投入最小的还是邮件、短信等方式,未来会考虑使用公众号来推送股票和市场消息。
如果在未来通过微信公众号推送消息,那么推送的消息会不会作为数据来源被再次采集?这会有多大的影响?
会被采集,但互联网上的每日关于个股的信息数量会达到很大,该推送会增加推荐股票1点权重,每只股票的权重成百上千,因此影响极小。
数据来源是微信公众号,除了准确性的考虑之外,是否还考虑过这样收集数据会较少触犯个人隐私?
从法律角度来看,搜索微信或其他个人聊天记录,是侵犯个人隐私权的,因此如果腾讯开放了这样的接口,每个公民都可以对这样的行为进行投诉、抗议、甚至进行法律起诉直至其改正过错、赔偿损失的。
这样是否意味着即使存在违法的行为,其结果也是由腾讯来承担,而我们作为数据的使用方不需要承担任何法律责任?
在整个社会,我们作为系统技术提供方,应恪守大数据的伦理道德,遵守国家法律,如侵犯个人隐私,系统不会采集,谷歌有一句座右铭“谷歌不作恶”,本文提到的系统也一样。
2.基于大数据进行股票推荐实验
股票的及时度反应了微信文章所发布的时效性,及时度越高,数据价值就越大。
股票的热度反应了当前某只股票被关注的频度,关注频度越大,上涨的可能性越高。
数据的完整性:我们采用循环的方式对所有深沪两地发行约2236只股票(创业版除外)在微信搜索网站上的搜索结果进行保存。
数据的一致性:文件格式由负责保存数据文件的程序决定,单一的流程保障了文件的一致性。
数据的准确性:由于所分析的订阅号文章的是由微信公共平台的公众号所提供,在一定程度上杜绝了虚假消息对于预测系统的破坏。
数据的及时性:考虑到磁盘读写以及采集程序所处的网络带宽,以及搜索引擎对于采集程序的屏蔽,程序中采集两条信息之间间隔了5秒,因此理论上11180秒(3.1个小时)可收集完当日推荐所需要的数据。对于每个交易日,在9点-9点30分之间采集所有数据,需要7台以上的设备可达到最佳效果。本次试验受限于试验设备,在一台设备上,交易日每天早六时开始进行数据采集,也满足及时性要求。
数据分析:查看三个高优先级的股票,该股票当日的开盘价与收盘价,再与当日(2015-4-8)上证综指进行比较,可得在收益上该算法是优于上证综指为样本的整体股票的股价差收益的。
实验结论:按照上述方式,系统每天推荐出当日股票,在开盘时进行买进,在第二个交易日进行卖出。经过一个月21个交易日(2015-3-1至2015-3-31),系统的收益为20%/月。通过微信搜索公众号来预测市场走势和投资情绪呈现出正相关性,因此可以作为股票甄选的因子。
3.股票预测的大数据发展趋势
网络数据分成三种:
一是浏览数据,主要用于电商领域的消费者行为分析,浏览数据反映了用户每一步的访问脚步,进一步刻画出用户的访问路径,分析不同页面的跳转概率等。
二是搜索数据,主要指搜索引擎记录的关键词被搜索频次的时间序列数据,能反映数亿用户的兴趣、关注点、意图。
三是互动数据,主要是微博、微信、社交网站的数据,反映用户的倾向性和情绪因素。
2013年诺贝尔经济学奖得主罗伯特?席勒的观点被无数采访对象引述。席勒于上世纪80年代设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。
计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。
基于互联网搜索数据和社交行为的经济预测研究,已逐渐成为一个新的学术热点,并在经济、社会以及健康等领域的研究中取得了一定成果。在资本市场应用上,研究发现搜索数据可有效预测未来股市活跃度(以交易量指标衡量)及股价走势的变化。
对于搜索数据:互联网搜索行为与股票市场的关联机理。这个研究属于行为金融与互联网的交叉领域,其原理是:股票量价调整是投资者行为在股票市场上的反应;与此同时,投资者行为在互联网搜索市场也有相应地行为迹象,我们要做到是:找到互联网搜索市场中领先于股票交易的行为指标,综合众多投资者的先行搜索指标,对未来的股票交易做出预判。
如同天气预报那样,不断优化模型、灌入海量信息,然后给出结果。并且在处理的信息中,有80%是“非结构化”数据,例如政策文件、自然事件、地理环境、科技创新等,这类信息通常是电脑和模型难以消化的。采用了语义分析法,可以将互动数据里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资建议,通过分析互动数据的数据文本,作为股市投资的信号。
4.正在发生的未来
大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的将来。
大数据在实用层面的影响很广泛,解决了大量的日常问题。大数据更是利害攸关的,它将重塑我们的生活、工作和思维方式。在某些方面,我们面临着一个僵局,比其他划时代创新引起的社会信息范围和规模急剧扩大所带来的影响更大。我们脚下的地面在移动。过去确定无疑的事情正在受到质疑。大数据需要人们重新讨论决策、命运和正义的性质。拥有知识曾意味着掌握过去,现在则意味着能够预测未来。
大数据并不是一个充斥着算法和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。就好像我们学习处理混乱数据一样,因为这些数据服务的是更加广大的目标。必将混乱构成了世界的本质,也构成了人脑的本职,而无论是世界的混乱还是人脑的混乱,学会接受和应用他们才能得益。
我相信,利用基础数据、搜索数据、互动数据再进行加权计算,可以对所有股票进行大数据遴选,从而给出投资建议。我认为,我们的肉身刚刚步入大数据时代,但我们的精神还滞留在小数据、采样思维之中,率先用理性击碎固有思维的人,也将率先获得大数据带来的益处。
⑧ 金融领域7大数据科学案例
金融领域7大数据科学案例
1 金融领域有哪些典型数据问题?
2 金融领域应用那些数据科学方法?
近年来,数据科学和机器学习应对一系列主要金融任务的能力已成为一个特别重要的问题。 公司希望知道更多技术带来的改进以及他们如何重塑业务战略。
为了帮助您回答这些问题,我们准备了一份对金融行业影响最大的数据科学应用清单。 它们涵盖了从数据管理到交易策略的各种业务方面,但它们的共同点是增强金融解决方案的巨大前景。
自动化风险管理管理客户数据预测分析实时分析欺诈识别消费者分析算法交易深度个性化和定制结论自动化风险管理
风险管理是金融机构极其重要的领域,负责公司的安全性,可信度和战略决策。 过去几年来,处理风险管理的方法发生了重大变化,改变了金融部门的性质。 从未像现在这样,今天的机器学习模型定义了业务发展的载体。
风险可以来自很多来源,例如竞争对手,投资者,监管机构或公司的客户。 此外,风险的重要性和潜在损失可能不同。 因此,主要步骤是识别,优先考虑和监控风险,这是机器学习的完美任务。通过对大量客户数据,金融借贷和保险结果的训练,算法不仅可以增强风险评分模型,还可以提高成本效率和可持续性。
数据科学和人工智能(AI)在风险管理中最重要的应用是识别潜在客户的信誉。 为了为特定客户建立适当的信用额度,公司使用机器学习算法来分析过去的支出行为和模式。 这种方法在与新客户或具有简短信用记录的客户合作时也很有用。
虽然金融风险管理流程的数字化和自动化处于早期阶段,但潜力巨大。 金融机构仍需要为变革做好准备,这种变革通过实现核心财务流程的自动化,提高财务团队的分析能力以及进行战略性技术投资。 但只要公司开始向这个方向发展,利润就不会让自己等待。
管理客户数据
对于金融公司来说,数据是最重要的资源。因此,高效的数据管理是企业成功的关键。今天,在结构和数量上存在大量的金融数据:从社交媒体活动和移动互动到市场数据和交易细节。金融专家经常需要处理半结构化或非结构化数据,手动处理这些数据是一个巨大的挑战。
然而,对于大多数公司来说,将机器学习技术与管理过程集成仅仅是从数据中提取真实知识的必要条件。人工智能工具,特别是自然语言处理,数据挖掘和文本分析有助于将数据转化为智能数据治理和更好的业务解决方案,从而提高盈利能力。例如,机器学习算法可以通过向客户学习财务历史数据来分析某些特定财务趋势和市场发展的影响。最后,这些技术可用于生成自动报告。
预测分析
分析现在是金融服务的核心。 值得特别关注的是预测分析,它揭示了预测未来事件的数据模式,可以立即采取行动。 通过了解社交媒体,新闻趋势和其他数据源,这些复杂的分析方法已经实现了预测价格和客户终生价值,未来生活事件,预期流失率和股市走势等主要应用。 最重要的是,这种技术可以帮助回答复杂的问题 - 如何最好地介入。
实时分析
实时分析通过分析来自不同来源的大量数据从根本上改变财务流程,并快速识别任何变化并找到对其的最佳反应。财务实时分析应用有三个主要方向:
欺诈识别
金融公司有义务保证其用户的最高安全级别。公司面临的主要挑战是找到一个很好的欺诈检测系统,罪犯总是会采用新的方法并设置新的陷阱。只有称职的数据科学家才能创建完美的算法来检测和预防用户行为异常或正在进行的各种欺诈工作流程。例如,针对特定用户的不寻常金融购买警报或大量现金提款将导致阻止这些操作,直到客户确认为止。在股票市场中,机器学习工具可以识别交易数据中的模式,这可能会指示操纵并提醒员工进行调查。然而,这种算法最大的优势在于自我教学的能力,随着时间的推移变得越来越有效和智能化。
消费者分析
实时分析还有助于更好地了解客户和有效的个性化。先进的机器学习算法和客户情绪分析技术可以从客户行为,社交媒体互动,他们的反馈和意见中获得见解,并改善个性化并提高利润。由于数据量巨大,只有经验丰富的数据科学家才能精确分解。
算法交易
这个领域可能受实时分析的影响最大,因为每秒都会受到影响。根据分析传统和非传统数据的最新信息,金融机构可以做出实时有利的决策。而且由于这些数据通常只在短时间内才有价值,因此在这个领域具有竞争力意味着使用最快的方法分析数据。
在此领域结合实时和预测分析时,另一个预期会开启。过去,金融公司不得不聘用能够开发统计模型并使用历史数据来创建预测市场机会的交易算法的数学家。然而,今天人工智能提供了使这一过程更快的技术,而且特别重要的是 - 不断改进。
因此,数据科学和人工智能在交易领域进行了革命,启动了算法交易策略。世界上大多数交易所都使用计算机,根据算法和正确策略制定决策,并考虑到新数据。 人工智能无限处理大量信息,包括推文,财务指标,新闻和书籍数据,甚至电视节目。 因此,它理解当今的全球趋势并不断提高对金融市场的预测。
总而言之,实时和预测分析显着改变了不同金融领域的状况。 通过Hadoop,NoSQL和Storm等技术,传统和非传统数据集以及最精确的算法,数据工程师正在改变财务用于工作的方式。
深度个性化和定制
企业认识到,在当今市场竞争的关键步骤之一是通过与客户建立高质量的个性化关系来提高参与度。 这个想法是分析数字客户体验,并根据客户的兴趣和偏好对其进行修改。 人工智能在理解人类语言和情感方面取得重大进展,从而将客户个性化提升到一个全新的水平。 数据工程师还可以建立模型,研究消费者的行为并发现客户需要财务建议的情况。 预测分析工具和高级数字交付选项的结合可以帮助完成这项复杂的任务,在最恰当的时机指导客户获得最佳财务解决方案,并根据消费习惯,社交人口趋势,位置和其他偏好建议个性化服务。
结论
对于金融机构来说,数据科学技术的使用提供了一个从竞争中脱颖而出并重塑其业务的巨大机会。大量不断变化的财务数据造成了将机器学习和AI工具引入业务不同方面的必要性。
我们认为,我们主要关注金融领域的7大数据科学用例,但还有很多其他值得一提的。 如果您有任何进一步的想法,请在评论部分分享您的想法。
⑨ 大数据股票有哪些
大数据概念股 : 就主题投资而言,"大数据"概念2012年有望成为具有较强冲击力的新主题,大数据概念实际上是从海量数据有效利用的角度对云计算、物联网等概念的综合,更加准确地抓住了云计算、物联网的本质,以数据处理和数据中心建设与运维为主要业务的公司是最为贴切的投资标的。 "大数据"产业链条包含了从数据生成、数据存储、数据处理和数据展示等多个环节。完整的生态系统还应当包括大数据处理结果的应用。 "大数据"时代更多的商机来自于应用,我们认为国内企业有机会获得较大的发展空间。与大数据相关的投资标的有以下几类。 第一类是与海量数据的存储和处理相关的公司,关注拓尔思、美亚柏科、恒泰艾普、潜能恒信、天泽信息。 第二类是与数据中心建设与运营维护相关的公司,包括荣之联、天玑科技、银信科技。 第三类是与视频化应用相关的公司,包括视频监控业务为主的海康威视、大华股份、威创股份、华平股份。 第四类是与智能化和人机交互概念相关的公司,关注科大讯飞、用友软件、东方国信等。 (南方股票频道)
⑩ 大数据龙头股票
大数据龙头股有福田汽车600166、浪潮信息000977、东华软件002065、梦网科技002123、高鸿股份000851、亚联发展002316、合众思壮002383、广联达002410、海联金汇002537。
1、福田汽车600166:大数据龙头。公司是网络Apollo的合作伙伴,与网络就车联网、大数据、智能汽车和无人驾驶展开全面合作,共同打造面向未来的智能互联网商用汽车。
2、浪潮信息000977:国内领先的云计算、大数据服务商,AI计算战略为支柱业务。
3、东华软件002065:东华医为拟出资5000万元设东华医为大数据上海。
4、梦网科技002123:2021年5月26日,中国国际大数据产业博览会在贵阳举行,梦网科技(002123)旗下全资子公司鞍山市云数科技发展有限公司参会。
5、高鸿股份000851:大数据龙头。2014年6月17日晚间公告称,公司拟联合贵州旅游投资控股有限责任公司、贵州产业技术发展研究院,合计认缴资5000万元发起方式设立贵州大数据旅游产业股份有限公司,立足贵州,面向全国打造知名的大数据旅游平台运营公司。
6、亚联发展002316:公司将积极投身智慧化浪潮,以第三方支付为切入,综合运用科技能力、大数据能力、资源匹配能力和数字化运营能力,为中小微商户的智慧经营进行多维度赋能,推动“上云用数赋智”产业政策的落地,助力于数字化生态的实现。
7、合众思壮002383:2019年6月17日公告,公司与青海省大数据有限责任公司(以下简称“青海大数据公司”)本着发展、共赢、平等、互利的原则于2019年6月16日签订《战略合作协议》。
8、广联达002410:经过近二十年的发展,公司业务领域由招投标阶段拓展至设计阶段和施工阶段;产品从单一的预算软件扩展到工程造价、工程施工、产业金融等多个业务板块的近百款产品,涵盖工具类、解决方案类、大数据、移动互联网、云、智能硬件设备、产业金融服务等业务形态;服务的客户从中国境内拓展到全球一百多个国家。
9、海联金汇002537:公司金融科技板块主要从事第三方支付服务、大数据服务、移动信息服务、跨境电商服务及运营商计费结算服务业务;智能制造板块主要从事汽车及配件、家电配件等产品的生产与销售业务。
拓展资料:
大数据概念股龙头股还有:海量数据(603138)、科创信息(300730)、新国都(300130)、德生科技(002908)、真视通(002771)、拓尔思(300229)、思特奇(300608)、先进数通(300541)、同有科技(300302)、众应互联(002464)等。