‘壹’ 股票量化是什么意思
所谓量化交易,是指以先进的数学模型替代人为的主观判断,同时利用计算机技术从庞大的历史数据中海选出能带来超额收益的多种“大概率”事件以制定策略,极大地减少了投资者情绪波动的影响,避免在市场极度狂热或悲观的情况下作出非理性的投资决策。
量化选股就是利用数量化的方法选择股票组合,期望该股票组合能够获得超越基准收益率的投资行为,研究表明,板块、行业轮动在机构投资者的交易中最为获利的盈利模式是基于行业层面进行周期性和防御性的轮动配置,这也是机构投资者最普遍采用的策略。此外,周期性股票在扩张性货币政策时期表现较好,而在紧缩环境下则支持非周期性行业。行业收益差在扩张性政策和紧缩性政策下具有显着的差异。
拓展资料:
一、量化交易特点
1、纪律性。根据模型的运行结果进行决策,而不是凭感觉。纪律性既可以克制人性中贪婪、恐惧和侥幸心理等弱点,也可以克服认知偏差,且可跟踪。
2、系统性。具体表现为“三多”。一是多层次,包括在大类资产配置、行业选择、精选具体资产三个层次上都有模型;二是多角度,定量投资的核心思想包括宏观周期、市场结构、估值、成长、盈利质量、分析师盈利预测、市场情绪等多个角度;三是多数据,即对海量数据的处理。
3、套利思想。定量投资通过全面、系统性的扫描捕捉错误定价、错误估值带来的机会,从而发现估值洼地,并通过买入低估资产、卖出高估资产而获利。
4、概率取胜。一是定量投资不断从历史数据中挖掘有望重复的规律并加以利用;二是依靠组合资产取胜,而不是单个资产取胜。
二、量化交易潜在风险
1、历史数据的完整性。行情数据不完整可能导致模型与行情数据不匹配。行情数据自身风格转换,也可能导致模型失败,如交易流动性,价格波动幅度,价格波动频率等,而这一点是量化交易难以克服的。
2、模型设计中没有考虑仓位和资金配置,没有安全的风险评估和预防措施,可能导致资金、仓位和模型的不匹配,而发生爆仓现象。
3、网络中断,硬件故障也可能对量化交易产生影响。
4、同质模型产生竞争交易现象导致的风险。
5、单一投资品种导致的不可预测风险。
‘贰’ 量化交易是什么意思
量化交易是指以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,极大地减少了投资者情绪波动的影响,避免在市场极度狂热或悲观的情况下作出非理性的投资决策。
‘叁’ 估值是什么意思呢
估值是评定一项资产当时价值的过程。
指对依从价(ad valorem)课征关税的进口货物,核定其做为课征关税的课征价格或完税价格(ty-paying value)。并且估计其能够到达的预计价值。
估值也是股市中对于某种股票价值的体现。如某只股票的市价为9元,如果此公司的经营业绩非常良好,估值区域在30-40之间,说明此股票在资本市场严重低估。此时介入危险系数会比较小。
‘肆’ 大数据板块股票有哪些
大数据板块79只个股
‘伍’ 大数据与海量数据的区别
大数据与海量数据的区别
如果仅仅是海量的结构性数据,那么解决的办法就比较的单一,用户通过购买更多的存储设备,提高存储设备的效率等解决此类问题。然而,当人们发现数据库中的数据可以分为三种类型:结构性数据、非结构性数据以及半结构性数据等复杂情况时,问题似乎就没有那么简单了。
大数据汹涌来袭
当类型复杂的数据汹涌袭来,那么对于用户IT系统的冲击又会是另外一种处理方式。很多业内专家和第三方调查机构通过一些市场调查数据发现,大数据时代即将到来。有调查发现,这些复杂数据中有85%的数据属于广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据的产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断涌现和应用。
如今大数据的概念也存在着很多的炒作和大量的不确定性。为此,编者详细向一些业内专家详细了解有关方面的问题,请他们谈一谈,大数据是什么和不是什么,以及如何应对大数据等问题,将系列文章的形式与网友见面。
有人将多TB数据集也称作”大数据”。据市场研究公司IDC统计,数据使用预计将增长44倍,全球数据使用量将达到大约35.2ZB(1ZB = 10亿TB)。然而,单个数据集的文件尺寸也将增加,导致对更大处理能力的需求以便分析和理解这些数据集。
EMC曾经表示,它的1000多个客户在其阵列中使用1PB(千兆兆)以上的数据数据,这个数字到2020年将增长到10万。一些客户在一两年内还将开始使用数千倍多的数据,1EB(1艾字节 = 10亿GB)或者更多的数据。
对大企业而言,大数据的兴起部分是因为计算能力可用更低的成本获得,且各类系统如今已能够执行多任务处理。其次,内存的成本也在直线下降,企业可以在内存中处理比以往更多的数据,另外是把计算机聚合成服务器集群越来越简单。IDC认为,这三大因素的结合便催生了大数据。同时,IDC还表示,某项技术要想成为大数据技术,首先必须是成本可承受的,其次是必须满足IBM所描述的三个”V”判据中的两个:多样性(variety)、体量(volume)和速度(velocity)。
多样性是指,数据应包含结构化的和非结构化的数据。
体量是指聚合在一起供分析的数据量必须是非常庞大的。
而速度则是指数据处理的速度必须很快。
大数据”并非总是说有数百个TB才算得上。根据实际使用情况,有时候数百个GB的数据也可称为大数据,这主要要看它的第三个维度,也就是速度或者时间维度。
Garter表示,全球信息量正在以59%以上的年增长率增长,而量是在管理数据、业务方面的显着挑战,IT领袖必须侧重在信息量、种类和速度上。
量:企业系统内部的数据量的增加是由交易量、其它传统数据类型和新的数据类型引发的。过多的量是一个存储的问题,但过多的数据也是一个大量分析的问题。
种类:IT领袖在将大量的交易信息转化为决策上一直存在困扰 – 现在有更多类型的信息需要分析 – 主要来自社交媒体和移动(情景感知)。种类包括表格数据(数据库)、分层数据、文件、电子邮件、计量数据、视频、静态图像、音频、股票行情数据、金融交易和其它更多种类。
速度:这涉及到数据流、结构化记录的创建,以及访问和交付的可用性。速度意味着正在被生成的数据有多快和数据必须被多快地处理以满足需求。
虽然大数据是一个重大问题,Gartner分析师表示,真正的问题是让大数据更有意义,在大数据里面寻找模式帮助组织机构做出更好的商业决策。
诸子百家谈如何定义”大数据”
尽管”Big Data”可以翻译成大数据或者海量数据,但大数据和海量数据是有区别的。
定义一:大数据 = 海量数据 + 复杂类型的数据
Informatica中国区首席产品顾问但彬认为:”大数据”包含了”海量数据”的含义,而且在内容上超越了海量数据,简而言之,”大数据”是”海量数据”+复杂类型的数据。
但彬进一步指出:大数据包括交易和交互数据集在内的所有数据集,其规模或复杂程度超出了常用技术按照合理的成本和时限捕捉、管理及处理这些数据集的能力。
大数据是由三项主要技术趋势汇聚组成:
海量交易数据:在从 ERP应用程序到数据仓库应用程序的在线交易处理(OLTP)与分析系统中,传统的关系数据以及非结构化和半结构化信息仍在继续增长。随着企业将更多的数据和业务流程移向公共和私有云,这一局面变得更加复杂。海量交互数据:这一新生力量由源于 Facebook、Twitter、LinkedIn 及其它来源的社交媒体数据构成。它包括了呼叫详细记录(CDR)、设备和传感器信息、GPS和地理定位映射数据、通过管理文件传输(Manage File Transfer)协议传送的海量图像文件、Web 文本和点击流数据、科学信息、电子邮件等等。海量数据处理:大数据的涌现已经催生出了设计用于数据密集型处理的架构,例如具有开放源码、在商品硬件群中运行的 Apache Hadoop。对于企业来说,难题在于以具备成本效益的方式快速可靠地从 Hadoop 中存取数据。定义二:大数据包括A、B、C三个要素
如何理解大数据?NetApp 大中华区总经理陈文认为,大数据意味着通过更快获取信息来使做事情的方式变得与众不同,并因此实现突破。大数据被定义为大量数据(通常是非结构化的),它要求我们重新思考如何存储、管理和恢复数据。那么,多大才算大呢?考虑这个问题的一种方式就是,它是如此之大,以至于我们今天所使用的任何工具都无法处理它,因此,如何消化数据并把它转化成有价值的洞见和信息,这其中的关键就是转变。
基于从客户那里了解的工作负载要求,NetApp所理解的大数据包括A、B、C三个要素:分析(Analytic),带宽(Bandwidth)和内容(Content)。
1. 大分析(Big Analytics),帮助获得洞见 – 指的是对巨大数据集进行实时分析的要求,它能带来新的业务模式,更好的客户服务,并实现更好的结果。
2. 高带宽(Big Bandwidth),帮助走得更快 – 指的是处理极端高速的关键数据的要求。它支持快速有效地消化和处理大型数据集。
3. 大内容(Big Content),不丢失任何信息- 指的是对于安全性要求极高的高可扩展的数据存储,并能够轻松实现恢复。它支持可管理的信息内容存储库、而不只是存放过久的数据,并且能够跨越不同的大陆板块。
大数据是一股突破性的经济和技术力量,它为 IT 支持引入了新的基础架构。大数据解决方案消除了传统的计算和存储的局限。借助于不断增长的私密和公开数据,一种划时代的新商业模式正在兴起,它有望为大数据客户带来新的实质性的收入增长点以及富于竞争力的优势。
以上是小编为大家分享的关于大数据与海量数据的区别的相关内容,更多信息可以关注环球青藤分享更多干货
‘陆’ 海量数据的介绍
海量数据是北京海量数据技术股份有限公司的简称,创立于2007年,是中国领先的数据技术服务提供商,业务涵盖数据技术的系统集成、技术服务和产品研发,旗下控股2家子公司:北京海量云信息技术有限公司、海量云图(北京)数据技术有限公司。公司总部设在北京,在沈阳、济南、上海、南京、武汉、广州、深圳、成都、西安等多个城市设有办事机构,海量数据自成立以来一直保持强劲发展势头,年均复合增长率超过35%。
‘柒’ 海量数据股票代码多少
603138,海量数据。这是一个次新股,最高涨到83.9,现在回落到54.3元。属于计算机应用行业。目前价格依然虚高,不建议买入。
‘捌’ 大数据股票有哪些
大数据概念股 : 就主题投资而言,"大数据"概念2012年有望成为具有较强冲击力的新主题,大数据概念实际上是从海量数据有效利用的角度对云计算、物联网等概念的综合,更加准确地抓住了云计算、物联网的本质,以数据处理和数据中心建设与运维为主要业务的公司是最为贴切的投资标的。 "大数据"产业链条包含了从数据生成、数据存储、数据处理和数据展示等多个环节。完整的生态系统还应当包括大数据处理结果的应用。 "大数据"时代更多的商机来自于应用,我们认为国内企业有机会获得较大的发展空间。与大数据相关的投资标的有以下几类。 第一类是与海量数据的存储和处理相关的公司,关注拓尔思、美亚柏科、恒泰艾普、潜能恒信、天泽信息。 第二类是与数据中心建设与运营维护相关的公司,包括荣之联、天玑科技、银信科技。 第三类是与视频化应用相关的公司,包括视频监控业务为主的海康威视、大华股份、威创股份、华平股份。 第四类是与智能化和人机交互概念相关的公司,关注科大讯飞、用友软件、东方国信等。 (南方股票频道)
‘玖’ 数据中心龙头股票有哪些
数据中心龙头股票有:
一、光环新网(300383)
龙头。公司不断改进技术水平、提升服务品质,以高品质服务、高性价比优势成为众多知名客户的优选对象。
2020年报显示,光环新网净利润9.13亿,近三年复合增长为16.95%;净资产收益率10.38%,每股收益0.5900元。
二、鹏博士(600804)
龙头。国内规模领先的中立数据中心厂商之一;公司中报净利润同比增长208%,因本期处置数据中心资产组产生资产处置收益,使得2021年1-6月净利润同比增加6.77亿。
公司2020年实现净利润1.01亿,近三年复合增长为-48.52%;毛利率43.54%。
三、数据港(603881)
龙头。云计算数据中心基础设施运维作为公司核心业务,一直保持较大的竞争优势,且公司仍在不断努力,寻求更高的突破。
2020年净利润1.36亿,同比上年增长率为23.58%。
四、特发信息(000070)
西安数据中心建设项目尚未正式开工,开工后预计工期180天。
2020年报显示,特发信息实现净利润1145万,同比增长-96.46%,近五年复合增长为-50.82%;毛利率18.68%。
数据中心股票其他的还有: 达实智能、中衡设计、宝信软件、海量数据、城地香江、中通国脉、南兴股份、三钢闽光、银江技术、证通电子、省广集团、和达科技、圣阳股份、仕佳光子、金信诺、海峡创新、汇金股份、高鸿股份等。
【拓展资料】
龙头股指的是某一时期在股票市场的炒作中对同行业板块的其他股票具有影响和号召力的股票,它的涨跌往往对其他同行业板块股票的涨跌起引导和示范作用。
龙头股并不是一成不变的,它的地位往往只能维持一段时间。成为龙头股的依据是,任何与某只股票有关的信息都会立即反映在股价上。
‘拾’ 大数据在金融行业的应用与挑战
大数据在金融行业的应用与挑战
A 具有四大基本特征
金融业基本是全世界各个行业中最依赖于数据的,而且最容易实现数据的变现。全球最大的金融数据公司Bloomberg在1981年成立时“大数据”概念还没有出现。Bloomberg的最初产品是投资市场系统(IMS),主要向各类投资者提供实时数据、财务分析等。
随着信息时代降临,1983年估值仅1亿美元的Bloomberg以30%股份的代价换取美林3000万美元投资,先后推出Bloomberg Terminal、News、Radio、TV等各类产品。1996年Bloomberg身价已达20亿美元,并以2亿美元从美林回购了10%的股份。2004年Bloomberg在纽约曼哈顿中心建成246米摩天高楼。到2008年次贷危机,美林面临崩盘,其剩余20%的Bloomberg股份成为救命稻草。Bloomberg趁美林之危赎回所有股份,估值跃升至225亿美元。2016年Bloomberg全球布局192个办公室,拥有1.5万名员工,年收入约100亿美元,估值约1000亿美元,超过同年市值为650亿美元的华尔街标杆高盛。
大数据概念形成于2000年前后,最初被定义为海量数据的集合。2011年,美国麦肯锡公司在《大数据的下一个前沿:创新、竞争和生产力》报告中最早提出:大数据指大小超出典型数据库软件工具收集、存储、管理和分析能力的数据集。
具体来说,大数据具有四大基本特征:
一是数据体量大,指代大型数据集,一般在10TB规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量。
二是数据类别大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据。
三是处理速度快,在数据量非常庞大的情况下,也能够做到数据的实时处理。数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。
四是数据的真实性高,随着社交数据、企业内容、交易与应用数据等新数据源的兴起,传统数据源的局限被打破,信息的真实性和安全性显得极其重要。
而相比其他行业,金融数据逻辑关系紧密,安全性、稳定性和实时性要求更高,通常包含以下关键技术:数据分析,包括数据挖掘、机器学习、人工智能等,主要用于客户信用、聚类、特征、营销、产品关联分析等;数据管理,包括关系型和非关系型数据、融合集成、数据抽取、数据清洗和转换等;数据使用,包括分布式计算、内存计算、云计算、流处理、任务配置等;数据展示,包括可视化、历史流及空间信息流展示等,主要应用于对金融产品健康度、产品发展趋势、客户价值变化、反洗钱反欺诈等监控和预警。
B 重塑金融行业竞争新格局
“互联网+”之后,随着世界正快速兴起“大数据+”,金融行业悄然出现以下变化:
大数据特征从传统数据的“3个V”增加到“5个V”。在数量(Volume)、速度(Velocity)、种类(Variety)基础上,进一步完善了价值(Value)和真实性(Veracity),真实性包括数据的可信性、来源和信誉、有效性和可审计性等。
金融业按经营产品分类变为按运营模式分类。传统金融业按经营产品划分为银行、证券、期货、保险、基金五类,随着大数据产业兴起和混业经营的发展,现代金融业按运营模式划分为存贷款类、投资类、保险类三大类别。
大数据市场从垄断演变为充分市场竞争。全球大数据市场企业数量迅速增多,产品和服务的差异增大,技术门槛逐步降低,市场竞争日益激烈。行业解决方案、计算分析服务、存储服务、数据库服务和大数据应用成为市场份额排名最靠前的五大细分市场。
大数据形成新的经济增长点。Wikibon数据显示,2016年,全球大数据硬件、软件和服务整体市场增长22%达到281亿美元,预计到2027年,全球在大数据硬件、软件和服务上的整体开支的复合年增长率为12%,将达到大约970亿美元。
数据和IT技术替代“重复性”业务岗位。数据服务公司Eurekahedge通过追踪23家对冲基金,发现5位对冲基金经理薪金总额为10亿美元甚至更高。过去10年,靠数学模型分析金融市场的物理学家和数学家“宽客”一直是对冲基金的宠儿,其实大数据+人工智能更精于此道。高盛的纽约股票现金交易部门2000年有600名交易员而如今只剩两人,其任务全由机器包办,专家称10年后高盛员工肯定比今天还要少。
美国大数据发展走在全球前列。美国政府宣称:“数据是一项有价值的国家资本,应对公众开放,而不是将其禁锢在政府体制内。”作为大数据的策源地和创新引领者,美国大数据发展一直走在全球最前列。自20世纪以来,美国先后出台系列法规,对数据的收集、发布、使用和管理等做出具体的规定。2009年,美国政府推出Data.gov政府数据开放平台,方便应用领域的开发者利用平台开发应用程序,满足公共需求或创新创业。2010年,美国国会通过更新法案,进一步提高了数据采集精度和上报频度。2012年3月,奥巴马政府推出《大数据研究与开发计划》,大数据迎来新一轮高速发展。
英国是欧洲金融中心,大数据成为其领先科技之一。2013年,英国投资1.89亿英镑发展大数据。2015年,新增7300万英镑,创建了“英国数据银行”data.gov.uk网站。2016年,伦敦举办了超过22000场科技活动,同年,英国数字科技投资逾68亿英镑,而收入则超过1700亿英镑。另外,英国统计局利用政府资源开展“虚拟人口普查”,仅此一项每年节省5亿英镑经费。
C 打造高效金融监管体系
大数据用已发生的总体行为模式和关联逻辑预测未来,决策未来,作为现代数字科技的核心,其灵魂就是——预测。
侦测、打击逃税、洗钱与金融诈骗
全球每年因欺诈造成的经济损失约3.7万亿美元,企业因欺诈受损通常为年营收额的5%。全球最大软件公司之一美国SAS公司与税务、海关等政府部门和全球各国银行、保险、医疗保健等机构合作,有效应对日益复杂化的金融犯罪行为。如在发放许可之前,通过预先的数据分析检测客户是否有过行受贿、欺诈等前科,再确定是否发放借贷或海关通关。SAS开发的系统已被国际公认为统计分析的标准软件,在各领域广泛应用。英国政府利用大数据检测行为模式检索出200亿英镑的逃税与诈骗,追回了数十亿美元损失。被福布斯评为美国最佳银行的德克萨斯资本银行(TCBank),不断投资大数据技术,反金融犯罪系统与银行发展同步,近3年资产从90亿美元增至210亿美元。荷兰第三大人寿保险公司CZ依靠大数据对骗保和虚假索赔行为进行侦测,在支付赔偿金之前先期阻断,有效减少了欺诈发生后的司法补救。
大数据风控建立客户信用评分、监测对照体系
美国注册舞弊审核师协会(ACFE)统计发现,缺乏反欺诈控制的企业会遭受高额损失。美国主流个人信用评分工具FICO能自动将借款人的历史资料与数据库中全体借款人总体信用习惯相比较,预测借款人行为趋势,评估其与各类不良借款人之间的相似度。美国SAS公司则通过集中浏览和分析评估客户银行账户的基本信息、历史行为模式、正在发生行为模式(如转账)等,结合智能规则引擎(如搜索到该客户从新出现的国家为特有用户转账,或在新位置在线交易等),进行实时反欺诈分析。
美国一家互联网信用评估机构通过分析客户在Facebook、Twitter等社交平台留下的信息,对银行的信贷和投保申请客户进行风险评估,并将结果出售给银行、保险公司等,成为多家金融机构的合作伙伴。
D 数据整合困难
应用经济指标预测系统分析市场走势
IBM使用大数据信息技术成功开发了“经济指标预测系统”,该系统基于单体数据进行提炼整合,通过搜索、统计、分析新闻中出现的“新订单”等与股价指标有关的单词来预测走势,然后结合其他相关经济数据、历史数据分析其与股价的关系,从而得出行情预测结果。
追踪社交媒体上的海量信息评估行情变化
当今搜索引擎、社交网络和智能手机上的微博、微信、论坛、新闻评论、电商平台等每天生成几百亿甚至千亿条文本、音像、视频、数据等,涵盖厂商动态、个人情绪、行业资讯、产品体验、商品浏览和成交记录、价格走势等,蕴含巨大财富价值。
2011年5月,规模为4000万美元的英国对冲基金DC Markets,通过大数据分析Twitter的信息内容来感知市场情绪指导投资,首月盈利并以1.85%的收益率一举战胜其他对冲基金仅0.76%的平均收益率。
美国佩斯大学一位博士则利用大数据追踪星巴克、可口可乐和耐克公司在社交媒体的围观程度对比其股价,证明Facebook、Twitter和 Youtube上的粉丝数与股价密切相关。
提供广泛的投资选择和交易切换
日本个人投资理财产品Money Design在应用程序Theo中使用算法+人工智能,最低门槛924美元,用户只需回答风险承受水平、退休计划等9个问题,就可使用35种不同货币对65个国家的1.19万只股票进行交易和切换,年度管理费仅1%。Money Design还能根据用户投资目标自动平衡其账户金额,预计2020年将超过2万亿美元投资该类产品。
利用云端数据库为客户提供记账服务
日本财富管理工具商Money Forward提供云基础记账服务,可管理工资、收付款、寄送发票账单、针对性推送理财新项目等,其软件系统连接并整合了2580家各类金融机构的各类型帐户,运用大数据分析的智能仪表盘显示用户当前财富状况,还能分析用户以往的数据以预测未来的金融轨迹。目前其已拥有50万商家和350万个体用户,并与市值2.5万亿美元的山口金融集团联合开发新一款APP。
为客户定制差异化产品和营销方案
金融机构迫切需要掌握更多用户信息,继而构建用户360度立体画像,从而对细分客户进行精准营销、实时营销、智慧营销。
一些海外银行围绕客户“人生大事”,分析推算出大致生活节点,有效激发其对高价值金融产品的购买意愿。如一家澳大利亚银行通过大数据分析发现,家中即将诞生婴儿的客户对寿险产品的潜在需求最大,于是通过银行卡数据监控准妈妈开始购买保胎药品和婴儿相关产品等现象,识别出即将添丁的家庭,精准推出定制化金融产品套餐,受到了客户的积极响应,相比传统的短信群发模式大幅提高了成功率。
催生并支撑人工智能交易
“量化投资之王”西蒙斯被公认为是最能赚钱的基金经理人,自1988年创立文艺复兴科技公司的旗舰产品——大奖章基金以来,其凭借不断更新完善的大数据分析系统,20年中创造出35%的年均净回报率,比索罗斯同期高10%,比股神巴菲特同期高18%,成为有史以来最成功的对冲基金,并于1993年基金规模达2.7亿美元时停止接受新投资。在美国《Alpha》杂志每年公布的对冲基金经理排行榜上,西蒙斯2005年、2006年分别以15亿美元、17亿美元净收入稳居全球之冠,2007年以13亿美元位列第五,2008年再以25亿美元重返榜首。
推动金融产品和服务创新
E 面临三大挑战
目前,全球各行业数据量的增长速度惊人,在我国尤其集中在金融、交通、电信、制造业等重点行业,信息化的不断深入正在进一步催生更多新的海量数据。
据统计,2015年中国的数据总量达到1700EB以上,同比增长90%,预计到2020年这一数值将超过8000EB。以银行业为例,每创收100万元,银行业平均产生130GB的数据,数据强度高踞各行业之首。但在金融企业内部数据处于割裂状态,业务条线、职能部门、渠道部门、风险部门等各个分支机构往往是数据的真正拥有者,缺乏顺畅的共享机制,导致海量数据往往处于分散和“睡眠”状态,虽然金融行业拥有的数据量“富可敌国”,但真正利用时却“捉襟见肘”。
数据安全暗藏隐患
大数据本质是开放与共享,但如何界定、保护个人隐私权却成为法律难题。大数据存储、处理、传输、共享过程中也存在多种风险,不仅需要技术手段保护,还需相关法律法规规范和金融机构自律。多项实际案例表明,即使无害的数据大量囤积也会滋生各种隐患。安全保护对象不仅包括大数据自身,也包含通过大数据分析得出的知识和结论。在线市场平台英国Handshake.uk.com就尝试允许用户协商个人数据被品牌分享所得的报酬。
人才梯队建设任重道远
人才是大数据之本。与信息技术其他细分领域人才相比,大数据发展对人才的复合型能力要求更高,需要掌握计算机软件技术,并具备数学、统计学等方面知识以及应用领域的专业知识。