第二节 大数据规模
一 全球数据量
单纯从数据量来看,IBM网站中提到“我们每天创造2.5EB的数据量”。另外,国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年为0.8ZB,2010年为1.2ZB,2011年高达1.82ZB,2011年的数据量相当于全球每人产生200GB以上的数据(见图2-1)。全人类历史上说过的所有话语的数据量大约是5EB。
图2-1 2005~2013年度全球数据量
资料来源:国际数据公司“数字宇宙研究报告”。
IDC数字宇宙研究报告《大数据,更大的数字身影,最大增长在远东》还显示,中国数据量增长最为显著,到2020年数字宇宙将超出预期达到44ZB,这一数据是2011年的24倍,而人均产生的数据量预计在2020年也将达到5247GB。
二 全球大数据市场规模
大数据市场规模方面,贵阳大数据交易所数据显示,2014年全球大数据产业市场规模达到920亿美元。随着各国抢抓战略布局,不断加大扶持力度及资本投入,全球大数据市场规模保持高速增长态势。当下,大数据进入了从概念到实际应用的关键转折期。
从贵阳大数据交易所统计的指标来看,目前全球大数据发展主要集中在北美洲、亚洲和欧洲区域。预计2020年,美国仍将在全球大数据产业市场份额中排名靠前,占据37.22%;中国紧随其后,占据20.30%;欧洲位列第三,占据15.64%(见图2-2)。依据贵阳大数据交易所的统计数据还可以得到,2015年的全球大数据市场规模达到1403亿美元,预计2020年将达到10270亿美元(见图2-3)。
图2-2 2020年全球各地区大数据产业市场份额预测
数据来源:贵阳大数据交易所。
图2-3 2014~2020年全球大数据产业市场规模及增长率
数据来源:贵阳大数据交易所。
美国、英国和法国也都发布了一系列与大数据相关的政策,以扶持和引导大数据及相关产业的发展(见表2-2)。
表2-2 美国、英国和法国数据开放政策
三 中国数据量
公开数据显示,百度2013年拥有数据量接近EB级别。2014年4月,百度发布“大数据引擎”,全面对外开放自己的大数据平台,将开放云、数据工厂和百度大脑等核心大数据能力开放,向外界提供大数据存储、分析和挖掘技术服务。
阿里集团、腾讯公司也都声明自己存储的数据总量达到了100PB以上。根据阿里集团透露,在阿里数据平台事业部的服务器上攒下了超过100PB已经处理过的数据。这相当于4万个西雅图中央图书馆,580亿本藏书。腾讯未来也将通过数据共享及战略合作扩容腾讯数据池,创造更高的数据价值,形成智慧数据服务。此外,电信、医疗、金融、公共安全、交通和气象等各个领域保存的数据量也都达到数十或者上百拍字节。
四 中国大数据市场规模
目前,中国大数据产业处于起步阶段,经济较发达的地区是大数据产生和应用的集聚地。2016年我国大数据市场规模达到129.3亿元,同比增长30.7%(见图2-4)。
图2-4 2012~2016年中国大数据市场规模及增长率
数据来源:贵阳大数据交易所。
随着宏观政策环境不断完善,大数据已上升为国家战略。自2006年以来,我国出台了多项有关大数据的规定,以促进数据开放共享、促进大数据产业发展。2012年8月,我国国家统计局统计科学研究所组织召开了大数据应用研究座谈会。2016年5月25日,国务院总理李克强参加中国大数据产业峰会开幕式并致辞,彰显了政府对国家大数据战略的极力推动与重视。2006年以来,我国正式发布的一系列推动信息化和大数据的相关政策,都直接或间接地为扶持和引导大数据及相关产业发展提供了一定政策支持和保障(见表2-3)。
表2-3 中国推动大数据产业发展政策汇总
续表