0.3 让大数据“活”起来
如何让数据变成真正的资产,变成真正的“金库”?如何让数据“活”起来,并“火”起来?这成为人们追求和思考的话题。
法国著名雕塑家罗丹说过,“世界上并不缺少美,只是缺少发现美的眼睛”。同样,世界上并不缺少数据,而是缺少开发数据的工具。大数据不是最近才有的,数据一直存在,只是大数据的价值近几年才被人们认识到,分析数据的能力近几年才有了革命性的突破。
有报道称,世界上每分钟产生1700TB的数据,无论是工业、金融、研究、办公、媒体还是日常生活,产生的数据均可成为大数据的一部分。但是吸引我们的不仅仅是这个庞大的数字本身,还在于我们可以用这些数据做些什么。因为数据本身不产生价值,如何分析和利用大数据对业务产生帮助才是关键。
从具体应用上来看,大数据发挥的真正价值还不是特别明显,也就是说,还没有“生产化”,企业现在热衷做的不是从大数据中提炼出价值,而更多的是存储一切能够搜集到的数据,留待以后从中挖掘价值。诚然,就目前而言,大数据处理和分析尚未成熟,尤其是在从IT手段转化为经营效益的过程中,可以说大数据很难真正找到“数据变现”的法门。
从大数据“生成”到“产生价值”,需要一个很复杂的过程:首先需要大数据采集,其次对采集之后的数据进行预处理和存储,最后对这些存储的数据进行分析和挖掘,并展现在用户面前,最终变成真正有用的资产。
目前IT界最火的两个词莫过于“大数据”和“云计算”,一时间,几乎所有的IT公司都在改革,拼命往“大数据”和“云计算”两条轨道上挤。其实大数据和云计算可以说是相辅相成的。自从有了云计算服务器,“大数据”才有了可以运行的轨道,才可以实现其真正的价值。有人将各种“大数据”的应用形象地比作一辆辆“汽车”,支撑这些“汽车”运行的“高速公路”就是云计算。最著名的实例就是Google搜索引擎。面对海量Web数据,Google于2006年首次提出“云计算”的概念。支撑Google内部各种“大数据”应用的,正是Google公司自行研发的云计算服务器。
近几年,大数据的分析技术可谓是“遍地开花”。针对不同的场景和需求,各大IT公司争先恐后地提出了各种各样的方案和技术。本书将对大数据的处理技术进行讨论,分析各项大数据处理技术的特点及适用场景,为不同的大数据场景提供切实可行的处理方案。也就是阐述怎么让大数据“活”起来。