麦肯锡全球研究所给出的定义是:一个数据集合,其规模之大,在获取、存储、管理和分析等方面大大超过了传统数据库软件工具的能力。具有数据规模海量、数据流转迅速、数据类型多样、价值密度低四大特点。
“大数据”的研究机构Gartner给出了这样的定义。“大数据”是一种信息资产,需要新的处理模式,以具有更强的决策、洞察和流程优化能力,以适应海量、高增长率和多样化。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些有意义的数据进行专业的处理。换句话说,如果把大数据比作一个行业,这个行业盈利的关键在于提高数据的“处理能力”,通过“处理”实现数据的“增值”。
从技术上讲,大数据和云计算的关系就像硬币的正反面一样密不可分。大数据不能用单台计算机处理,必须采用分布式架构。其特点在于海量数据的分布式数据挖掘。但它必须依赖云计算分布式处理、分布式数据库、云存储和虚拟化技术。
应用程序:
洛杉矶警察局和加州大学合作,利用大数据预测犯罪的发生。
谷歌流感趋势使用搜索关键词来预测禽流感的传播。
统计学家内特·西尔弗利用大数据预测了2012年美国大选结果。
麻省理工学院利用手机定位数据和交通数据建立城市规划。
梅西百货的实时定价机制。根据需求和库存情况,该公司基于SAS的系统实时调整多达7300万件商品的价格。
医疗行业长期以来一直受到海量数据和非结构化数据的挑战。近年来,许多国家都在积极推动医疗信息化的发展,这使得许多医疗机构有资金做大数据分析。
欢迎分享,转载请注明来源:民族网