支付宝存款利息计算器:年度盘点:2012年3S行业最值得关注的十大新技术热点

来源:百度文库 编辑:偶看新闻 时间:2024/04/28 00:18:47

大数据

  继云计算的概念被业界关注后,大数据也进入了人们的视野。目前对于大数据还没有统一的定义,通常认为大数据即是海量的非结构化数据,其特点是数据量很大,数据的形式多样化。而IBM对大数据特征的定义是:大量化(Volume)、多样化(Variety)和快速化(Velocity),并且在此基础上形成的高价值(Value)。

  如果对现在到底产生多少数据还没有一个概念的话,新浪微博上有一个名为“DB2俱乐部”的用户进行了这样的对比:地球自诞生到2003年,人类一共创造的数据有5EB(EB为计算机存储信息的单位,5EB=5000PB=5000000TB),现在我们每两天就能生成5EB数据。这些数据中大约有80%的数据是非结构化或者半结构化的,更有一部分是在不断流动变化的数据。这些都符合大数据的定义:数据量大、变化快和种类繁多。由此可见,大数据时代已经来临。超图软件总裁宋关福在微博上表示,GIS也涉及大数据,比如遥感卫星每天获得的大量影像数据传下来,地面处理系统必须解决数据量大、变化快、非结构化的数据处理。

  面对如此海量的数据,如何管理好和使用好这些数据就成为了面临的挑战。由于关系数据库并不能很好的解决这些问题,因此NoSQL非关系数据库便应运而生,能够应对数据高并发的读写和对海量数据的存储等问题,为非结构化数据提供支持。而另外一个需要关注的技术则是Hadoop,一种基于免费许可、支持数据密集型分布式应用的软件框架,建立在谷歌的MapReduce技术上,能够使应用处理数千个节点和PB级数据,让数据处理和分析变得更加方便快捷。