Page 42 - 陈金雄-为什么要重视大数据利用
P. 42
大数据主要有两个突出问题:海量数据怎样进行低成本高可 靠性地存储,以及如何对这些大量数据进行分析和处理。 Hadoop通过三个方面解决了这两个问题。(路梦曦) 一、它的分布式存储方式 HDFS(Hadoop Distributed File System)提高了读写速度和扩大了存储容量; 二、 它采用 MapReduce 计算框架,分割数据进行分发到分布 式文件系统中进行处理,然后再把 处理过后的数据进行整合, 保证了数据处理的高速; 三、它采用存储冗余数据的方式来保证数据的安全性。
   37   38   39   40   41   42   43   44   45   46   47