登入選單
返回Google圖書搜尋
大數據 大_据:_基_理_到最佳__
註釋

�本__重于大_据的__性技_,系_地介_了主流大_据平台及工具的安_部署、管理__和_用__。平台和工具的__均__前_界主流的_源_品,因此,_于_者__,有很_的可操作性。

本_涉及的_源技_包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介_一般性的背景知_、安_部署、管理__和_用__技_外,_特_注重案例__,重要的技__以__工作_景或案例_依托,使_者能快速入_,_考案例_手__,通_具体深入的__,体_大_据的技_本_特征,_略大_据技___的_新理念,更好地理解和把握信息技_的_展__。

本_主要_容包括以下几大部分。

大_据存_篇:以HDFS_基_,介_分布式文件系_的原理、安_、fs命令的使用、_程,介_如何用HDFS__,并通_HTTP_用。

大_据_算篇:以MapReduce、YARN_基_,介_分布式_算的原理、部署,以及_程案例。

非_系型_据_篇:以HBase_基_,重_介_非_系型_据_的优_、原理、部署,以及命令行使用,_程案例,与Sqoop配合使用等。

大_据__篇:以Hive、_据__等_基_,重_介__据的抽取、原理、部署、分析与_程。

大_据___算篇:以Storm、Kafka_基_,介____算的架构、_成、使用与__。

本_非常适合_事大_据技___与使用的初_者,以及_事大_据技_研_的企事__位工程___和_考,也适合高校_算机相___的_科生、本科生和研究生__使用。