本文共 1228 字,大约阅读时间需要 4 分钟。
Hadoop作为大数据的主流技术框架,至今仍然在大数据技术圈占有重要的地位,大数据学习基本上也离不开Hadoop,从Hadoop开始,学习核心组件,逐步扩展到生态圈其他组件,这是比较建议的学习路线。今天我们就来讲讲大数据学习Hadoop入门书单。
Hadoop、Spark、MapReduce、NoSQL、离线计算、实时计算、实时推送等等这些专业名词,背后都是技术框架组件在提供技术支持。
1、Hadoop权威指南:大数据的存储与分析(第4版)
作者:Tom White著王海,华东,刘喻,吕粤海译
这本书作为Hadoop最全面的入门书,结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。内容包括:
2、深度剖析Hadoop HDFS
作者:林意群
这本书着重在Hadoop的分布式文件系统HDFS上,基于Hadoop 2.7.1版本进行分析,全面描述了HDFS 2.X的核心技术与解决方案。内容包括:
3、HBase不睡觉书
作者:杨曦
Hbase在Hadoop生态当中,地位同样不可小觑。这本书对于Hbase作为非常详解的讲解,适合于零基础入门,并且希望深入掌握的大数据学习者。内容包括:
HBase概念、安装、配置、部署,让读者对HBase先有一个感性认识,再从应用角度介绍了高级用法、监控和性能调优。既兼顾了初学者,也适用于想要深入学习HBase的读者。
4、Hive实战
作者:[美]斯科特·肖(Scott Shaw)、[南非]安德烈亚斯·弗朗索瓦·弗穆
Hive在Hadoop生态当中,常常被定义为数据仓库工具,简单且容易上手,是深入学习Hadoop技术的一个很好的切入点。内容包括:
Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性等等。
关于大数据学习,Hadoop入门学习书单,以上就为大家做了详细的介绍了。大数据学习路漫漫,Hadoop生态是核心知识点,以上书单建议大家作为入门首选。
转载地址:http://bqkni.baihongyu.com/