学习要根据自身情况来定,如果你是零基础,那就必须先从基础Java开始学起(大数据支持很多开发语言,但企业用的最多的还是JAVA),接下来学习数据结构、Linux系统操作、关系型数据库,夯实基础之后,再进入大数据的学习
一、看法大数据
大数据本质其实也是数据,不过也包括了些新的特征,
数据来源广;
数据格式多样化(结构化数据、非结构化数据、Excel文件等);
数据量大(最少也是TB级别的、甚至可以是PB级别);
数据增长速度快。
而针对以上新的特征需求思索很多成果:
例如,数据来源广,该如何采集汇总?采集汇总之后,又该存储呢?数据存储之后,该如何经过运算转化本钱人想要的结果呢?
关于这些成果,我们需求有相对应的知识处置。
二、大数据所需技艺要求
Python言语:编写一些脚本时会用到。
Scala言语:编写Spark顺序的最佳言语,当然也可以选择用Python。
Ozzie,azkaban:定时义务调度的工具。
Hue,Zepplin:图形化义务执行管理,结果反省工具。
Allluxio,Kylin等:经过对存储的数据中止预处置,加快运算速度的工具。
必需掌握的技艺:
Java初级(虚拟机、并发)、Linux 基本操作、Hadoop(HDFS+MapReduce+Yarn )、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理理解)、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ) 、辅佐小工具(Sqoop/Flume/Oozie/Hue等)
高阶技艺6条:
机器学习算法以及mahout库加MLlib、 R言语、Lambda 架构、Kappa架构、Kylin、Alluxio
三、学习规划
每天需求有3个小时的学习时间,周末的时分需求10小时,假设做不到的话,只能是
第一阶段(基础阶段)
Linux学习
Linux操作系统引见与安装、Linux常用命令、Linux常用软件安装、Linux网络、 防火墙、Shell编程等。
Java 初级学习(《深化理解Java虚拟机》、《Java高并发实战》)
掌握多线程、掌握并发包下的队列、掌握JVM技术、掌握反射和静态代理、了解JMS。
Zookeeper学习
Zookeeper分布式协调效力引见、Zookeeper集群的安装部署、Zookeeper数据结构、命令。
第二阶段(攻坚阶段)
Hadoop、Hive、HBase、Scala、Spark、Python
第三阶段(辅佐工具工学习阶段)
Sqoop、Flume、Oozie、Hue这些工具的学习主要在CSDN,51CTO以及官网都可以学习。
总结
在技术行业里面,每天都会有新的东西出现,需求关注最新技术静态,不时学习。任何普通技术都是先学习实践,然后在实际中不时完善实践的进程。
假设你觉得自己看书效率太慢,你可以网上搜集一些课程。
快速学习的才干、处置成果的才干、沟通才干在这个行业是真的非常重要的目的。
要擅长运用StackOverFlow和Google来帮助你学习进程遇到的成果。
坚实的Java技术作为基础支持,之后学习:Hadoop,大数据存储,大数据架构设计,大数据实时计算,大数据数据采集,大数据商业实战等。
技术人员就业方向:大数据系统研发人才,大数据应用开发人才和大数据分析人才。
想要在大数据这个领域汲取养分,让自己壮大成长。分享方向,行动以前先分享下一个大数据交流分享资源群870097548,欢迎想学习,想转行的,进阶中你加入学习。