大数据目前的技术和应用都是在数据分析、数据仓库等方面,主要针对OLAP(Online Analytical System),从技术角度来说,包含两条腿:一条腿是批量数据处理(包括MR、MPP等),另一条腿实时数据流处理(Storm、内存数据库等)。
零基础学习大数据应该遵循什么学习步骤呢?
阶段一
是Java语言基础,此阶段是大数据刚入门阶段,主要是学习一些Java语言的概念、字符、流程控制等
阶段二
是Linux基础和Hadoop生态体系。此阶段主要掌握Linux操作系统的灵活使用。掌握大数据核心技术之一——Hadoop生态体系。
阶段三
是分布式计算。主要掌握Scala语言的使用、各种数据结构、同时还要深度学习spark的一系列核心概念比如结构、安装、运行、理论概念等。还有Storm实时开发,Storm主要用来处理实时计算的问题。
阶段四
主要是实战项目案例,这一时期应该将所有知识通汇贯通,通过实战快速培养动手能力,确保一定的工作能力。
阶段五
是大数据分析相关的技术知识,主要是Data Analyze数据分析基础、数据可视化、sklearn中有三类朴素贝叶斯算法等等!
按字母顺序浏览:A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
→我们致力于为广大网民解决所遇到的各种电脑技术问题 如果您认为本词条还有待完善,请 编辑词条
上一篇韩国旅游部出手5000亿重资电竞产业
下一篇大数据十大应用领域