词条信息

admin
admin
超级管理员
词条创建者 发短消息   

相关词条

热门词条

更多>>
什么是端口?到底是做什么的呢?
端口一般指两种,一种是硬件比如路由器或者交换机的插网线的端口,一种是软件的逻辑的概念,比如http的80端口!...
7种进阶方法让你快速测试端口连通性
Ping是Windows、Linux和Unix系统下的一个检查网络连通性的命令工具,对于大部分互联网用户来说很...
电脑开机,总需要按F1,是什么原因造成的?
一.主板掉电这个说法是行业内的叫法了,一般是主板的CMOS电池没电了导致的。也是最常见的一种提示你按F1的提示...
社保降费对个人有什么影响?
下调城镇职工基本养老保险单位缴费比例是政府给企业发的一个大红包,特别是对于企业来说是一个利好,但是对个人来说有...
车辆“出险”对下年保费的影响,到底有多大?
【出险对交强险的影响】【出险对商业险的影响】车辆“出险”对下年保费的影响,到底有多大?这里有必要先提下车险第三...

精选图集

更多>>
简易百科旧版 >>所属分类 >> 互联网    大数据   

学习大数据知识要学什么?

标签: 大数据

顶[0] 发表评论(0) 编辑词条

目录

学习大数据需要的基础编辑本段回目录


1、java SE、EE(SSM)

    90%的大数据框架都是Java写的

2、MySQL

    SQL on Hadoop

3、Linux

    大数据的框架安装在Linux操作系统


需要学什么编辑本段回目录


大数据离线分析

 

    一般处理T+1数据(T:可能是1天、一周、一个月、一年)

    a、Hadoop :一般不选用最新版本,踩坑难解决

        (common、HDES、MapReduce、YARN)

        环境搭建、处理数据的思想

    b、Hive:大数据的数据仓库

        通过写SQL对数据进行操作,类似于MySQL数据库的sql

    c、HBase:基于HDFS的NOSQL数据库

        面向列存储

    d、协作框架:

        sqoop(桥梁:HDFS《==》RDBMS)

        flume:搜集日志文件中的信息

    e、调度框架

        anzkaban

        了解:crotab(Linux自带)

        zeus(Alibaba)

        Oozie(cloudera)

    f、前沿框架扩展:

            kylin、impala、ElasticSearch(ES)

 

 

大数据实时分析

 

    以spark框架为主

    Scala:OOP(面向对象程序设计)+FP(函数是程序设计)

    sparkCore:类比MapReduce

    sparkSQL:类比hive

    sparkStreaming:实时数据处理

    kafka:消息队列

    前沿框架扩展:flink

        阿里巴巴:blink

 

大数据机器学习

 

    spark MLlib:机器学习库

    pyspark编程:Python和spark的结合

    推荐系统

    python数据分析

    python机器学习

 

 

附件列表


按字母顺序浏览:A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

→我们致力于为广大网民解决所遇到的各种电脑技术问题
 如果您认为本词条还有待完善,请 编辑词条

上一篇web测试总结
下一篇大数据涉及的知识点

0
1. 本站部分内容来自互联网,如有任何版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
2. 本站内容仅供参考,如果您需要解决具体问题,建议您咨询相关领域专业人士。
3. 如果您没有找到需要的百科词条,您可以到百科问答提问或创建词条,等待高手解答。

关于本词条的提问

查看全部/我要提问>>