当前位置: 首页 > 数据分析师 > 大数据分析师LEVEL ll 复习大纲篇 | 第七章 大数据分析实战

大数据分析师LEVEL ll 复习大纲篇 | 第七章 大数据分析实战

发布时间:2019年09月25日 09:33:35 来源:环球网校 点击量:

【摘要】对于数据分析师这一职位,很多人都希望在考试前了解他的考试形式和要求,今天环球网校小编就带大家了解大数据分析师 level 2 证书考试的相关内容,希望对大家有所帮助。

第一节、利用 HDFS Shell 操作 HDFS 文件系统

【熟知】

HDFS 常用命令,包括创建文件目录命令、文件传输命令、文件修改及删除命令等

第二节、利用 Hive SQL 进行数据清洗

【熟知】

熟悉 HiveSQL 基本语法,并能在数据预处理中灵活利用 Hive 工具,通过创建 Hive 表,

利用 HiveSQL 进行数据查询与数据清洗

第三节、利用 Sqoop 进行数据传输

【熟知】

能够灵活使用 Sqoopshell 命令进行文件在 Hadoop 中与 MySQL 数据库中的转化操作,

以达到文件传输要求

第四节、利用 Spark SQL 进行数据读取

【熟知】

能够灵活应用 SparkSQL 读取文件,并能够将其他数据类型按要求转化为 DataFrame,

以方便后续机器学习建模工作

第五节、Spark MLlib 进行机器学习建模

【熟知】

能够根据分析要求,灵活调用 MLlib 中的相关算法进行分析,并能进一步构建机器学习

流,能够利用调参工具对模型进行调优,能够利用模型评估指标最终建模结果进行评估。

第六节、利用 Python 进行建模结果数据可视化

最终建模完成后,结合实际业务场景和演示需求,将建模结果导入本地,并利用 Pyhton

工具,合理选择对应第三方库,对建模结果进行数据可视化演示

这就是大纲第七章的内容,希望对大家能有所帮助。

分享到: 编辑:吴晨辉

数据分析师相关文章推荐

|

数据分析师最新文章推荐

绑定手机号

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

环球网校移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载
环球小过-环球网校官方微信服务平台

刷题看课 APP下载

免费直播 一键购课

代报名等人工服务

返回顶部