当前位置: 首页 > 数据分析师 > 数据分析师学习教程 > 数据分析师课|每一个数据分析师都需要看看这个,这是深度解析的机器学习模型

数据分析师课|每一个数据分析师都需要看看这个,这是深度解析的机器学习模型

更新时间:2020-01-23 09:30:01 来源:环球网校 浏览12收藏1
摘要 在茫茫的数据发展长河中,人们慢慢掌握了数据处理的方法,其中重要的处理方法之一就是对数据的分析,所以出现了数据分析师这一处理数据的职业,有很多刚入职成为数据分析师的新人都会有数据分析的问题,今天就来讲讲深度解析的机器学习模型的问题。

1、深度解析的机器学习模型——决策树模型

这个微课程将让你在熟悉以下场景后,构建模型。

你的堂哥已经花了数百万美元用于房地产的预测,由于你对数据科学非常感兴趣,他提供了一个与你进行商业合作对机会。将由他来出资,你来构建模型,预测不同房产的价值。

作为一个专业的挖掘工程师,你咨询了堂哥过去是如何预测房地产价值的。他告诉你都是通过直觉来预测的。但你又问了一些问题,这些疑问表明他已经从过去所见到的房地产中识别出了价格模式,并且他正是用这些模式对他正在考虑的房产进行估值的。

机器学习的工作原理也是这样。我们首先接触一个叫决策树的模型。当然,还有很多出色的模型能够给出更为准确的预测结果。但决策树模型易于理解,并且是数据科学中一些出色模型的基础组成模块。

为了简单起见,我们将从最简单的决策数开始。

这个决策树将所有房子分为两类。所考虑的任何房子的预测价格是该房子所属类别的历史平均价格。

我们用数据来决定如何将所有的房子分为2组,既而决定每个分组中的预测价格。从数据中捕捉模式的这一步就叫拟合或者训练模型。用于模型拟合的数据就叫做训练数据。

模型拟合的细节(包括如何对数据进行切分等),是一个比较复杂的过程,我们把它留到后面来解决。在模型拟合好后,你就可以用它来预测其他房子的价格了。

2、深度解析的机器学习模型——改进的决策树模型

通过拟合训练数据,以下这2棵决策树,哪一个更有可能产生呢?

很显然,左边的第一棵数更有意义一些,因为它捕捉出了这样一个现实:卧室多的房子价格通常要比卧室数少的房子价格高。但这个模型最大的缺陷是它无法捕捉到影响房子价格的多种因素,诸如浴室数、手数(一手还是二手)以及房子的地理位置。

你可以通过一棵拥有更多分支的树来捕获更多的房价影响因素。这种多分支的树被称为更深的树。

通过追踪决策树,你可以预测任何房子价格,只要选择与被预测房子特征相符合路径。房价的预测结果位于树的最底部,树底部用来预测的点,被称为叶子节点。

树的分支和叶子节点的值将由数据来决定,因此是时候来查看一下将要使用的数据了。

以上就是有关于深度解析的机器学习模型的相关内容,以及相应的解析,不论你是已经入职数据分析师岗位的新人,还是打算进入数据分析岗位的小白,以上的内容都或多或少会对大家有所帮助,环球网校的小编在这里祝大家的数据分析师职业道路顺利。

数据分析师备考资料全部免费下载

  • 考试大纲
  • 备考计划   
  • 真题答案与解析
  • 易错练习
  • 精讲知识点
  • 考前冲刺提分   
点击领取资料

分享到: 编辑:环球网校

资料下载 精选课程 老师直播 真题练习

数据分析师资格查询

数据分析师历年真题下载 更多

数据分析师每日一练 打卡日历

0
累计打卡
0
打卡人数
去打卡

预计用时3分钟

数据分析师各地入口
环球网校移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载

返回顶部