数据分析师课|每一个数据分析师都需要看看这个,这是深度解析的机器学习模型
1、深度解析的机器学习模型——决策树模型
这个微课程将让你在熟悉以下场景后,构建模型。
你的堂哥已经花了数百万美元用于房地产的预测,由于你对数据科学非常感兴趣,他提供了一个与你进行商业合作对机会。将由他来出资,你来构建模型,预测不同房产的价值。
作为一个专业的挖掘工程师,你咨询了堂哥过去是如何预测房地产价值的。他告诉你都是通过直觉来预测的。但你又问了一些问题,这些疑问表明他已经从过去所见到的房地产中识别出了价格模式,并且他正是用这些模式对他正在考虑的房产进行估值的。
机器学习的工作原理也是这样。我们首先接触一个叫决策树的模型。当然,还有很多出色的模型能够给出更为准确的预测结果。但决策树模型易于理解,并且是数据科学中一些出色模型的基础组成模块。
为了简单起见,我们将从最简单的决策数开始。
这个决策树将所有房子分为两类。所考虑的任何房子的预测价格是该房子所属类别的历史平均价格。
我们用数据来决定如何将所有的房子分为2组,既而决定每个分组中的预测价格。从数据中捕捉模式的这一步就叫拟合或者训练模型。用于模型拟合的数据就叫做训练数据。
模型拟合的细节(包括如何对数据进行切分等),是一个比较复杂的过程,我们把它留到后面来解决。在模型拟合好后,你就可以用它来预测其他房子的价格了。
2、深度解析的机器学习模型——改进的决策树模型
通过拟合训练数据,以下这2棵决策树,哪一个更有可能产生呢?
很显然,左边的第一棵数更有意义一些,因为它捕捉出了这样一个现实:卧室多的房子价格通常要比卧室数少的房子价格高。但这个模型最大的缺陷是它无法捕捉到影响房子价格的多种因素,诸如浴室数、手数(一手还是二手)以及房子的地理位置。
你可以通过一棵拥有更多分支的树来捕获更多的房价影响因素。这种多分支的树被称为更深的树。
通过追踪决策树,你可以预测任何房子价格,只要选择与被预测房子特征相符合路径。房价的预测结果位于树的最底部,树底部用来预测的点,被称为叶子节点。
树的分支和叶子节点的值将由数据来决定,因此是时候来查看一下将要使用的数据了。
以上就是有关于深度解析的机器学习模型的相关内容,以及相应的解析,不论你是已经入职数据分析师岗位的新人,还是打算进入数据分析岗位的小白,以上的内容都或多或少会对大家有所帮助,环球网校的小编在这里祝大家的数据分析师职业道路顺利。
最新资讯
- 数据分析汇总报告有哪些组成?这才是数据分析师能力的体现2020-07-17
- 什么是EOI框架?这对于数据分析师竟然这么重要2020-07-17
- 如何进行业务核心数据分析?这对于数据分析师来说竟如此重要2020-07-16
- 有哪些数据分析实践的概念?不会这个的数据分析师都转行了2020-07-13
- 数据的分析思路是什么?正确的分析思路可以帮助数据分析师进步2020-07-10
- 什么是数据回归分析方法?这才是数据分析师要用到的利器2020-07-10
- 数据相关的分析方法是什么?这三种才是数据分析师的救星2020-07-10
- 高级数据分析方法是什么?这才是数据分析师进阶的必备技能2020-07-09
- 提出数据假设的方法是什么?这才是数据分析师应该明白的东西2020-07-09
- 如何找出数据优化指标?优秀的数据分析师都在这样思考2020-07-09