行业新闻

学习类型之监督学习

添加时间:2020-10-20 15:37:22

什么是机器学习?

如果某台机器在给定任务中的性能随该体验而提高,则可以从过去的经验(数据输入)中学习某类任务,例如,假设一台机器必须预测客户是否会购买某个产品是否可以在今年说出“防病毒”。机器将通过查看以前的知识/过去的经验来完成此操作,即客户每年购买的产品数据,如果他每年购买防病毒产品,则客户很有可能会购买这种产品。一年。这就是机器学习在基本概念级别上的工作方式。


监督学习:

监督学习是指在标记的数据集上训练模型时。标记数据集是同时具有输入和输出参数的数据集。在这种类型的学习中,训练和验证数据集都被标记,如下图所示。


以上两个图均标有数据集–


图A:这是购物商店的数据集,可用于根据客户的性别,年龄和薪水来预测客户是否购买考虑中的特定产品。

输入:性别,年龄,工资

输出:购买,即0或1;1表示是,客户将购买,0表示客户将不购买。

图B:这是一个气象数据集,用于基于不同参数预测风速。

输入:露点,温度,压力,相对湿度,风向

输出:风速

 

Ť下雨的系统:

当训练模型,数据通常划分为80:20即80%作为训练数据的比率和休息作为测试数据。在训练数据中,我们输入和输出80%的数据。该模型仅从训练数据中学习。我们使用不同的机器学习算法(我们将在下一篇文章中详细讨论)来构建模型。通过学习,这意味着模型将建立自己的逻辑。

一旦模型准备就绪,则可以进行测试。在测试时,输入来自模型从未见过的剩余20%数据,模型将预测一些值,我们将其与实际输出进行比较并计算精度。


监督学习的类型:


分类:这是一项监督学习任务,其中输出具有定义的标签(离散值)。例如,在上图A中,“已购买的输出”具有定义的标签,即0或1;1表示客户将购买,0表示客户将不购买。此处的目标是预测属于特定类别的离散值并基于准确性进行评估。

它可以是二进制或多类分类。在二元分类中,模型预测0或1;是或否,但在多类别分类的情况下,模型预测不止一个类别。

示例: Gmail将邮件分为社交,促销,更新,论坛等多个类别。

回归:这是一项监督学习任务,其中输出具有连续值。

上图B中的示例,输出–风速没有离散值,而是在特定范围内连续的。这里的目标是预测一个尽可能接近实际输出值的值,然后通过模型计算误差值来进行评估。误差越小,我们的回归模型的准确性越高。

 

监督学习算法示例:


线性回归

最近的邻居

瓜西亚天真贝叶斯

决策树

支持向量机(SVM)

随机森林


来源:

服务热线

18215660330

邮 箱

zzjfuture@gmail.com

关注
官方微信