上QQ阅读APP看书,第一时间看更新
3.2 常用的机器学习算法
监督学习和无监督学习是机器学习的两种任务类型。这两种任务类型的主要区别在于:监督学习的目标是在给定样本数据和期望输出的情况下,学习样本数据中输入和输出之间的关系,即样本和该样本对应标注的关系;而无监督学习的数据是没有标注的,因此其目标是推断一组数据点中存在的自然结构。
更形象地,监督学习可比作做练习题的过程。将练习题比作机器学习中的样本数据集,这份练习题的标准答案就是该数据集的标注,答题者就是机器学习的模型。答题者做完练习题与标准答案进行比对,以提升自己的答题能力。这个过程就是监督学习中算法模型通过学习样本和标注之间的关系来达到最优模型的过程。
所以,监督学习中的数据是提前拥有优化目标信息的,它的训练样本中同时包含有特征和标签信息,以此来学习、训练一个表达特征和标签之间关系的函数。监督学习中比较典型的问题包括:输入变量与输出变量均为连续变量的预测问题,即回归问题;输出变量为有限个离散变量的预测问题,即分类问题。