机器学习
定义
形式化的定义:假设用 $P$ 来评估计算机程序在某任务 $T$ 上的性能,若一个程序通过利用经验 $E$ 在 $T$ 中任务上获得了性能改善,则我们就说关于 $T$ 和 $P$ ,改程序对 $E$ 进行了学习。
通俗定义:机器学习是一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。
研究内容
机器学习研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即”学习算法“。
有了学习算法,把经验数据提供给它,它就能基于这些数据产生模型;在面对新的情况时,模型会给我们提供相应的判断。
机器学习是研究关于学习算法的学问。
模型 泛指从数据中学到的结果。
基本术语
数据
数据集
示例、样本
属性、特征
属性值
特征向量
维数
学习、训练:从数据中学得模型的过程称为”学习“或”训练“
训练数据
训练样本
训练集
假设
真相、真实
学习器
预测
标记
样例:有了标记信息的示例,称为样例
标记空间、输出空间
分类
回归
测试样本
聚类
簇
监督学习:根据训练数据是否拥有标记。分类和回归
无监督学习:聚类
泛化:学得模型适用于新样本的能力,称为泛化能力
分布
独立同分布
最后更新于
这有帮助吗?