术语概念

机器学习

定义

  • 形式化的定义:假设用 $P$ 来评估计算机程序在某任务 $T$ 上的性能,若一个程序通过利用经验 $E$ 在 $T$ 中任务上获得了性能改善,则我们就说关于 $T$ 和 $P$ ,改程序对 $E$ 进行了学习。

  • 通俗定义:机器学习是一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。

研究内容

机器学习研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即”学习算法“。

有了学习算法,把经验数据提供给它,它就能基于这些数据产生模型;在面对新的情况时,模型会给我们提供相应的判断。

机器学习是研究关于学习算法的学问。

模型 泛指从数据中学到的结果。

基本术语

  • 数据

  • 数据集

  • 示例、样本

  • 属性、特征

  • 属性值

  • 特征向量

  • 维数

  • 学习、训练:从数据中学得模型的过程称为”学习“或”训练“

  • 训练数据

  • 训练样本

  • 训练集

  • 假设

  • 真相、真实

  • 学习器

  • 预测

  • 标记

  • 样例:有了标记信息的示例,称为样例

  • 标记空间、输出空间

  • 分类

  • 回归

  • 测试样本

  • 聚类

  • 监督学习:根据训练数据是否拥有标记。分类和回归

  • 无监督学习:聚类

  • 泛化:学得模型适用于新样本的能力,称为泛化能力

  • 分布

  • 独立同分布

最后更新于

这有帮助吗?