最新消息:请随时分享你的乐趣!

机器学习实战-1.机器学习基础

技术博客 磊子 101浏览 0评论

机器学习名词解释

1. 模式识别(官方标准) Pattern recognition

可以说 以人原本的理解、经验、直觉总结的到的结论

2. 机器学习(数据学习) Machine learning

人们发现可以使用数据来构建模式识别的事情,也就是说,只是用数据进行判断。

3. 深度学习(深入数据) Deep learning

深度学习更高深,是专门用来模拟人脑的进行分析的神经网络,用人脑模式来解释图像、文本、声音等。

ML分类

监督学习(必须有明确的目标变量值)

输入

  • 样本集

    • 训练数据(训练样本)

      • 特征(feature)

      • 目标变量(label)

        • 分类型(离散值)

        • 回归型(连续值)

    • 测试数据

输出

  • 规则集形式

  • 概率分布形式

  • 可以使用训练样本集中的意识实例

非监督学习

无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息。

没有明确的类别信息

  • 聚类
    在无监督学习中,将数据集分成由类似的对象组成多个类的过程称为聚类。

  • 密度估计
    将寻找描述数据统计值的过程称之为密度估计。【就是:根据训练样本确定x的概率分布】

作用:可以降低数据维度

如何选择算法

预测目标变量值?

监督学习

  • 离散型变量?

    • 可以选择分类算法
  • 连续性变量(数字)?

    • 选择回归算法

不预测目标变量值?

非监督学习

  • 将数据化为离散组?

      • 聚类算法
      • 还需要估计每个租的相似度

        • 密度估计算法

机器学习的开发流程

1. 数据收集

2. 准备数据

3. 分析数据

数据预处理

  • 去除垃圾数据

可以手动处理

4. 训练算法

算法的选择

5. 测试算法

评估算法效果

6. 使用算法

算法工程化

推荐开发语言

Python

转载请注明:印迹. » 机器学习实战-1.机器学习基础

发表我的评论
取消评论

表情