当前位置 : 主页 > 编程语言 > java >

统计机器学习(二)朴素贝叶斯

来源:互联网 收集:自由互联 发布时间:2022-07-19
文章目录 ​​教程笔记概述​​ ​​本文阅读先决条件​​ ​​内容总结​​ ​​基本公式​​ ​​离散属性要点​​ ​​连续属性要点​​ ​​Tip​​ 教程笔记概述 来源于课程


文章目录

  • ​​教程笔记概述​​
  • ​​本文阅读先决条件​​
  • ​​内容总结​​
  • ​​基本公式​​
  • ​​离散属性要点​​
  • ​​连续属性要点​​
  • ​​Tip​​

教程笔记概述

来源于课程MA429,讲述统计机器学习。是算法工程师的基础。

本文阅读先决条件

阅读并尽可能理解intro naive bayes.pdf这个课件。

内容总结

基本公式

贝叶斯定理:(A是类别,B是属性集合)

朴素贝叶斯公式:

记住朴素贝叶斯公式使用即可,推导可以参考南瓜书和西瓜书。
朴素贝叶斯呢就是说:每个属性都独立地对结果产生影响。

离散属性要点

  • 要预测的数据记录中有缺失的属性:计算时省略该属性的概率,不进行乘积。
  • 在训练集计算似然也就是对应类别下某属性的出现概率时出现了0:使用ADD1,给训练集所有属性都加1 。
  • 进行各个似然的比较时,先归一化。再最大似然

连续属性要点

  • 有连续属性。则在训练数据时将该属性当作正态分布,计算均值及方差。
    则在测试时,利用概率密度函数代入该属性值,得到密度。
  • 同样要归一化

Tip

朴素贝叶斯不难,关键是找一些例子,仔细计算,走一遍流程。这个PPT就不错。


上一篇:统计机器学习(三)KNN
下一篇:没有了
网友评论