立即注册 登录
炼数成金 返回首页

szy2010214517的个人空间 http://www.dataguru.cn/?248794 [收藏] [复制] [分享] [RSS]

日志

简单贝叶斯分类

已有 3383 次阅读2017-6-6 23:20 |个人分类:机器学习| 贝叶斯

贝叶斯分类,条件分类

常见分类:

线性判别法

比如说我们有一堆数据代表天气下雨与否

G = ( 1111111122222)

X1 = ( -2.3 3 -2 2.5 5-4 4 )

X2 = ( 2.7 5 5 7 -3 4 )

 

我们将上述数据X1X2分别用坐标轴xy轴标记,G代表是否下雨,画出如下:

然后我们可以通过一条直线切分数据,在直线一边代表下雨, 直线的另一边代表不下雨。

 

基于距离判别:

如果上述数据画出来,12下雨的值都很分散。可以采用基于距离判别

比如我们取5个点,该点在距离最近的5个点上那种类别最多,我们就可以判别该点属于那一类别。

 

贝叶斯分类:

条件概率以及贝叶斯分类概率,

贝叶斯只有两类,判断数据属于那一类的概率较高

 

公式:P(H|X) ,后验概率;给定观测数据样本X,比如关键词“篮球”, 假设H成立喜欢篮球的人概率。

P(H) 先验概率,比如男女比例,我们大致可以认为是11 然而如果我们抽样人数较少,可能概率不为11 如果我们抽样非常大的条件下概率趋近于11

贝叶斯公式:

如果是分类垃圾邮件中, 在邮件是垃圾邮件比例P(H|X) 概率, 解读为P(X|H),在垃圾邮件中H,包含X单词“伟哥”的单词概率, 乘以 P(H) 垃圾邮件在总体的比例 然后除以P(X) 比如“伟哥”在总体邮件概率比例


路过

鸡蛋

鲜花

握手

雷人

评论 (0 个评论)

facelist

您需要登录后才可以评论 登录 | 立即注册

 

GMT+8, 2019-6-20 23:06 , Processed in 0.063449 second(s), 20 queries .