朴素贝叶斯模型怎么用spss modeler做

关于spss中贝叶斯判别的问题,想问一下spss中的朴素贝叶斯分类器是哪个节点啊?_百度知道
关于spss中贝叶斯判别的问题,想问一下spss中的朴素贝叶斯分类器是哪个节点啊?
是判别分析吗?我看有的书上这么写,不过帮助文档上没说啊您曾回答了一个关于spss中贝叶斯判别的问题?贝叶斯网络里面有朴素贝叶斯分类器吗,想问您一下spss中的那个贝叶斯分类器是哪个节点啊。还是贝叶斯网络
提问者采纳
spss里面没有单独的贝叶斯分类器节点只又在判别分析中 有贝叶斯判别的
提问者评价
来自:求助得到的回答
来自团队:
其他类似问题
为您推荐:
朴素贝叶斯的相关知识
其他1条回答
这个是比较复杂的方法,bayes分析
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁400-702-0808您好,欢迎光临文轩网!配送时间购物车(0)件正在更新您的购物车...
内容继续完善中... 你现在的位置: &
> IBM SPSS Modeler数据与文本挖掘实战相关图书系列二号首长 同类热销产品 文轩价:¥201.60 文轩价:¥14.40 文轩价:¥32.40 文轩价:¥49.00 文轩价:¥187.20 文轩价:¥27.40 新书推荐
该作者其他作品你的浏览历史IBM SPSS Modeler数据与文本挖掘实战
收藏:0人 分享到:
此书可以试读,请文轩评论(0)淘宝电子书评论(0) 人 人 人 人 人我来评分:写点评 送积分&&您的昵称:建议先咨询标题:咨询内容:验证码:基于朴素贝叶斯分类器的文本分类算法(上) - Phinecos(洞庭散人) - 博客园
专注于开源技术的研究与应用
转载请保留作者信息:
作者:phinecos(洞庭散人)
&&&&&& 本文缘起于最近在读的一本书-- Tom M.Mitchell的,书中第6章详细讲解了贝叶斯学习的理论知识,为了将其应用到实际中来,参考了网上许多资料,从而得此文。文章将分为两个部分,第一部分将介绍贝叶斯学习的相关理论(如果你对理论不感兴趣,请直接跳至第二部分&&&&)。第二部分讲如何将贝叶斯分类器应用到中文文本分类,随文附上示例代码。
&Introduction
我们在《概率论和数理统计》这门课的第一章都学过贝叶斯公式和全概率公式,先来简单复习下:
定义 设A, B是两个事件,且P(A)&0 称P(B∣A)=P(AB)/P(A)为在条件A下发生的条件事件B发生的条件概率。
乘法公式 设P(A)&0 则有P(AB)=P(B∣A)P(A)
全概率公式和贝叶斯公式
定义 设S为试验E的样本空间,B1, B2, …Bn为E的一组事件,若BiBj=Ф, i≠j, i, j=1, 2, …,n; B1∪B2∪…∪Bn=S则称B1, B2, …, Bn为样本空间的一个划分。
定理 设试验E的样本空间为,A为E的事件,B1, B2, …,Bn为的一个划分,且P(Bi)&0 (i=1, 2, …n),则P(A)=P(A∣B1)P(B1)+P(A∣B2)+ …+P(A∣Bn)P(Bn)称为全概率公式。
定理 设试验俄E的样本空间为S,A为E的事件,B1, B2, …,Bn为的一个划分,则
P(Bi∣A)=P(A∣Bi)P(Bi)/∑P(B|Aj)P(Aj)=P(B|Ai)P(Ai)/P(B)
称为贝叶斯公式。说明:i,j均为下标,求和均是1到n &
&下面我再举个简单的例子来说明下。
考虑一个医疗诊断问题,有两种可能的假设:(1)病人有癌症。(2)病人无癌症。样本数据来自某化验测试,它也有两种可能的结果:阳性和阴性。假设我们已经有先验知识:在所有人口中只有0.008的人患病。此外,化验测试对有病的患者有98%的可能返回阳性结果,对无病患者有97%的可能返回阴性结果。
上面的数据可以用以下概率式子表示:
P(cancer)=0.008,P(无cancer)=0.992
P(阳性|cancer)=0.98,P(阴性|cancer)=0.02
P(阳性|无cancer)=0.03,P(阴性|无cancer)=0.97
假设现在有一个新病人,化验测试返回阳性,是否将病人断定为有癌症呢?我们可以来计算极大后验假设:
P(阳性|cancer)p(cancer)=0.98*0.008 = 0.0078
P(阳性|无cancer)*p(无cancer)=0.03*0.992 = 0.0298
因此,应该判断为无癌症。
&贝叶斯学习理论
&&&&&& 贝叶斯是一种基于概率的学习算法,能够用来计算显式的假设概率,它基于假设的先验概率,给定假设下观察到不同数据的概率以及观察到的数据本身(后面我们可以看到,其实就这么三点东西,呵呵)。
&&&&& 我们用P(h)表示没有训练样本数据前假设h拥有的初始概率,也就称为h的先验概率,它反映了我们所拥有的关于h是一个正确假设的机会的背景知识。当然如果没有这个先验知识的话,在实际处理中,我们可以简单地将每一种假设都赋给一个相同的概率。类似,P(D)代表将要观察的训练样本数据D的先验概率(也就是说,在没有确定某一个假设成立时D的概率)。然后是P(D/h),它表示假设h成立时观察到数据D的概率。在机器学习中,我们感兴趣的是P(h/D),也就是给定了一个训练样本数据D,判断假设h成立的概率,这也称之为后验概率,它反映了在看到训练样本数据D后假设h成立的置信度。(注:后验概率p(h/D)反映了训练数据D的影响,而先验概率p(h)是独立于D的)。
P(h|D) = P(D|h)P(h)/p(D),从贝叶斯公式可以看出,后验概率p(h/D)取决于P(D|h)P(h)这个乘积,呵呵,这就是贝叶斯分类算法的核心思想。我们要做的就是要考虑候选假设集合H,并在其中寻找当给定训练数据D时可能性最大的假设h(h属于H)。
&&&&& 简单点说,就是给定了一个训练样本数据(样本数据已经人工分类好了),我们应该如何从这个样本数据集去学习,从而当我们碰到新的数据时,可以将新数据分类到某一个类别中去。那可以看到,上面的贝叶斯理论和这个任务是吻合的。
朴素贝叶斯分类
也许你觉得这理论还不是很懂,那我再举个简单的例子,让大家对这个算法的原理有个快速的认识。(注:这个示例摘抄自《机器学习》这本书的第三章的表3-2.)
假设给定了如下训练样本数据,我们学习的目标是根据给定的天气状况判断你对PlayTennis这个请求的回答是Yes还是No。
Temperature
PlayTennis
&可以看到这里样本数据集提供了14个训练样本,我们将使用此表的数据,并结合朴素贝叶斯分类器来分类下面的新实例:
(Outlook = sunny,Temprature = cool,Humidity = high,Wind = strong)
我们的任务就是对此新实例预测目标概念PlayTennis的目标值(yes或no).
由上面的公式可以得到:
可以得到:
&&&&& P(PlayTennis =yes) = 9/14 = 0.64,P(PlayTennis=no)=5/14 = 0.36
&&&&& P(Wind=Stong| PlayTennis =yes)=3/9=0.33,p(Wind=Stong| PlayTennis =no)=3/5 = 0.6
其他数据类似可得,代入后得到:
P(yes)P(Sunny|yes)P(Cool|yes)P(high|yes)P(Strong|yes) = 0.0053
P(no)P(Sunny|no)P(Cool|no)P(high|no)P(Strong|no)=0.0206
因此应该分类到no这一类中。
贝叶斯文本分类算法
&&&&& 好了,现在开始进入本文的主旨部分:如何将贝叶斯分类器应用到中文文本的分类上来?
根据联合概率公式(全概率公式)
M——训练文本集合中经过踢出无用词去除文本预处理之后关键字的数量。
随笔 - 607
评论 - 1583
引用 - 117&&&&数据挖掘原理与SPSS Clementine应用-贝叶斯分析教程
&数据挖掘原理与SPSS Clementine应用-贝叶斯分析教程
贝叶斯分类的基本过程
朴素贝叶斯分类
贝叶斯信念网络
若举报审核通过,可奖励20下载分
被举报人:
举报的资源分:
请选择类型
资源无法下载
资源无法使用
标题与实际内容不符
含有危害国家安全内容
含有反动色情等内容
含广告内容
版权问题,侵犯个人或公司的版权
*详细原因:
VIP下载&&免积分60元/年(1200次)
您可能还需要
Q.为什么我点的下载下不了,但积分却被扣了
A. 由于下载人数众多,下载服务器做了并发的限制。若发现下载不了,请稍后再试,多次下载是不会重复扣分的。
Q.我的积分不多了,如何获取积分?
A. 获得积分,详细见。
完成任务获取积分。
论坛可用分兑换下载积分。
第一次绑定手机,将获得5个C币,C币可。
关注并绑定CSDNID,送10个下载分
下载资源意味着您已经同意遵守以下协议
资源的所有权益归上传用户所有
未经权益所有人同意,不得将资源中的内容挪作商业或盈利用途
CSDN下载频道仅提供交流平台,并不能对任何下载资源负责
下载资源中如有侵权或不适当内容,
本站不保证本站提供的资源的准确性,安全性和完整性,同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
网络技术下载排行
您当前C币:0&&&可兑换 0 下载积分
兑换下载分:&
消耗C币:0&
立即兑换&&
兑换成功你当前的下载分为 。前去下载资源
你下载资源过于频繁,请输入验证码
如何快速获得积分?
你已经下载过该资源,再次下载不需要扣除积分
数据挖掘原理与SPSS Clementine应用-贝叶斯分析教程
所需积分:1
剩余积分:0
扫描微信二维码精彩活动、课程更新抢先知
VIP会员,免积分下载
会员到期时间:日
剩余下载次数:1000
数据挖掘原理与SPSS Clementine应用-贝叶斯分析教程
剩余次数:&&&&有效期截止到:
你还不是VIP会员VIP会员享免积分 . 专属通道极速下载
VIP下载次数已满VIP会员享免积分 . 专属通道极速下载,请继续开通VIP会员
你的VIP会员已过期VIP会员享免积分 . 专属通道极速下载,请继续开通VIP会员苹果/安卓/wp
苹果/安卓/wp
积分 483, 距离下一级还需 317 积分
权限: 自定义头衔, 签名中使用图片
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡, 匿名卡, 抢沙发下一级可获得
权限: 隐身
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
开心签到天数: 2 天连续签到: 1 天[LV.1]初来乍到
& &&&清华大学出版社,最近出版了《IBM SPSS Modeler数据与文本挖掘实战》,请问谁该书的配套数据文件,谢谢!
& &&&图书简介:
& &&&本书主要包括两部分内容:在数据挖掘部分,重点介绍了各种数据挖掘方法的基本原理及应用,包括回归分析、时间序列分析、因子分析、决策树分析、判别分析、聚类分析、人工神经网络、贝叶斯网络以及社交网络分析等;在文本挖掘部分,重点介绍了文本挖掘的节点,以及具体的实现过程。每一章都详细介绍了数据和文本挖掘的基本原理和分析过程,同时在实例中也介绍了SPSS Modeler中大部分节点的使用方法及应用步骤。
  本书与同类书籍相比,安排了较多的实例,使读者能够边学边练,在短时间内就可以有一个较大的提高,方便读者熟悉SPSS Modeler的基本操作,并通过系统的案例使读者掌握应用技巧。
  本书对于高校理工学科、经济金融学科及数量分析方面的学生,以及数据挖掘和分析方面的研究人员和从业人员等,具有很强的可读性、可操作性与可使用性,尤其适合商业销售、经济管理、社会研究和人文教育等行业的相关人员阅读。
支持楼主:、
购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
载入中......
Modeler 过期解决办法:
在临时许可过期之后,
1. 删除C:\Users\All Users\SafeNet Sentinel\Sentinel RMS Development Kit\System下的所有文件;
2. 用管理员身份运行C:\Program Files\IBM\SPSS\Modeler\16\bin\licenseinit.exe,提示输入Base product feature code:和Version (with a decimal point):时可以直接回车,运行结果如下所示:
C:\Program Files\IBM\SPSS\Modeler\16\bin&licenseinit.exe
Base product feature code:
Version (with a decimal point):
Result for feature 0, version 0, options 0 to 39:&&0 (0x)
此时C:\Users\All Users\SafeNet Sentinel\Sentinel RMS Development Kit\System目录下应该重新生成了一批文件。
wangguoping2011 发表于
Modeler 过期解决办法:
在临时许可过期之后,
1. 删除C:\Users\All Users\SafeNet Sentinel\Sentinel RM ...请问这个方法适用32位和64位机吗,
书中的数据下载不了,网有错!
hhbb979 发表于
书中的数据下载不了,网有错!加我QQ :
非常好哦,支持,学习中。
这个明显就是个广告贴嘛
论坛好贴推荐
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
为做大做强论坛,本站接受风险投资商咨询,请联系(010-)
邮箱:service@pinggu.org
合作咨询电话:(010)
广告合作电话:(刘老师)
投诉电话:(010)
不良信息处理电话:(010)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师

我要回帖

更多关于 朴素贝叶斯算法 的文章

 

随机推荐