国内外的人都有哪些人研究数据挖掘经典算法中的分类算法?详细资源

扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
数据挖掘中的文本挖掘的分类算法综述
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
图像数据挖掘的分类算法研究.pdf54页
本文档一共被下载:
次 ,您可免费全文在线阅读后下载本文档
文档加载中...广告还剩秒
需要金币:200 &&
你可能关注的文档:
··········
··········
分类号:??: 编号
图像数据挖掘的分类算法研究
Ⅺ学位授予单位及代码: §
篮壹堡至太生
学科号业名称及代码:盐瘟扭应旦焦鲞
申请学位级别:盟土
研究方向:圈堡丝堡皇燮式退别
指导教师:扬堡屋塾攫 研究生:班
论文起止时问摘 要
基于内容的图像检索是为了提高图像检索的效率,将数据挖掘中的分类技术应用于
基于内容的图像信息挖掘领域。图像检索系统的最终用户是人,因此从心理学角度来
捕获人对图像内容的认知是相当重要的。为了把用户模型嵌入到图像检索系统中,基
于内容的图像检索领域引入了相关反馈机制。
一邻近分类算法是个典型的分类算法。本文在利用关键字检索图像基础上,提出将
相关反馈一邻近分类算法应用到图像检索中,解决了原有方法中分类效率低,准确性
受样本数量影响较大的不足,并实现了一个模拟系统来测试改进算法的性能。实验的
结果表明,在加入相关反馈技术后,该算法具有较好的效率,使得检索的查准率有较
大的提高。
关键词:图像数据挖掘图像检索相关反馈一邻近分类
长春理工大学硕士学位论文原创性声明
本人郑重声明:所呈交的硕士学位论文,《图像数据挖掘的分类算法研究》是本人
在指导教师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容
外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究
做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的
法律结果出本人承担。
作者签名:比 塑年三月丝日
长春理工大学学位论文版权使用授权书
本学位论文作者及指导教师完全了解“长春理工大学硕士、博士学位论文版权使
用规定”,同意长春理工大学保
正在加载中,请稍后...基于多分类器融合的数据挖掘分类算法研究与应用
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
基于多分类器融合的数据挖掘分类算法研究与应用
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口基于云计算的海量数据挖掘分类算法研究--《电子科技大学》2011年硕士论文
基于云计算的海量数据挖掘分类算法研究
【摘要】:随着数据存储量的急剧增加,海量数据处理和海量数据计算成为了数据挖掘领域中一个重要的问题。传统的串行数据挖掘算法往往只能够处理一些小规模的数据,当面对海量数据时,它们的执行速度会降低甚至无法运行,因此这对目前的数据挖掘提出了严峻的挑战和考验。而分类算法作为数据挖掘中极其重要的一个部分,在信息检索、网络搜索以及CRM等方面扮演着重要的角色。目前绝大多数的分类算法都是串行的,在处理大数据集时可行性差、效率低、分类准确率低的问题日益突出,导致了计算资源的不可估量以及执行时间的无限延长。
现代社会所处理的数据是海量的,在云计算出现以前,在做数据挖掘时以往都期望用高性能机或者是更大规模的计算设备来进行处理;另外在海量数据的背景下,挖掘过程当中需要有很好的开发环境和应用环境,在这样的情况下,采用基于云计算的方式来进行数据挖掘是比较合适的。而且由于目前并行分类算法的缺少,大规模数据集日益庞大,传统的数据挖掘系统已经不能对这些海量数据进行高效挖掘和利用,如何提高算法的并行性和效率是目前亟需解决的问题。
本论文以实验室粤港关键领域重点突破项目为基础,分析和研究了舆情分析系统项目中应用到的海量数据挖掘的相关技术。由于舆情分析系统处理的数据都来自因特网,每天需要处理的数据量非常庞大,要对这些海量数据集进行训练和分类,就必须保证舆情分析系统能维持在一个稳定、高效的环境。如何提高舆情分析系统分类的效率和性能,是本论文要解决的问题。
本论文的先进性在于,分类算法在舆情分析系统中是非常重要的一部分,根据舆情分析系统的需求分析和系统设计,为舆情分析系统设计了一种基于Strategy模式的分类算法模块。并且设计了不同的并行分类算法,通过在MapReduce框架下对分类算法的封装,大大提高了算法的运行效率,使得分类算法的加速比接近于线性加速比。舆情分析系统根据这个算法模型,可以动态地调用不同的分类算法对舆情数据进行分类,提高了系统分类算法的性能和效率,从而大大提高了舆情分析系统的稳定性和可靠性。
【关键词】:
【学位授予单位】:电子科技大学【学位级别】:硕士【学位授予年份】:2011【分类号】:TP311.13【目录】:
ABSTRACT5-10
第一章 引言10-16
1.1 研究背景10-14
1.1.1 云计算概述11-12
1.1.2 数据挖掘12
1.1.3 国内外研究情况12-14
1.2 研究意义14-15
1.3 本论文工作15
1.4 本论文结构15-16
第二章 云计算和数据挖掘相关理论综述16-32
2.1 云计算16-17
2.2 云计算的特点和分类17-18
2.3 云计算Hadoop 平台简介18-22
2.3.1 Hadoop 分布式文件系统简介19
2.3.2 MapReduce 分析和研究19-22
2.4 云计算的应用22-23
2.5 数据挖掘理论知识23-31
2.5.1 数据挖掘的定义23-24
2.5.2 数据挖掘的过程24
2.5.3 数据挖掘的功能24-27
2.5.4 几种典型分类算法的研究27-30
2.5.5 数据挖掘的应用30-31
2.6 本章小结31-32
第三章 网络舆情分析系统的需求分析和系统设计32-50
3.1 网络舆情分析系统概述32-33
3.2 网络舆情分析系统功能需求及性能需求33-39
3.2.1 网络舆情分析系统功能需求分析33-34
3.2.2 网络舆情分析系统的分类模块需求设计34-39
3.3 网络舆情分析系统设计39-45
3.3.1 网络舆情分析系统整体功能模块39-40
3.3.2 网络舆情分析系统分类模块40-45
3.4 网络舆情分析系统云计算环境的搭建45-49
3.4.1 系统环境45-46
3.4.2 云平台安装和配置过程46-49
3.5 本章小结49-50
第四章 网络舆情分析系统分类模块设计50-64
4.1 系统分类模块的设计思想50
4.2 MapReduce 分布式计算模型设计50-52
4.3 MapReduce 模型上分类算法的执行框架52-53
4.4 MapReduce 模型上数据转换过程53-54
4.5 Strategy 模式详解54-56
4.5.1 Strategy 模式的使用情况55-56
4.5.2 Strategy 模式的优越性56
4.6 Strategy 模式并行分类算法模块设计56-61
4.6.1 算法理论体系56-57
4.6.2 Strategy 模式分类算法模块设计过程57-61
4.7 朴素贝叶斯算法的测试61-63
4.7.1 实现算法模块的map 函数和reduce 函数61-62
4.7.2 朴素贝叶斯算法性能测试62-63
4.8 本章小结63-64
第五章 SPRINT 算法和k-NN 算法的封装和测试64-81
5.1 SPRINT 分类算法的封装和测试64-74
5.1.1 SPRINT 算法并行性设计64-69
5.1.2 SPRINT 算法MapReduce 化封装过程69-72
5.1.3 SPRINT 算法性能测试和评估72-74
5.2 k-NN 算法的封装与测试74-80
5.2.1 k-NN 算法详解74-75
5.2.2 并行k-NN 算法设计75-76
5.2.3 实现算法模块中的map 函数与reduce 函数76-78
5.2.4 k-NN 算法性能测试和评估78-80
5.3 本章小结80-81
第六章 总结与展望81-83
6.1 总结81-82
6.2 展望82-83
参考文献84-87
攻硕期间取得的研究成果87-88
欢迎:、、)
支持CAJ、PDF文件格式
【引证文献】
中国期刊全文数据库
马玉玲;;[J];福建电脑;2012年09期
吴恒;王东勃;;[J];机械设计与制造工程;2013年04期
赵又霖;邓仲华;陆颖隽;;[J];情报理论与实践;2012年09期
于秀慧;李宝山;;[J];山东图书馆学刊;2013年01期
刘建安;;[J];数字技术与应用;2013年07期
中国博士学位论文全文数据库
张利军;[D];浙江大学;2012年
中国硕士学位论文全文数据库
冯懿;[D];南京理工大学;2013年
冯舸;[D];成都理工大学;2013年
何柏英;[D];合肥工业大学;2013年
王龙涛;[D];吉林农业大学;2013年
罗启福;[D];武汉理工大学;2013年
【参考文献】
中国期刊全文数据库
韩松来,张辉,周华平;[J];计算机应用;2005年11期
戴元顺;;[J];信息通信技术;2010年02期
刘小虎,李生;[J];软件学报;1998年10期
肖汉;;[J];微电子学与计算机;2007年01期
【共引文献】
中国期刊全文数据库
秦洪英;[J];阿坝师范高等专科学校学报;2005年03期
干娟;;[J];安徽电子信息职业技术学院学报;2011年04期
孟庆全;金传山;梅灿华;胡学钢;;[J];安徽大学学报(自然科学版);2008年04期
王永梅;胡学钢;;[J];安徽大学学报(自然科学版);2011年03期
宋平平;;[J];安徽工程科技学院学报(自然科学版);2006年03期
叶明全;;[J];安徽工程科技学院学报(自然科学版);2007年03期
梅灿华;孟庆全;祁炯;李明;;[J];安徽工程科技学院学报(自然科学版);2008年02期
贾泽露;;[J];安徽农业科学;2008年14期
陈志民;李亭;杨敬锋;彭晓琴;;[J];安徽农业科学;2010年17期
蔡丽艳;冯宪彬;丁蕊;;[J];安徽农业科学;2011年02期
中国重要会议论文全文数据库
叶红云;倪志伟;陈恩红;;[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
陈楚湘;沈建京;陈冰;尚长兴;王运成;;[A];第二十九届中国控制会议论文集[C];2010年
;[A];第二十九届中国控制会议论文集[C];2010年
陈楚湘;沈建京;陈冰;尚长兴;王运成;;[A];中国自动化学会控制理论专业委员会D卷[C];2011年
王琦;;[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
赵云鹏;石丽;刘莹;;[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
鲁松;;[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
刘海霞;钟晓妮;周燕荣;田考聪;;[A];重庆市预防医学会2010年论文集[C];2011年
鲁俐;;[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
汪云亮;吕久明;刘孝刚;;[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
中国博士学位论文全文数据库
殷志伟;[D];哈尔滨工程大学;2009年
张明;[D];华中科技大学;2010年
李彤岩;[D];电子科技大学;2010年
渠瑜;[D];浙江大学;2010年
徐河杭;[D];浙江大学;2010年
朱佳俊;[D];东华大学;2010年
陈进;[D];国防科学技术大学;2010年
管红波;[D];东华大学;2010年
李军;[D];吉林大学;2011年
夏萍;[D];北京交通大学;2010年
中国硕士学位论文全文数据库
汤雪;[D];山东科技大学;2010年
岳海亮;[D];辽宁师范大学;2010年
解保忠;[D];哈尔滨工程大学;2010年
王颖芳;[D];哈尔滨工程大学;2010年
尹丽玲;[D];哈尔滨工程大学;2010年
刘靖媛;[D];哈尔滨工程大学;2010年
徐洪伟;[D];哈尔滨工程大学;2010年
曹振兴;[D];哈尔滨工程大学;2010年
付红艳;[D];哈尔滨工程大学;2010年
骆永健;[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库
姜永常;;[J];图书与情报;2005年06期
杜海宁;;[J];图书与情报;2010年03期
王景燕;;[J];电工技术;2011年12期
段刚,余贻鑫;[J];电力系统自动化;2001年05期
于之虹,郭志忠;[J];电力系统自动化;2003年08期
束洪春,孙向飞,于继来;[J];电力系统自动化;2004年03期
肖世杰;;[J];电力系统自动化;2009年09期
赵俊华;文福拴;薛禹胜;林振智;;[J];电力系统自动化;2010年15期
胡孔法;张长海;陈崚;达庆利;;[J];东南大学学报(自然科学版);2008年06期
张申勇;蔡培茂;廖继勇;乐小燕;孙细斌;;[J];电脑知识与技术;2011年23期
中国博士学位论文全文数据库
魏迎梅;[D];中国人民解放军国防科学技术大学;2000年
张丽平;[D];浙江大学;2005年
祖巧红;[D];武汉理工大学;2007年
陈浩然;[D];中国科学技术大学;2008年
陈波;[D];华南理工大学;2010年
中国硕士学位论文全文数据库
白云龙;[D];北京邮电大学;2011年
杜雅红;[D];北京邮电大学;2011年
何华;[D];北京邮电大学;2011年
汤欣妍;[D];华南理工大学;2011年
刘智勇;[D];电子科技大学;2011年
赵虎;[D];电子科技大学;2011年
刘猛;[D];电子科技大学;2011年
杨新月;[D];电子科技大学;2011年
张敏;[D];南京邮电大学;2011年
丛中昌;[D];南京邮电大学;2011年
【二级引证文献】
中国期刊全文数据库
胡海东;;[J];科技创新导报;2013年03期
杜维;刘阳;;[J];现代商贸工业;2014年02期
【二级参考文献】
中国期刊全文数据库
曲开社,成文丽,王俊红;[J];计算机工程与应用;2003年25期
冯刚,边根庆,侯义斌,卢三元;[J];微电子学与计算机;2004年09期
龚永罡,石峰;[J];微电子学与计算机;2004年12期
白涛;[J];微电子学与计算机;2005年01期
中国硕士学位论文全文数据库
葛斌;[D];合肥工业大学;2002年
冯朝刚;[D];重庆大学;2003年
孙弢;[D];大连理工大学;2004年
【相似文献】
中国期刊全文数据库
丁纪云,蔡春娥;[J];湖南广播电视大学学报;2001年02期
任承业,罗伟其;[J];计算机工程与应用;2003年13期
王艳;[J];情报科学;2003年02期
邵红全,赵茜;[J];电脑开发与应用;2003年04期
耿庆鹏,卢子芳;[J];电信快报;2003年10期
蒋良孝,蔡之华;[J];计算技术与自动化;2003年03期
叶静,蔡之华;[J];计算机与现代化;2003年10期
黄解军,万幼川,潘和平;[J];计算机工程与设计;2003年07期
崔强,朱卫东;[J];铁路计算机应用;2003年01期
杨思春;[J];微机发展;2003年09期
中国重要会议论文全文数据库
郭学军;陈晓云;;[A];第十六届全国数据库学术会议论文集[C];1999年
徐慧;;[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
孙迎;;[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
薛晓东;李海玲;;[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
郭建文;黄燕;印鉴;杨小波;梁兆辉;;[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
薛鲁华;张楠;;[A];北京市第十三次统计科学讨论会论文选编[C];2006年
朱扬勇;黄超;;[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
陈涛;胡学钢;陈秀美;;[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
王星;谢邦昌;戴稳胜;;[A];北京市第十二次统计科学讨论会论文选编[C];2003年
郭建文;黄燕;印鉴;杨小波;梁兆辉;;[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库
李开宇 黄建军
田长春;[N];中国国防报;2009年
华莱士;[N];国际金融报;2003年
记者 晏燕;[N];科技日报;2006年
□中国电信股份有限公司北京研究院 张舒博
□北京邮电大学计算机科学与技术学院 牛琨;[N];人民邮电;2006年
张立明;[N];网络世界;2003年
中圣信息技术有限公司
李辉;[N];中国计算机报;2001年
田红生;[N];中国经济时报;2002年
王广宇;[N];中国计算机报;2004年
周蓉蓉;[N];计算机世界;2004年
张舒博;[N];首都建设报;2009年
中国博士学位论文全文数据库
孙丽;[D];大连交通大学;2005年
胡志坤;[D];中南大学;2005年
刘革平;[D];西南师范大学;2005年
刘寨华;[D];黑龙江中医药大学;2006年
王川;[D];中国科学院研究生院(上海生命科学研究院);2004年
王涛;[D];华中科技大学;2006年
郭斯羽;[D];浙江大学;2002年
李旭升;[D];西南交通大学;2007年
刘东升;[D];浙江工商大学;2008年
余红;[D];华中科技大学;2007年
中国硕士学位论文全文数据库
廖赛恩;[D];湖南中医药大学;2010年
李坤然;[D];中南林业科技大学;2008年
郑宏;[D];西安电子科技大学;2010年
杜金刚;[D];北京邮电大学;2010年
徐路;[D];电子科技大学;2009年
梁小鸥;[D];华南理工大学;2011年
王浩;[D];华东理工大学;2012年
黎卫英;[D];福建师范大学;2009年
张煜辉;[D];上海交通大学;2009年
刘华敏;[D];安徽大学;2011年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 知识超市公司
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备74号数据挖掘分类算法研究及应用_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
数据挖掘分类算法研究及应用
阅读已结束,如果下载本文需要使用
想免费下载本文?
你可能喜欢

我要回帖

更多关于 数据挖掘经典算法 的文章

 

随机推荐