毕业论文网表格数据问题

知网查重 查不查论文最后的附表_百度知道
知网查重 查不查论文最后的附表
硕士论文附表没有重复率,要是也查这部分的话 就好了
我看网上有的说不查附录部分的,附表也应该算是附录吧
提问者采纳
知网是全选检测,附录也是检查的。关于学校查重率、相似率、抄袭率:
各个学校不一样,全文重复率在30%一下(而有的学校,本科是20%)。每章重复率应该没有要求,这个每个学校会出细则的,并且学校也出给出他们查重复率的地方——基本都是中国知网。具体打电话问老师,每界每个学校要求都不一样相关查重系统名词的具体作用: 查重率的具体概念就是抄袭率,引用率,要用专业软件来测试你的文章与别人论文的相似度,杜绝抄袭。基本就这意思。 一个是自写率 就是自己写的一个是复写率 就是你抄袭的还有一个引用率 就是那些被画上引用符号的 是合理的引用别人的资料修改重复率或抄袭率论文的经验:
CNKI是连续的字数相同不能超过13个字,万方是连续的字数相同不能超过15个字。否则就会标注出来,算进重复率。我们学校规定是CNKI检测重复率不能超过30%.两种数据库检测重复率会有结果上的误差,一般CNKI会更严格一点,先在用万方检测一下,然后对照重复段落,句子反复修改一下,最后用CNKI检测一下,就放心了。  
  在国内就是知网/维普/万方这三大系统,这里面的资源是不断更新的,每一年毕业生的论文除有保密要求外的基本上都是收这三大系统收录作为比对资源库,所以你就可不能大意啊!!国内就是三大系统,知网/维普/万方知网不对个人开放,维普及万方对个人开放万方不检测互联网及英文,知网及维普都检测互联网及英文。现在,所有学校对于硕士、博士毕业论文,必须通过论文检测查重才能算合格过关。本科毕业生,大部分211工程重点大学,采取抽检的方式对本科毕业论文进行检测查重。抄袭或引用率过高,一经检测查重查出超过百分之三十,后果相当严重。相似百分之五十以下,延期毕业,超过百分之五十者,取消学位。辛辛苦苦读个大学,花了好几万,加上几年时间,又面临找工作,学位拿不到多伤心。但是,所有检测系统都是机器,都有内在的检测原理,我们只要了解了其中内在的检测原理、系统算法、规律,通过检测报告反复修改,还是能成功通过检测,轻松毕业的。  大概当今所有的研究生毕业论文都会经过中国知网的“学术不端检测”,即便最后不被盲审。这个系统的初衷其实是很好的,在一定程度上能够对即将踏入中国科研界的硕士研究生们一个警示作用:杜绝抄袭,踏实学问。但正所谓“世界万物,有矛就有盾”的哲学观,中国知网的这个“学术不端检测系统”并不是完善的。原因有二,其一是目前的图文识别技术还不够先进;其二是目前的机器识别还达不到在含义识别上的智能化。求索阁一贯的观点就是“战略上蔑视,战术上重视”和“知己知彼百战百胜”。要破敌,必先知敌;要过学术检测这一关,当然必先了解这一关的玄机。  一、查重原理   1、知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。对于3万字符以上文字较多的论文是可以忽略的。对比数据库为:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库。部分书籍不在知网库,检测不到。   2、上传论文后,系统会自动检测该论文的章节信息,如果有自动生成的目录信息,那么系统会将论文按章节分段检测,否则会自动分段检测。   3、有部分同学反映说自己在段落中明明引用或者抄袭了其他文献的段落或句子,为什么没有检测出来,这是正常的。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。   4、一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是连续13个字相似或抄袭都会被红字标注,但是必须满足3里面的前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。   1)知网查重时,黄色的文字是“引用”,红色的文章是“涉嫌剽窃”。  
(2)知网查重时,只查文字部分,“图”、“mathtype编辑的公式”、“word域代码”是不查的(要想知道知网到底查那些部分,可以“全选”——“复制”——“选择性粘贴”——“只保留文字”)。建议公式用mathtype编辑,不要用word自带的公式编辑器。  
(3)word、excel编辑的“表”是可以查出来的。在某些被逼无奈的情况下,可以选择把表截图放到论文里边去!作者亲眼见过有同学自己编的系数,查出来居然跟人家重了,数据决定了系数还不能变,欲哭无泪……  
(4)参考文献的引用也是要算重复率的(包括在学校要求的X%以内)!所以引用人家文献的时候最好用自己的话改写一下。  
(5)知网的查重是以“章”为基本单元的。比如“封面”、“摘要”、“绪论”都会作为单独的一章,每一章出一个检测结果,标明重复率。每一章有单独的重复率,全文还有一个总的重复率。有些学校在规定论文是否通过查重时,不仅要求全文重复率不能超过多少,还对每章重复率也有要求。  
(6)知网查重的确是以“连续13个字与别的文章重复”做为判断依据的,跟之前网上一些作者说的情况一致。如果你能够把论文改到任何一句与别的文章保证任意连续13个字都不一样,知网是查不出来的。  
(7)但是,如果你有一处地方超过13个字与别的文章重复,知网的服务器都对这处地方的前后进行模糊搜索,那些仅仅是简单的加了一些“的”、“在……时”、“但是”等词语来隔断13个字多数情况是会检测出来的。这些模糊搜索有时候非常傻,可能会把一篇写如何养猪的文章跟你的那篇写建筑的文章关联到一起,说你涉嫌抄袭!遇到这种情况,你就自己”呵呵“吧!  
(8)书、教材在知网的数据库里是没有的。但是,copy书的同学需要注意,你copy的那部分可能已经被别的文章抄过了,检测的时候就重复了。这样的情况经常出现,尤其是某些经典理论,用了上百年了,肯定有人写过了!  
当然,有些同学觉得用自己的话改写一下就ok了。但现实情况是:这些经典理论用自己的话写了也一样有”标红“的可能,因为这些经典的理论已经被人翻来覆去写了N遍了!会不会”标红“就看你人品了!作者查重时,曾出现过一段话用自己的语言翻来覆去改了三遍仍然”标红“的情况,让人哭笑不得。只能说作者当时人品衰得没办法了,但愿现在发的这篇文章能攒些人品,以待来日!  
(9)网络上的某些内容也是在知网的数据库里的。比如:“百度文库”、“道客巴巴”、“豆丁网”、“互动百科”、“百度百科”。作者查重的时候,甚至还遇到很多奇葩的网站,神马“东方财富网博客”、“ 人大经济论坛”。所以,选择网上的内容时要慎重。  
(10)外文文献,知网数据库里存储较少。鼓励大家多看外文文献,多学习国外的先进科学知识、工程技术,翻译过来,把它们应用到我国的社会主义现代化论文中来!  
(11)建议各位学校查重前,在网上先自费查一遍。检测报告会对重复的地方”标红“,先修改一遍。  
(12)检测一遍修改完成后,同学们不要掉以轻心。因为知网查重最变态、最令人愤怒的地方来了:第一次查重没有“标红”的地方,第二遍可能会出现“标红”,说你是抄袭。舍得花钱的话,在网上花钱再查一遍,直到低于学校要求的重复率。  
(13)网上现在常用的查重有”万方“、”知网“、”paperpass“,paperpass最松,万方居中,知网最严。  
万方的数据库不全,查出来重复率会低于知网5%,知网是以”连续13个字一样“就算重复,所以查出来重复率较高!
最好选择用万方先预查,改完的通过率一般较高。   1、如果是引用,在引用标号后,不要轻易使用句号,如果写了句号,句号后面的就是剽窃了(尽管自已认为是引用),所以,引用没有结束前,尽量使用分号。有些人将引用的上标放在了句号后面,这是不对的,应该在句号之前。  2、可以将文字转换为表格,将表格边框隐藏。  3、如果你看的外文的多,由外文自己翻译过来引用的,个人认为,不需要尾注,就可以当做自己的,因为查重的数据库只是字符的匹配,无法做到中文和英文的匹配。  4、查重是一个匹配的过程,是以句为单位,如果一句话重复了,就很容易判定重复了,所以:的确是经典的句子,就用上标的尾注的方式,在参考文献中表达出来,或者是用:原文章作者《名字》和引号的方式,将引用的内容框出来。引号内的东西,系统会识别为引用如果是一般的引用,就采用罗嗦法,将原句中省略的主语、谓语、等等添加全,反正哪怕多一个字,就是胜利,也可以采用横刀法,将一些句子的成分,去除,用一些代词替代。或者是用洋鬼子法,将原文中的洋名,是中文的,就直接用英文,是英文的直接用中文,或是哦中文的全姓名,就用中文的名,如果是中文的名,就找齐了,替换成中文的姓名。故意在一些缩写的英文边上,加上(注释)(画蛇添足法),总之,将每句话都可以变化一下,哪怕增加一个字或减少一个字,都是胜利了。特别注意标点符号,变化变化,将英文的复合句,变成两个或多个单句,等等,自己灵活掌握。因为真正写一篇论文,很罕见地都是自己的,几乎不可能,但大量引用别人的东西,说明你的综合能力强,你已经阅读了大量的资料,这就是一个过程,一个学习、总结的过程。所有的一切,千万别在版面上让导师责难,这是最划不来的。导师最讨厌版面不规范的,因为他只负责内容,但又不忍心因为版面问题自己的弟子被轰出来。  5、下面这一条我傻妞试过的,决对牛B:将别人的文字和部分你自己的文字,选中,复制(成为块,长方形),另外在桌面建一个空文件,将内容,复制到文件中,存盘,关闭。将这个文件的图标选中,复制,在你的正文中的位置上,直接黏贴,就变成了图片了,不能编辑的。这个操作事实上是将内容的文件作为一个对象插入的,所以是图片。这个操作事实上是将内容的文件作为一个对象插入的。所以是图片。   结论:本文的写作纯属作者个人理解、心得体会,不能保证全文100%的准确性,有人因为采用了本篇文章中的某些方法而论文没通过学校检测,作者概不负责。本文是为了让广大同学了解知网查重的一些特点,而不是鼓励大家抄袭他人文章,建议大家自己写作,支持原创!祝各位同学顺利毕业,大好的工作、大把的妹纸在前方等着你,骚年!师兄只能帮你倒这儿了   特别需要注意的问题:  面总结几个常见问题:  一、有些书籍的年份久远,知网等检测系统没有收录这些材料,大段大段的copy是不是很安全?也有同学认为,数据库大多是往届学生论文和期刊的文章,书本和政府工作报告等暂未入库,直接抄书一般也不会“中招”。  答:这些做是存在风险的。第一,虽然中国知网没有收录书籍,但是可能存在a同学或者老师,他同样也抄了同样的内容,并且已经将其抄书的论文发表了,中国知网能数据库全文收录a的文章,那么你再抄同样的内容,在进行论文检测的时候,很可能指向a的文章,将会被认定为抄袭。  “但如果所抄书本,前几年有人抄过,还是会被测到,因此大家会选择最近两年出版的新书来抄。”但是,新书也可能存在抄别人或者被别人抄的现象。另外,在论文评审的时候,评审专家的经验和理论水平比较丰富,你大段的引用可能被这些老专家们发现,到时候结果就很悲催了!  二、现在有些网页上也有很多相关材料,撰写论文能不能复制上面的内容?比如百度文库、豆丁?”。  答:也是很危险的。网页很大程度上来源于期刊网,不少文章是摘抄期刊网上的文章,通过n篇论文粘贴复制而成。另外有些数据库已经将互联网网页作为数据库的组成部分之一。   连续13个字相同,就能检测出来你可以把原文的内容,用新的文字表达出来,意思相似就可以了,最好用联想法,就是看一遍用自己的语叙述出来,但要做到专业性,就是同义词尽量用专业术语代替,要做到字不同意思相同。例如主动句改成被动句,句式换了,用同意词或是用专业术语代替等等。还要注意论文框架。  降低抄袭率率的方法:  1划分多的小段落来降低抄袭率。
2.很多书籍是没有包含在检测数据库中的 ,比如论著。可摘抄3.章节变换不可能降低复制率4.论文中参考文献的引用符号,但是在抄袭检测软件中,例如一篇文章有5000字,文章的1%就是50字,如果抄袭了多于50,即使加了参考文献,也会被判定为抄袭。
只要多于20单位的字数匹配一致,就被认定为抄袭修改方法:首先是词语变化。文章中的专业词汇可以保留,尽量变换同义词;其次,改变文中的描述方式,例如倒装句、被动句、主动句;打乱段落的顺序,抄袭原文时分割段落,并重组。
   知网查重是以句子为单位的。即将文章以句子为单位进行分割,然后与知网数据库中的论文逐句对比,若其中有主要内容相同(即实词,如名词、动词、专业词汇等),则标红。若一个段落中出现大量标红的句子,则计算在论文重复率中。按照我自己的经验,避免查重最好的办法,就是把别人论文中的相关段落改成用自己的语言写出来。比如调换句子之间的顺序,更重要的是改变句子主谓宾的结构。按照这样的方法,我的论文重复率大概在3%左右,没有任何问题。希望可以帮到你! 是这样的。因为基本上都是以句子为单位的。不过从现在掌握的情况来看,实际上是针对每段的内容,将该段的所有句子打散,然后逐句对比查重。比如说你的论文中的一段有A、B、C、D四句话,数据库中一篇文章的一段中有E、F、G、H四句话。那么比较的时候,应该是A、B、C、D分别于E、F、G、H比较,笨一点说,就是比较16次。这样的话,单纯改动句子顺序就不好用了,必须改变句子结构才可以。   一、各个数据库论文检测系统的比较和选择   众所周知,数据库有三驾马车:中国知网(cnki)、万方、维普;一般高校硕士、博士毕业论文都用的是知网论文检测系统(本科毕业论文我不太清楚,不过80%应该用的也是知网论文查重系统),因为知网是全国学位论文和期刊论文收录最齐全,势力最强大的一种数据库,万方其次,维普的就比较糟糕,不值得一提了,收录量比较少。一般数据库的收录程序是这样的,各个数据库去高校联络本校毕业论文资源,基本上是几家数据库垄断的,给知网就不会给万方,给万方就不会给知网,因为知网势力强大,提供的优惠多,所以绝大多数高校都是将资源提交给了知网,我为什么要说这个呢,很多同学检测论文抄袭的时候,不知道是选择知网还是万方或者维普,知网是有绝对的权威性和垄断性,跟学校检测的结果是一致的,所以才敢这么牛气,要价这么高,不过我还听说,价格高是因为知网一次只能检测5000字,所以一篇硕士有2-3万次,需要提交好多次才能检测完,到底是不是这样我也没有得到证实。   查重通过必须满足3里面的前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。如果13个字里有一半相似,会算一半疑似相似,所以一定要变换句式,用专业术语代替,要改的仔细彻底,切记,切记。   知网检测范围:  中国学术期刊网络出版总库  中国博士学位论文全文数据库  中国优秀硕士学位论文  全文数据库中国重要会议论文全文数据库  中国重要报纸全文数据库中国专利全文数据库  互联网资源英文数据库(涵盖期刊、博硕、会议的英文数据以及德国Springer、英国Taylor&Francis 期刊数据库等)优先出版文献库港澳台学术文献库互联网文档资源   知网系统计算标准详细说明:  1.看了一下这个系统的介绍,有个疑问,这套系统对于文字复制鉴别还是不错的,但对于其他方面的内容呢,比如数据,图表,能检出来吗?检不出来的话不还是没什么用吗?  学术不端的各种行为中,文字复制是最为普遍和严重的,目前本检测系统对文字复制的检测已经达到相当高的水平,对于图表、公式、数据的抄袭和篡改等行为的检测,目前正在研发当中,且取得了比较大的进展,欢迎各位继续关注本检测系统的进展并多提批评性及建设性意见和建议。   2.按照这个系统39%以下的都是显示黄色,那么是否意味着在可容忍的限度内呢?最近看到对上海大学某教师的国家社科基金课题被撤消的消息,原因是其发表的两篇论文有抄袭行为,分别占到25%和30%. 请明示超过多少算是警戒线?  百分比只是描述检测文献中重合文字所占的比例大小程度,并不是指该文献的抄袭严重程度。只能这么说,百分比越大,重合字数越多,存在抄袭的可能性越大。是否属于抄袭及抄袭的严重程度需由专家审查后决定。   3.如何防止学位论文学术不端行为检测系统成为个人报复的平台?  这也是我们在认真考虑的事情,目前这套检测系统还只是在机构一级用户使用。我们制定了一套严格的管理流程。同时,在技术上,我们也采取了多种手段来最大可能的防止恶意行为,包括一系列严格的身份认证,日志记录等。   4.最小检测单位是句子,那么在每句话里改动一两个字就检测不出来了么?  我们对句子也有相应的处理,有一个句子相似性的算法。并不是句子完全一样才判断为相同。句子有句子级的相似算法,段落有段落级的相似算法,计算一篇文献,一段话是否与其他文献文字相似,是在此基础上综合得出的。   5.如果是从相关书籍上摘下来的原话,但是此话已经被数据库中的相关文献也抄了进去,也就是说前面的文章也从相关书籍上摘了相同的话,但是我的论文中标注的这段话来自相关的书籍,这个算不算学术抄袭?  检测系统不下结论,是不是抄袭最后还有人工审查这一关,所以,如果是您描述的这种情况,专家会有相应判断。我们的系统只是提供各种线索和依据,让人能够快速掌握检测文献的信息。  6.知网检测系统的权威性?  学术不端文献检测系统并不下结论,即检测系统并不对检测文献定性,只是将检测文献中与其他已发表文献中的雷同部分陈列出来,列出客观事实,而这篇检测文献是否属于学术不端,需专家做最后的审查确认。         目前收费的论文检测系统为知网的学位学术不端行为检测系统,或是万方数据的检测系统(一般学校本科在用,万方是知网分裂出来的,计算方法类似)。而学校使用的正是知网的系统。而学校硕士毕业使用的正是知网的系统。万方的一般学校是本科阶段常用。所以收费系统的检测结果就是和学校的是一样的,而这两个系统都是不允许个人注册使用的。于是,就有人弄到账号后帮人检测收费。因为检测结果权威,所以要收费。免费的论文检测系统一般是由个人或其它公司开发,因为系统没有被高校所采纳,所以就算检测结果比收费的系统准也不能成为权威。至于这两种系统检测结果有多大的区别,就很难说了,因为知网的论文检测系统有国家的扶持,论文对比库比较全面,检测出来的抄袭率一般比其它的高,当然也不是绝对的。论文查重,参考文献引用的内容还算吗?在万方上查重,出现的绿字,就是引用参考文献的内容,在论文查重时,算重复率吗?要看你索引的字数以及你们学校的规定。索引的字数不要太多,最好不要大段大段的引用,而且也得看你们学校的规定,有的学校查重的时候只看抄袭率,有时你引用自己的也算抄袭,的确很无奈。有的学校查重的时候会看你引文的出处,如果有出处,那么就不算了。所以最关键的还是要看学校会“怎么办”。 ,知网查重时很少会根据你的参考文献而去排除你抄袭的引文,也就是说,你所引用的文字,在知网上还是算重复率的,所以你要么少引用,要么把引用的加以修改~
提问者评价
其他类似问题
知网的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
范例--电子商务毕业论文(设计)开题报告表范例
下载积分:1000
内容提示:范例--电子商务毕业论文(设计)开题报告表范例
文档格式:DOC|
浏览次数:1|
上传日期: 14:25:36|
文档星级:
该用户还上传了这些文档
下载文档:范例--电子商务毕业论文(设计)开题报告表范例.DOC
官方公共微信TOP热门关键词
专题页面精选
摘要:针对复杂环境下的旅游管理决策问题,对皋于数据的智能决策支持系统进行研究。首先提出,综合多种智能技术的决策支持系统体系结构,对系统涉及到的3S、大型决策表分解等关键技术进行J,分析;然后从旅游信息类别 ...
摘要:针对复杂环境下的旅游管理决策问题,对皋于数据的智能决策支持系统进行研究。首先提出,综合多种智能技术的决策支持系统体系结构,对系统涉及到的3S、大型决策表分解等关键技术进行J,分析;然后从旅游信息类别、时窄模式、旅游规划与导航,以及旅游状态和安全事故预测预警等方面给出,系统采用的数据分析方法,并给出系统的多个应用实例。
关键词:智能决策,多智能体系统 旅游信息处理,复杂事件
旅游管理决策需要动态监控旅游资源利用状况,科学评价旅游市场发展,为各类旅游规划、开发提供数据支持和参考,从而为旅游行业管理部门进行整体规划和制度完善、旅游企业进行高效管理和业务开展提供决策支持,最终提高旅游行业数字化进程,实现旅游业的大发展。鉴于旅游行业管理决策的需要,国内外研究者进行了大量的、多层次、多角度的探索。学者们通过时间序列模型(趋势分析)、相关分析模型、引力模型、潜能模型等,致力于寻找旅游需求的解释模式,探索旅游需求的行为规律与行为模式积累了大量的研究成果。而20世纪90年代之后,随着经济学的介入和人工智能理论的广泛应用,研究者将计量经济方法、神经网络、灰色模型等方法引入旅游需求模型和预测研究,进行了有益的探索。旅游管理决策的研究逐渐体现出学科交叉性大,关联性强,学科互相渗透、互相借鉴等特点。同时,由于经济数据、地理数据等的引入模型的建立越来越凼难,且难以比较及时地反映旅游市场的变化情况。要从旅游资源、旅游市场和旅游者等多方面对旅游数据进行综合分析并提供决策支持,传统的研究方法已经难以适用,主要难点体现在:
1)旅游数据的海量性和复杂性
旅游决策的难点在于信息的海量性和复杂性,所要处理的问题涉及吃、住、行、游、购、娱6大旅游要素。就旅游资源而言,其类型复杂、数量庞大,共包括8个主类、31个亚类和155个基本型,每个旅游资源单体义包括文献、图像、视频等不同媒体形式的资料;旅游市场则更是涉及多种不同领域的数据;而旅游者个人的特征和偏好数据不但复杂,而且难于获得。只有能够对各种类型的海鼍数据从多个角度进行分析并加以综合才可能为正确的旅游管理决策提供依据。
2)旅游数据的动态变化性
伴随国内经济的快速发展,我国的旅游市场在快速增长的同时也在不断发生变化,旅游产品不断丰富,旅游形式更加多样。人们在出行方式、旅游目的地选择方面也会冈多种因素的影响而不断发生变化。如休假政策的调整、国家经济运行状况、旅游产品推广和媒体宣传、奥运会等重大活动都会对旅游行为产生影响,从而导致旅游数据的动态变化。
因此,必须能够发现甚至提前预测数据的变化,从而及时做出管理决策。从以上可以看出,虽然传统旅游决策方法采用各种定量模型在定量分析和处理中发挥了巨大作用,但由于是通过模型来操纵数据,实际上支持的仅仅是决策过程中结构化和具有明确过程性的部分。随着决策环境日趋复杂,其局限性也日趋突出,具体表现在:系统在决策支持中的作用是被动的,不能根据决策环境的变化提供主动支持,对决策中普遍存在的非结构化问题无法提供支持;定量数学模璎对决策中常见的定性问题、模糊问题和不确定性问题缺乏相应的支持手段。改变以往的定量模型决策方法,转而采用基于数据的决策技术,成为解决现代旅游管理决策问题的一条有效途径。这是冈为,现代旅游业的管理已经越来越多地采用信息化手段,从旅游资源、旅游市场、旅游者等多方面对旅游数据进行收集,这些数据成为发现其中蕴含的潜在规律和旅游管理决策知识的重要基础。这其中不仅包括旅游资源类型、数量、分布和特色在内的旅游资源信息,还包括旅游资源赋存的环境信息,以及旅游客源结构、市场拓展、旅游需求等方面的数据,它们共同构成了旅游资源评价、旅游区开发规划、旅游业政策制定及旅游产业日常管理的依据。因此,基于数据的旅游管理决策方法研究和决策支持系统的建立已经成为目前旅游行业亟待解决的一个重要问题。
本文对智能化的决策支持技术进行了研究,首先提出了集成多种智能技术、3S技术的决策支持系统体系结构,以提高系统的适应性、灵活性,以及对空间多媒体数据的支持能力;然后在采集了大量的旅游接待能力数据、旅游信息预报数据、景区(点)省(区、市)旅游接待情况数据、交通运输部门客运情况数据、旅游接待人数和收入测算数据及其他相关旅游数据的基础上,给出了系统对假日旅游数据进行类别分析、挖掘和时空模式发现方法,从而实现基于数据的假日旅游规划,以及假日旅游状态和安全事故的预测预警;最后给出了智能决策支持系统在旅游目的地营销、多媒体导航、旅游管理等方面的多个应用实例和实现方案。
1、智能旅游管理决策支持系统的体系结构
智能决策支持是决策支持系统和人工智能相结合的产物,是决策支持系统研究的~个热点。初期综合了传统决策支持系统的定量分析技术和专家系统的不确定推理的优势,较原来的决策支持系统能够更加有效地处理半结构化与非结构化问题,但是目前专家系统对定性知识处理能力依旧较弱,并且存在适应性差等不足。由于专家系统的缺点,在Agent技术出现并发展后,智能决策支持系统逐步与Agent技术结合,在一定程度上可以避免专家系统的很多缺点。Agent通过传感器获取信息,为用户提供解答或求解的启发性信息;用户可以通过Agent身份成为系统的一部分,参与实现系统的功能。这种方法包含了更多的协作和灵活的内容,有利于系统对问题更加全面的了解。但是无论如何,此类面向个体的智能决策支持系统对定性问题、非结构化问题和不确定性问题的支持力度依旧较弱,同时决策环境复杂度的增加使它们逐渐显示出其局限性。此时的决策一般不能由单一的决策者完成,需要多个决策者协作才能做出正确的决定。群/组织决策支持系统即在此背景下出现,它是指多个决策者通过彼此间的通信和协作产生决策方案,并最终通过协调和评估形成决策。群/组织决策支持系统的研究群体间的协作机制、意见综合集成等,在解决复杂决策问题时有一定的效果,但与其他决策支持系统相比,提供的定量分析能力却较弱。数据仓库、联机分析处理(On—line analyticalpraessing,OLAP)和数据挖掘等新技术为决策支持系统开辟了新途径。数据仓库用于解决决策支持系统中对大量数据的分析和访问需求。
数据仓库将分布的和不同历史时期的数据集成到一起,方便用户的访问,可以使决策人员对一段时期内的数据进行分析并研究走势。OLAP以数据仓库为基础,通过切片、切块、钻取与旋转、模型计算等,实现对数据的多维分析和处理,可以帮助分析人员从各个方面观察信息,达到对数据的深入理解。数据挖掘则结合了人工智能技术和机器学习方法,利用信息论、统计分析和模糊论、粗集方法等对数据进行归类、预测、评价和决策。目前数据挖掘还扩展到各类信息存储上,如W。eb数据挖掘等,增强了对半结构化数据的分析能力。基于数据仓库、OLAP和数据挖掘技术的决策支持系统提高了决策分析的能力,但它仍以计算机的模型处理为主,无法全面解决复杂事件的决策问题。旅游管理所处的环境复杂,涉及范围广,内容多,因此旅游管理决策实际上是一种复杂事件的决策,为其建立决策支持模型很困难,而且对问题观察而导致的建模也只能是一种近似描述。对各类旅游数据进行分析和模式发现有助于进行旅游管理决策,但根据各种智能决策支持技术的发展状况来看,都无法单独完成全部的定性定量分析,更无法处理复杂事件的决策支持吲,冈此需要综合多种智能决策支持技术实现基于数据的决策过程。本文将该过程分为问题提出、数据采集和模型选择、数据分析、评估和决策4个阶段的迭代过程。
该过程的关键是能够根据评估结果比较和选择各种分析方法和决策模型,同时对数据采集策略不断进行调整,以提高数据分析的适应性和有效性。为了对该过程提供有效的决策支持,适应多种决策技术的选择和使用,本文综合集成数据挖掘、Agent和群体决策等多种智能决策技术构建了基于数据的智能旅游管理决策支持系统。
在技术支持层面上,系统采用3S技术增强空间数据的采集、处理能力;通过分解技术解决大型决策表的复杂性问题;运用数据挖掘技术和智能推理技术,利用系统的数据库、模型库和知识库进行模型决策、范例推理和Web挖掘等,辅助专家形成观点和看法;通过系统中的自适应决策支持技术实现对复杂旅游管理问题和动态数据的定量分析支持;通过群/组织决策支持技术提供人一人交互环境,支持专家之间的协同交互,依靠群体专家解决非结构化的直觉思维问题。数据分析子系统依靠3S、自适应决策支持技术等提供的工具和技术环境,采用各种数据分析方法对旅游数据进行分类、挖掘和时空模式的发现,进而实现假日旅游规划、旅游状态和安全事故预测预警,最终为各类旅游应用系统提供决策支持。以卜-将对系统采用的关键技术、数据分析方法及其应用实例作进一步的阐述。
2、智能旅游管理决策支持系统的关键技术
2.1 3S技术的集成应用
由于旅游数据所具有的空间特性和多媒体特性,在旅游管理决策系统中应用地理信息系统fGeographicalinformation system,GISl、遥感技术(Remote sensing,RS)和全球定位系统(Global positioningsystem,GPS)技术[8_9J,可以有效增强系统的数据采集、更新能力。RS在旅游资源空间信息采集、图像处理等方面具有较强的功能;GPS在旅游资源空间定位、野外数据采集方面作用较大,可用来快速获取资源单体的地面控制点参数,也可用于测鼍获取旅游资源空间信息数据;GIS对获取的空间数据进行管理以及空间分析。将这些技术集成并应用于旅游管理决策支持系统,能够自动、实时地采集、处理和更新旅游数据。辅以3D技术、虚拟现实(Virtual reality,VR)技术还可以实现旅游资源数据在地理空间形式上的可视化,在旅游规划决策中能模拟旅游规划方案的效果,以便进一步完善规划方案。
将3S技术与基于Agent的知识表示技术和问题求解技术相结合,应用在决策支持系统中具有独特的优势,除具有传统的空间信息管理、查询功能外,还可结合专家知识和空间数据模型进行智能分析,根据用户不同状况采用不同的分析策略。
2.2大型决策表的分解
实际的旅游管理决策应用中,数据的海晕性和复杂性是当前决策表数据分析面临的难题。决策表的复杂性主要来自于属性数量的增长,许多决策表包含大量的对象和属性,结构复杂,若直接对其进行挖掘,计算复杂度高,而所得到的规则质量较低。针对决策表的复杂性,首先考虑对属性集的处理,力求减小属性集的规模。属性约简方法力图在保持分类能力不变的前提下删除决策表中不相关或不重要的属性,从而减小属性集的规模。但属性约简技术在某些情况+卜。仍然存在一些弊端,例如由于必要的条件属性很多,经过约简后的属性集可能仍然庞大;约简算法的结果依赖于训练集中对象的数量,若对象较少,约简的质量将受到影响;而且某些约简算法对于大型决策表效率较低,计算复杂度高。分解技术也可以用于解决大型决策表的问题,即从对象集或属性集的角度,将原决策表分解为若干规模较小的子表。决策表分解后,各子表本身仍然是一个完整的决策表,但对象集或条件属性集的规模较小,分析与处理较原决策表简单。在子表中进行规则获取,减少每次处理的数据量,避免直接在复杂系统中建模的困难和缺陷,提高数据分析的效率和质量。决策表分析中使用的分解方法有:
1)函数分解方法:将原表中的决策属性看作条件属性的函数,根据函数分解理论将该函数分解为一个复合函数,条件属性集被划分为外部函数和内部函数中的两个子集。通过递归分解,决策表分解为具有层次关系且规模较小的子表,并且通过建立属性集上的层次结构,得到有意义的中间决策概念,从而描述复杂决策逻辑。
2)基于属性核的分解方法:根据粗糙集理论,核是指决策表中对决策起关键性作用的重要属性,冈此,依据决策表中的核属性和非核属性,可以将原决策表分解为两个子表,并产生一个中间决策属性。
3)基于属性聚类的分解方法:通过计算条件属性之间的依赖度,从而对条件属性聚类,形成多个独立的条件属性子集来分解决策表。
由于不同分解方法在许多特征和性能方面存在一定差异,适用情况也有所不同,冈此在应用时需要根据决策表数据本身的特点选择合适的分解方法。选择适当的分解方法可以从规则质量与分类精度,信息无损性和决策等价性,以及时间复杂度儿方面进行评价和选择,力求在保证决策等价的前提F,达到分解效率和分类质量的平衡。
3、智能旅游管理决策中的数据分析和预测
3.1假日旅游信息的类别分析
假日旅游信息的分类包括景区(点)的空间格局、旅游域、旅游线路和旅游者信息的分类。为此,需要将由多个不同的假日旅游信息样本组成的集合划分为若干个子集,并且这些子集具有一定的物理意义,每个子集即代表一类旅游状态,从而形成一类旅游信息模式。冈此,旅游信息分类研究的重点是如何采用分类方法来解决假日旅游这一类具有多样性、高维性、不完全性、非线性和分布很复杂的海量数据的分类问题,研究如何提高分类效率和准确度,研究旅游信息参数的特征选择与特征提取以及区域旅游状态聚类分析等。其中,采用改进的几何超曲面分类方法、模糊聚类、贝叶斯算法等都能在一定程度上解决具有海量、多维、异构、非结构、不确定和具有分布存储等特征的假日旅游数据的分类问题,尤其是解决在有限区域分布很复杂的海量非线性数据分类问题。例如,通过对基于广义超曲面树分类的研究,并且将该算法应用于旅游者消费状况分类,我们发现:采用广义超曲面树搜索分类的分类方法,在对非线性数据进行分类是完全可行的,而在处理大规模样本数据时,分类速度和正确率都可以得到保证,并且无需考虑矩阵的复杂计算,冈而可以大大节省计算资源,提高分类效率。另外小样本训练大样本测试结果也表明广义超曲面树搜索分类法的泛化能力较好,取得了较好的分类结果。
3.2假日旅游数据挖掘和时空模式发现与识别
在对假日旅游数据的挖掘与时空模式分析过程中,我们以数据仓库为基础,集成元数据管理、数据抽取、装载、转换工具,OLAP工具和数据挖掘工具,采用频繁集搜索算法、关联规则搜索算法、时空聚类分析等方法,对假日旅游信息进行数据挖掘,研究了假日旅游信息的时空模式及其变化和发展的规律。例如,若干假日旅游信息参数(如:客房预订和出租率、交通客运流量、接待人数和门票收入等)时间序列之间的相互关系;不同地点的同一旅游信息参数之间的关联关系;不同地点的不同旅游信息参数之间的关联关系等。通过对数量关联规则聚类挖掘的研究,我们在对假日旅游信息空间数据的组成、存储方式分析的基础上,扩展了基于谓词描述的空间数据的访问接口,建立了旅游信息空间属性的关系数据库模型。同时,对于空间关联规则的挖掘,我们采用概念层次树对拓扑关系表按照不同种类的对象进行概化处理,形成新的拓扑关系数据表,并在此基础上提取空间关联规则。
3·3假日旅游智能规划与导航&
本文关键词:
您可能感兴趣的文章
本站推荐的文章
本文标题:
本文链接网址:
1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。

我要回帖

更多关于 毕业论文致谢 的文章

 

随机推荐