文献检索的基本方法几种方法以及优缺点

几种重要的化学文献检索工具使用方法简介 - 百度文库
几种重要的化学文献检索工具使用方法简介
理化生教学
2009.9(中旬刊
几种重要的化学文献检索工具使用方法简介
(陕西教育学院化学系
中图分类号:G633.8
文献标识码:A
陕西·西安710061)
文章编号:(-02
摘要本文简介了美国《化学文摘》、美国《科学引文索引》以
检索工具使用方法
合条件的文献的文摘号为“24639k”。根据此文摘号去查文摘主体,可获得该文献的详细信息。CA文摘的著录内容一般包括:英文标、作者、作者所在单位、原始文摘名称、卷、期、页、年份、原题(黑体)文摘正文、文摘员姓名等。著录内容中还会提供原文始文献文别、
的发表出处。如果想获得完整的文献可根据提供的期刊详细信息或出处进行具体查找。
1.2美国《科学引文索引》(SCI)检索方法
SCI创刊于1961年,由美国费城科学情报研究所编辑出版。1965年至今为双月刊,并有年度累积索引和5年度累积索引。SCI收录的文献内容涉及整个自然科学,SCI是一部编排独特、用途广泛的综合性科技文献检索工具。
SCI每期有A,B,C,D,E,F六册。A,B,C三册是引文索引,包括团体著者引文索引、匿名引文索引以及专利引文索作者引文索引、
引。前三种引文索引的编排格式都是以其检索项目的英文字序排列、专利引文索引以专利号数字大小排列。下面以作者引文索引为例。
②93CANCERRES③53④4391⑤⑥KUNDUSDJUROL③
②95BIOTECHNOLBIOENG③45④440⑤⑥SUKESANSJAPPLMICR③CHANGHLW①
②72TETRAHEDRONLETT③19④1989⑤⑥GOURLAOUNJCARBCHEM③引证作者。
通过作者引文索引,如例中可知:作者KUNDUSD在1998年第160卷UROL期刊上发表的一篇文章引用了CHANGHL的文章。因此引文索引除了能检索文献外,还可以统计机构和学者发表论文的数量和论文被引用的情况,了解学术机构和学者的活动并评价其科研成果的学术水平,SCI现已成为文献计量学和科学计量学的重要工具。
D册为来源索引,包括来源出版物表、机构引文索引以及来源索引。来源索引统一按作者英文字序排列,相当于其他检索工具中的作者索引。通过来源索引可以检索到文献的出处,进而获取文献原文。E,F册为轮排主题索引。根据检索主题,选择合适的主题词,通过轮排主题索引检索到符合主题要求的文献作者。根据此作者姓名转查“来源索引”,进而获取文献出处。
SCI检索的一般方法:从一篇符合你研究课题文章的参考文献出发,通过适当的引证索引找出引用这一文献的所有作者,然后转查“来源索引”,利用“来源索引”查出这些作者所写的文章的题目及
(下转第246页)
说明:①被引证作者;②发表年份;③缩写刊名;④卷;⑤页;⑥
及中国知网和两种常用的外文数据库的检索方法。
关键词化学文献
现代科技突飞猛进的发展给人类社会带来了日新月异的变化,而科学技术的发明创造需要依靠经验和各种积累的理论材料。因此科研工作者要想在自己所从事的领域中有所创新,他们必须要花费大量时间对有关文献进行全面调查研究。化学文献同其他科技文献一样,是人们从事生产斗争和科学实验的记录。现代化学文献具有文献数量迅猛增加,种类繁多,文献交叉重复、发表分散,失效率加快的特点[1]。所以化学工作者要想从大量的化学文献中找到自己所需的有效信息,必须要掌握化学文献检索的方法。本文主要介绍几种重要的化学文献检索工具的使用方法。
1印刷型文献检索工具
1.1美国《化学文摘》(CA)检索方法
CA创刊于1907年,美国化学文摘社主办。CA被称为“世界化学化工文献的钥匙”,收录世界各国化学化工方面的出版物已超过20,000余种。1967年起CA改为周刊,半年一卷,一卷26期,每年出版两卷,并另出各种索引。
CA的编排格式整体来说由文摘主体和索引两部分组成。CA检索化学文献总的原则:通过索引检索到符合自己检索要求的文献的文摘号,根据文摘号再去查文摘主体,进而获得文章原文。
CA索引包括单期索引、卷索引以及10卷累积索引。根据检索项的不同,这三种索引又分别包含多种具体的索引,例如:以作者为检索项的作者索引,以专利号为检索项的专利号索引,以及分子式普通主题索引、化学物质索引等。下面以主题索引为例,介绍索引、
此索引的用法。在实际检索过程中,其他类型索引的用法类比主题索引。下面首先给出主题索引的编排格式[1]。
①Aceticacid⑥[64-19-7],②Preparation③by-productfrom,asflotationagents⑤P16505,③bycarbonylationofmethanol,④catalystsfor,⑤24639k
说明:①主题词;②副题;③一级说明语;④二级说明语;⑤文摘号;⑥登录号(化学组成明确的化合物永久性代号,供计算机检索文献用)。
首先根据检索要求选择合适的主题词,索引中的主题词按照英文字序编排。根据位于主题词后的副题对主题范围进行限定。如例中“Aceticacid[64-19-7],Preparation”表示有关醋酸制备的文摘都使标题更加归纳在此标题之下。一级说明语用来限定主题和副题,
明确。二级说明语用来限定标题和一级说明语,使内容更加详细。文摘号表示该条文摘在文摘主体中的顺序即所处的位置。如要查“通过甲醇羰化法制备乙酸所用的催化剂”的文献,由例中可知,符
贡献者:兰儿lanlan信息检索几种相似度计算方法作对比-字符串相似度计算
您现在的位置:&&>>&&>>&信息检索几种相似度计算方法作对比
信息检索几种相似度计算方法作对比来源:&&&&关键词:
  几种相似度计算方法作对比  句子相似度的计算在自然语言处理具有很重要的地位,如基于实例的机器翻译(Example Based Ma-chine Translation,EBMT)、自动问答技术、句子模糊匹配等.通过对术语之间的语义相似度计算,能够为术语语义识别[1]、术语聚类[2]、文本聚类[3]、本体自动匹配[4]等多项任务的开展提供重要支持。在已有的术语相似度计算方法中,基于搜索引擎的术语相似度算法以其计算简便、计算性能较高、不受特定领域语料库规模和质量制约等优点而越来越受到重视[1]。 相似度计算方法总述:  1 《向量空间模型信息检索技术讨论》,刘斌,陈桦发表于计算机学报,2007 相似度S(Similarity):指两个文档内容相关程度的大小,当文档以向量来表示时,可以使用向量文档向量间的距离来衡量,一般使用内积或夹角0的余弦来计算,两者夹角越明似度越高。由于查询也可以在同一空间里表示为一个查询向量(见图1),可以通过相似度计算公式计算出每个档向量与查询向量的相似度,排序这个结果后与设立的阈值进行比较。如果大于阈值则页面与查询相关,保留该页面查询结果;如果小于则不相关,过滤此页。这样就可以控制查询结果的数量,加快查询速度。  2 《相似度计算方法综述》  相似度计算用于衡量对象之间的相似程度,在数据挖掘、自然语言处理中是一个基础性计算。其中的关键技术主要是两个部分,对象的特征表示,特征集合之间的相似关系。在信息检索、网页判重、推荐系统等,都涉及到对象之间或者对象和对象集合的相似性的计算。而针对不同的应用场景,受限于数据规模、时空开销等的限制,相似度计算方法的选择又会有所区别和不同。下面章节会针对不同特点的应用,进行一些常用的相似度计算方法进行介绍。  内积表示法:  1 《基于语义理解的文本相似度算法》,金博,史彦君发表于大连理工大学学报,2007  在中文信息处理中,文本相似度的计算广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域,是一个非常基础而关键的问题,长期以来一直是人们研究的热点和难点。计算机对于中文的处理相对于对于西文的处理存在更大的难度,集中体现在对文本分词的处理上。分词是中文文本相似度计算的基础和前提,采用高效的分词算法能够极大地提高文本相似度计算结果的准确性。本文在对常用的中文分词算法分析比较的基础上,提出了一种改进的正向最大匹配切分(MM)算法及歧义消除策略,对分词词典的建立方式、分词步骤及歧义字段的处理提出了新的改进方法,提高了分词的完整性和准确性。随后分析比较了现有的文本相似度计算方法,利用基于向量空间模型的TF-IDF方法结合前面提出的分词算法,给出了中文文本分词及相似度计算的计算机系统实现过程,并以科技文本为例进行了测试,对所用方  法进行了验证。这一课题的研究及其成果对于中文信息处理中的多种领域尤其是科技类文本相似度的计算比较,都将具有一定的参考价值和良好的应用前景。  2 《随机内积空间》,林熙,郭铁信发表于科学通报,2007  称(s,盘)为数域K上的以概率空间(口,a,)为基的随机内积空间  (Randominnerproductspace,简RI空间),若s是数域K上的线性空间且映射盘:×_+L(口,)满足Vpg,∈,V∈K,  (RIP一1):∈L(口)且((。)一0as。{P一0(中零元);  (RIP一2):M(m)一”(m);as其中x¨表x的共轭随机变量。  (RIP一3):xo¨(∞)一aXⅢ(∞);a。s。  (RIP一4):X+。,,()一X,。,(∞)+Xf,,(∞)。a。s。  若还存在零测集Ⅳ,使得对所有E口\Ⅳ上述公理成立,则称0,。劈)为一致随机内积空间。在RIP空间中称x为p与9的随机内积。  余弦响亮度量方法:  1 《基于云计算的余弦向量度量法文本检索模型》,付永贵发表在情报科学,2012  目前信息检索技术在国内外已经取得了很大的究成果,为用户信息检索提供了很大的便利,具体体现在不同的检索模型的应用,比如布尔模型、扩布尔模型、向量空间模型、概率模型、潜在语义模、统计语言模型等等,在文本信息检索中向量空间型中的余弦向量度量法是应用相对广泛而且效率。  经典的余弦向量度量法文本检索模型  (theclassiccosinevectormeasuringmethodtextre?trievalmodel)中查询和文本均被看成是由索引项构成的向量,比如对于有n个索引项的文本检索,可以由这n个索引项构成的空间向量来表示查询q和文本dj。则查询q可以表示为:q=(t1q,t2q,?,tnq),文本dj可以表示为:dj=(s1j,s2j,?,snj)。其中tkq,skj(1≤k≤n)分别表示查询q和文本dj的第k个索引项。在具体应用中通常用索引项在查询q和文本dj的权值来表示其在查询和文本中的重要程度,则查询q和文本dj可以用索引项权值构成的空间向量来表示,设  q=(w1q,w2q,?,wnq),wkq(1≤k≤n)表示索引项tkq(1≤k≤n)在查询q中的权值,文本dj=(v1j,v2j,?,vnj),vkj(1≤k≤n)表示索引项skj(1≤k≤n)在文本dj中的权值。 2 《基于项目评分预测的协同过滤推荐算法》,邓爱林,朱扬勇,施伯乐发表在软件学报,2012  度量用户间相似性的方法有多种,主要包括如3种方法【:余弦相似性相关相似性及修正的余弦相似性·余弦相似性(cosine):用户评分被看做是n维项目空间上的向量,如果用户对项目没有进行评分,则将用户对该项目的评分设为0,用户间的相似性通过向量间的余弦夹角度量。设用户i和用户-,在n维项目空间上的评分分别表示为向量,歹,则用户i  和用户之间的相似性sim(id) 分子为两个用户评分向量的内积,分母为两个用户向量模的乘积。相关相似性(correlation):设经用户i和用户共同评分的项目集合用表示,则用i和用户,之间的相似性sim(id)通过Pearson相关系数度量:Rf。表示用户i对项目C的评分,R和R,分别表示用户i和用户-,对项目的平均评分。修正的余弦相似性(adjustedcosine):在余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项目的平均评分来改善上述缺陷,设经用户i和用户共同评分的项目集合用表示和分别表示经用户i和用户J评分的项目集合,则用户i和用户之间的相似性sim(ij)为 Rf。表示用户i对项目c的评分,R和R,分别表示用户i和用户J对项目的平均评分。 JaccardCoefficient:  1 《信息检索-向量空间模型》     此方法看上去很好理解,就是用query和文档共同出现的词的个数,除以一共的词数。当然也有很多问题  1没有考虑文档中词出现的次数(没有考虑tf因素)  2没有考虑文档的频率(没考虑idf因素)  3没有考虑文档的长度,长文档和短文档计算相似度的差别会很大  系数主要用于计算符号度量或布尔值度量的个体间的相似度,因为个体的特征属性都是由符号度量或者布尔值标识,因此无法衡量差异具体值的大小,只能获得“是否相同”这个结果,所以Jaccard系数只关心个体间共同具有的特征是否一致这个问题。如果比较X与Y的Jaccard相似系数,只比较xn和yn中相同的个数。     信息科学与工程学院  肖艳丽  
本文★★网址:/yuedu/37903.html
好文大家读
上一篇文章:
下一篇文章:
Copyright &
All Rights Reserved.《》 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
下载积分:1000
内容提示:文献检索
文档格式:DOC|
浏览次数:10|
上传日期: 20:50:58|
文档星级:
该用户还上传了这些文档
官方公共微信文献检索时,一个中文单词可能有几种英语表达方式,怎么确定检索词?比方说电磁铁,可以用electromagnet 和eletro-magnet,检索词用哪一个,用or的话,检索出来的太多了_百度作业帮
文献检索时,一个中文单词可能有几种英语表达方式,怎么确定检索词?比方说电磁铁,可以用electromagnet 和eletro-magnet,检索词用哪一个,用or的话,检索出来的太多了
文献检索时,一个中文单词可能有几种英语表达方式,怎么确定检索词?比方说电磁铁,可以用electromagnet 和eletro-magnet,检索词用哪一个,用or的话,检索出来的太多了
两个都可以,带不带“-”出来的结果应该都差不多的.如果想要更精确的查找,可以在第一个检索词的后面加一个空格,然后再输入另外一个检索词,可以缩小查找的范围.
[electro] and [magnet]
1、两个分别输入搜索引擎中2、两个一起输入搜索引擎中(但是中间要有空格)3、两个一起输入百度搜索引擎中。步骤是:点击百度输入框右则的“高级搜索”——选择“包含以下的完整关键词”的文本框输入关键字——点击“百度一下”

我要回帖

更多关于 文献检索的方法主要有 的文章

 

随机推荐