qq语音自由麦改按键在哪调成按键说话?

语音输入范文第1篇
关键词:语音输入;随机培训;元认知策略
中图分类号:G642.0文献标识码:A 文章编号:1009-0118(2011)-12-0-01
一、语音――信息之窗
(一)信息输入
语言活动四项技能中,负责信息输入的有阅读和听力。阅读往往是中国二语习得者的优势,应试和环境原因使得听力成了“冷盘”。抛开这些原因,以上两种信息输入活动本身也存在“天壤”之别。二者虽共同加工同一语言,所采用的信息加工渠道却是截然不同的。学习者在阅读活动中通过“视觉”窗口来获得信息,而在听力活动中,则只能完全靠“听觉”。
(二)语言信息
阅读中遇到即时加工困难的信息可以先不做处理,语码自己不会跑掉,还在原地等你回来再次加工;而听力的几乎不可回溯性,瞬息消失性和人脑的短暂记忆使保留陌生信息直到再次加工的可能性小到微乎其微。这就要求听力中对信息的加工必须与“听”同时进行,或至多滞后几秒钟,否则,后面及时赶来的新信息就会被漏掉。听力留给听者的信息加工时间非常短,没有等待。这就要求听者对听到的信息必须熟悉,听到马上能辨析清楚。
(三)篇章语用信息
与语音提供的语言信息相比,态度情感、衔接、推理、条理、主题等篇章语用信息的加工因为要涉及更长时间的记忆而变得更为困难。同时,这些信息建立在语言信息基础之上,但又不完全依赖语言信息,语篇知识、语用知识、社会文化、世界知识等都会协助或阻碍更高级的网络般复杂的篇章语用信息的顺利加工。而且由于篇章语用信息的加工要建立在语言信息加工的基础之上,这些信息的加工又不能独立于语言信息的加工,而是几乎与其同时进行,难度要高于语言信息的加工(分属两个网络层次),同时还要补充适当的语篇、语用、社会文化、世界等知识,三重加重了加工的负担。
二、语音输入策略与语音意识的培养
(一)认知策略与语音输入
学习策略包括认知策略、元认知策略和社会情感策略。认知策略直接针对目标语言,涉及对目标语中音、字词以及其它方面知识的识别、记忆、储存和检索。听力活动中的认知策略包括信息推断、信息推敲、信息预测和信息的语境化,是对语言本身的加工和处理,都要依靠语音来完成。语音作为唯一的信息窗口负载所有语言和篇章语用信息,它所提供的信息辨别信号是信息加工的第一站,也是必经之路。
(二)元认知策略与语音意识的培养
认知策略旨在帮助学习者获得语音信息,完成信息加工的第一步,信息识别。这其中最重要的一个环节是语言学习者对元认知策略的有效掌握和使用,它有助于学习者自觉地将语音知识系统熟练掌握、消化吸收、直至内化。
三、听力语音输入及意识培养研究
(一)研究目的、现状、方法
为发现目前本科专业英语听力中存在的问题,于下学期对辽工大大一三个班进行了问卷调查。结果表明:主要问题在于基础知识的薄弱,语音知识匮乏,导致听力根基不稳。于是,研究采用前后问卷,前后测验和前后期末考试成绩对比法,利用SPSS软件进行数据统计分析,比较语音输入及语音意识培训前后的听力水平差异,发现二者的相关性。课上以新闻和歌曲为听力实践资料分别进行语音意识培训。
(二)研究结果
结果表明,自下而上的词汇语音培训对听力提高最大,自上而下的篇章语用语音培训其次,韵律语音最弱。问卷结果:72人填写问卷,对所采取的教学改革措施满意度比较高(满意和非常满意占83%人,基本满意14人);措施对听力提高的程度比较明显(非常大和较大占63%,一般占38%)。
虽然语音班(3)进步最大,但该班第一学期有一个极端成绩(8分,满分100分),并不能说明语音培训比其它词汇和语篇培训效果更好,表1已经证实这一点了。
四、结论
语音输入和语音意识的培训对听力提高呈正相关。存在的问题:培训不成体系,随机性比较大;课下的学习自主性不够;听力是一个矩阵,并非一个单独因素对听力的提高起作用,因此,有目的有计划的系统而有针对性的培训,元认知策略指导下的自主监控学习和矩阵因素输入都是值得继续研究的课题。
参考文献:
[1]Gardner and MacIntyre;Dorneyi;Ellis;Singleton;Gass.qtd. in Rost,Michael.Teaching and Researching Listening [M].Beijing:Foreign Language Teaching and Research Press,2007:99.语音输入范文第2篇
上世纪90年代以来,基础电脑的各种各样的信息输入工具的开发中,有几家大型IT厂商一直试图将语音识别技术实际应用到医疗现场。其中大半的技术最终因为语音识别率的问题而失败了。但有一家公司“先进媒体”,一直在坚持特定开发高语音识别率的技术,除电子病历系统外,还相继推出了放射科、药剂科等面向医疗行业的“AmiVoice”语音识别系列产品,并且市场占有率正在快速扩大。此次,我们取材自实际使用“AmiVoice”辅助撰写读片报告的顺天堂大学医学院附属练马医院放射科,以验证临床现场的输入设备的有效性。
近年来、随着大中型医院的放射科的影像检查设备的性能提升,每天的拍片数也不断增加,读片医生的报告专业的工作负荷也在每日剧增。并且伴随着医疗影像的胶片减少,通过影像显示器进行判断,读片报告的撰写工具的普及,放射科的读片环境也在发生巨大的改变。
使用电脑工具撰写报告当然是正确的,但相应的这种方法是否能够兼顾“高效率”,对于放射科的医生来说,对于报告撰写工具的效率问题的关注也在不断增加。为了正确且高效的制作读片报告,也有一些医院放射科采用口述录音和语音转换员(听读录音文件,转换为文档的工作人员),可是优秀的语音转换员的培养、留住培养的人才、以及所花费的大量人工成本等,成为科室应用的一个难题。因此,由读片医生自己使用连续语音识别引擎,高效地撰写高质量的工具,在各方面都具备相当的吸引力。
“语音识别”可完成大量工作
顺天堂大学医学部附属医院练马医院放射科的尾崎医生在使用了约8个月语音识别软件后,说道其感受:“在以前工作的医院,因为有优秀的语音转换员,自己基本不用键盘输入撰写报告,加上对语音识别软件性能的怀疑,所以,未曾有过自己亲自使用电脑撰写的想法。后来,来到现在的医院赴任,实际使用软件习惯后,感觉在性能方面基本不逊色于语音转换员。”
医院放射科安排三名全职医生、两名兼职医生的人员编制进行读片。每月超过3000件的报告,采取双重确认管理制度(每份报告需两位医生确认),故尾崎医生每天也需要读片100件以上。医院的电子病历系统的读片报告撰写工具和放射科影像系统诊断报告语音识别系统「AmiVoice Ex Rad是供全院医生使用的。尾崎医生提到:“我不会盲打,使用语音识别只需要花费键盘输入五至十分之一的时间就可以完成一份报告,即使使用键盘熟练的医生,也只需以往一半的时间,从报告撰写的效率性来说,如果没有语音识别软件,每月撰写3000件以上的报告是不可能的”。
基本能正确识别语言的混合表达
在实际的临床现场中是否能使用,以及是否可以极大地提高业务效率,对包括专业术语的连续语音识别率是关键的判断标准。内置专业性强的医疗行业词库,对口音、语调、语速的适应性是为了保持高识别率的必要条件。作为日本的医学用语的特有表达方式,医生之间的会话、病历、读片报告的记录里,日语和英语的混合表达被普遍使用。如果无法很好的进行这类混合表达的语音输入转换,而要进行人工修改,反而减低了业务效率。
尾崎医生说道:“例如,两肺里无tumor和Consolidation(参照图1),不仅有日语的专用词汇,还混合了英语,对于这类医学用语表达如果无法识别转化,作为软件也就没有了使用价值。另外,如果无法识别日式英语发音也是件麻烦事。Amivoice软件的最新版本,已能正确识别这些混合语音。”
AmiVoice软件内置词库,仅单纯X射线/CT/MRI/血管造影/核医学的所见报告的单词就有约3万5千个。并且,英语表达方面,比如“tumor”这个词语、「ちゅもあ「ちゅま「つもる等读法都能登记。不仅能识别英语地道母语发音,对日式发音的识别率也非常高,在某医院的放射科的统计数据表明该软件达到98%的识别率。目前,日本国内已经有660家以上的放射科导入此软件。
尾崎医生补充说道: “屏幕(见图2)话语开始鼻韵音造成“も”字的识别,这些也无需误识别的修正作业,作为助词来处理即可。语音识别的最差情况是――大量读片工作到傍晚,由于疲劳所造成的声调抑扬变化、饶舌等原因使得误识别的增加。”总体来说,尾崎医生给予语音软件“识别率很高”的评价。
预设诊断报告模板,进一步提高效率
为提高撰写报告的效率,使用预定义的模板可以说是最有效的方式。特别是对于无异常患者的报告撰写,这是非常高效有用的方式。可以语音调出预设模板,对显示出来的报告案例,只需语音指示即可快速创建报告。
“我们已经登记了20例报告模板,例如,发出“头部MRI正常”语音指示,调出《头部MRI/MRA检查无异常》的患者检查报告的例文,在此基础上追加所见、删除多余内容来完成报告,比从头开始撰写报告效率要快很多。检查结果,无病变的或手术变化的报告只是简单的将内容修正。像这样的一些报告在撰写时使用模板是非常有效的。”尾崎医生说道。
特别在团体体检的读片报告的撰写时,灵活运用报告模板,可有效提高作业效率。通常,因为团体体检读片时无异常的人很多,为加快速度提前准备好几个读片报告例文,医生将检查结果做个记号,事务人员对应记号输入例文,将检查结果交给体检者。这种情况下,其实只需利用语音识别工具的例文,无需手工作业,即可高效的作出检查报告。
最大程度将精力集中到读片工作中
语音识别工具的最有效的一点是,无论医生是否会盲打,撰写报告时,无需转移视线,可集中精力在影像解读上。因为将视线移到键盘操作或撰写报告画面,很容易导致注意力不集中。语音输入范文第3篇
关键词:SPCE061A;交通灯;语音输入;语音输出
中图分类号:TP368.1 文献标识码:B
文章编号:1004-373X(2009)01-192-03
Design of Traffic Light Countdown Voice Input and Output Based on SPCE061A
YANG Lan,TU Xiaomin,WANG Yufen
(College of Information Science and Engineering,Wuhan University of Science and Technology,Wuhan,430081,China)
Abstract:The designing of voice control system often uses single chip computer and voice processing chip.The shortcoming is the lower cost-effective of voice processing chip and longer development cycle.After an in-depth study on the advan-tages of voice processing of Sunplus SPCE061A,a smart traffic light voice broadcast control system is designed.The system′s design is given and the voice system′s design is focused on.Including the circuit of voice input,voice output and the flow chart of voice input,voice output.
Keywords:SPCE061A;traffic light;voice input;voice output
近年来,随着城市交通的智能化和人性化,语音控制技术在智能交通方面的的应用越来越广泛。其中,最为常见的一类应用是公交车语音报站系统。此类系统多采用单片机和专用的语音处理芯片来进行开发设计,其缺点是语音处理芯片性价比普遍不高,成本较高,且开发周期较长。因此,对于更能体现城市智能交通管理的另一类应用――红绿灯倒计时语音播报系统,则较为少见。基于此,采用凌阳SPCE061A单片机设计了智能交通灯语音播报控制系统。凌阳SPCE061A是凌阳科技公司研发生产的性价比很高的一款16位单片机,不仅具有一般单片机的强大数据处理功能,还具有高质量的语音处理功能[1]。
1 交通灯控制系统方案设计
该设计方案采用一个简易的交通指示灯控制系统来模拟一个典型的十字路口车流通行状态。分别用1,2,3,4(表示东、南、西、北四方向)表明四个流向的主车道,用L,S,R,P分别表示各主车道的左行车道、直行车道、右行车道以及人行横道,其实际路通示意图如图1所示。
通过分析得知,除了四个右行车道外,在同一时间,最多只能有两个车道通行,如1L、1S通行时,其他车道都会被阻断。所以在设计红绿灯时,可以两两组合,共有4组(如lL-1S,2L-2S,3L-3S,4L-4S)。
交通灯控制系统由一套SPCE061A精简开发板(简称61板)和一套交通灯模组构成[1]。交通灯模组包括1块驱动电路板、4个2位倒计时LED数码管模块、红绿灯LED模块。
系统有两个工作状态,正常工作状态和通行时间设置状态。SPCE061A是整个系统的核心控制部件,61板上有3个按键Key1~Key3。两个状态间的切换是利用Key1键完成的。在通行时间设置状态,按下Key1键开始设置南北向红灯时间,按下Key2键开始设置南北向绿灯时间,按下Key3键则返回正常工作状态。红绿灯换色显示时有语音提示,具体为:东西向绿灯黄灯,语音提示:东西向开始红灯;东西向黄灯红灯,语音提示:30,29,…,0(程序设置通行时间为30 s,可以修改);东西向红灯结束之前,南北向绿灯黄灯时,有语音提示:南北向开始红灯。南北向黄灯红灯,语音提示:30,29,…,0。
系统设计框图如2所示。
2 系统语音设计
2.1 音频算法概述
语音处理大致可以分为 A/D采样输入、编码处理、存储、解码处理以及 D/A等。SPCE061A拥有强大的语音处理功能,它对上述语音处理流程的解决方案是:将 A/D、编码算法、解码算法、存储及 D/A作成相应的模块,对于每个模块都有其应用程序接口 API,用户只需了解每个模块所要实现的功能及其参数的内容,然后调用该 API 函数即可实现语音处理功能[2]。
凌阳将音频压缩算法封装在SACM-lib库中,API函数名称及算法类型如表1所示 \。
三种放音压缩算法的音质排序为:A2000>S480>S240。
2.2 语音输入设计
语音输入的基本原理是通过A/D转换器将语音信号转换成数字信号,编码后存入指定的存储器中。SPCE061A的A/D转换器共有8个通道,其中有一个通道是MIC-IN输入,它专门用于对语音信号进行采样。然后将采样信号转换成电信号,输入至SPCE061A的内部前置放大电路。语音输入功能主要是调用SACM_DVR模块实现的,因此音频信号的采样频率是8 kHz,且按照SACM_A2000算法进行压缩编码,每秒占用的存储空间为16 Kb/s,产生的语音数据存放在扩展SRAM HM
图3中:SPCE061A引脚MICP(33脚)为MIC(麦克风)的正向输入脚;MICN(28脚)为MIC的负向输入脚。
语音输入流程图如图4所示。
软件设计主要调用的API函数如下:
int SACM_DVR_Initial(0);//初始化为手动方式
SACM_DVR_InitEncoder(RceMonitorOff);//初始化解码器
void SACM_DVR_Encode();//获取数据并编码
void SACM_DVR_TestQueue();//获取语音队列状态
int SACM_DVR_FetchQueue();//获取编码数据
void SACM_DVR_Stop();//停止录音
2.3 语音输出设计
语音输出的基本原理是将外扩SRAM HM
图5中:SPCE061A引脚DAC1(21脚)为音频输出通道1。
语音输出流程图如图6所示。
软件设计主要调用的API函数如下:
void SACM_DVR_InitDecoder(DAC1);//从DAC1通道开始解码
void SACM_DVR_TestQueue();//获取语音队列状态
void SACM_DVR_FillQueue(int );//填充资料到语音队列,等待放音
SACM_DVR_StopDecoder();//停止解码
void SACM_DVR_Decode();//获取语音数据并译码,中断播放
3 结 语
由于语音播报内容需人为录入,且播报时间需和倒计时时间保持一致,因此在语音输入过程中需精确掌握播报时间,以便顺利完成系统调试和运行。经过多次软、硬件调试、修正,交通灯倒计时语音播报系统能够完成既定功能,且在实验室环境下放音效果良好。
在此充分挖掘并利用了凌阳SPCE061A在语音处理方面的优势,完成了上述倒计时语音播报系统的设计。考虑到实际交通环境下声音嘈杂,可能会影响放音效果,因此,若需实际使用,需修改语音输出电路,加大语音输出功率。
参考文献
[1]罗亚飞.凌阳16位单片机应用基础[M].北京:北京航空航天大学出版社,2003.
[2]杜刚.16位单片机原理及应用(凌阳系列)[M].北京:中国电力出版社,2007.
[3]陈开,杨岚.基于SPCE061的语音提示交通灯控制系统的设计[J].现代电子技术,2008,31(2):4-6.
[4]黄涛,胡宾.基于SPCE061A单片机的非特定人语音识别设计[J].微计算机信息,2006,22(32):19-20.
[5]文环明,张艳.基于SPCE061A的电子语音播报称重系统[J].电脑开发与应用,2007(12):37-39.
[6]陈娟.SPCE061A单片机的髋作用力测试仪设计[J].国外电子元器件,2006(8):41-43.语音输入范文第4篇今天因为临时需要用另外一台手机来输入一些内容,发现手机上还没有合用的输入法,就下载了一个新的输入法,这样语音输入也更便捷一些。
其实自己接触语音输入也算是比较早的吧,大概就是2000年前后的时候,家里面的电脑就已经尝试用了,语音输入法,但是那个时候可能受到电脑内存的限制,计算的能力有限,语音的输入都不是很准确,当时手机上也有一些语音输入的功能比语音拨号这一类的也是挺有意思的。就是问题也是在中文输入的时候,没有那么准确,很有意思的是英文输入更准确,所以当时自己基本上都在用的是英文输入。
这个输入法不一样,所以说功能键的触发位置也不一样,像这次下载的,这个就需要按一下空格键,之后再去激活它,其实也还算是比较方便的, 下载新的输入法,整体的用户体验还是不错的,但是有一点就属于一个缺陷,我在语音输入的时候稍微的过了一段时间之后,屏幕自动熄屏,休眠的时候也还要继续,就是直接停止了语音。
云服务,我云服务改成语音输入还有一个很大的好处,就是在输入的过程当中可以暂时不去看屏幕,这样对于眼睛的负担也会小些,就避免了长时间看屏幕带来的各种各样的问题。
体制的问题,它不会传染的。科技的进步确实带给我们很多便利和优势,像以前那些笔耕不缀的人,在写字的时候,甚至会磨破手指,而现在随着这种垫子输入方式的逐渐普及,内容生产就变得越来越容易了。语音输入范文第5篇输入法,相信大家都不陌生。是的,我们每个手机每个电脑上都有输入法。它让我们打字轻松,让语言多功能,可以把中翻英,甚至还可以把语音转化成文字,这样下来打字就快多了。
一般来说,语音输入法的确是个好东西,解决了生活中不少的麻烦,也给我们节约了很多时间。可是看新闻报道显示现在出来的大学生,居然连中文有些简单的中文字都不会写!怎么可能呢,我们现在这一代人天天玩手机玩电脑,享受高科技,怎么还不会写字?不得不说语音输入法还是有很重要的一部分责任的,由于语音输入法,现在拼音也荒废了。
语音输入法,究竟是福是祸?我们自己也不清楚,每样东西都有自己的优点与缺点,主要是看你如何使用。就像我自己,现在每写一篇作文都是用语音输入法。一开始,我还为自己发现这而欣喜若狂,可后面我就渐渐不太高兴了,有些输入出来的字往往全部都是错的,我还要改上半天。打了半天以后,不小心往周边一按,一下子都把刚刚辛辛苦苦写的删了。气的我差点把手机砸出去。可这时妈妈往往都对我说,你现在讨厌语音输入法了,可你当初打字的时候,你怎么又觉得语音输入法好呢?
是啊,现在想想,突然发现自己很不知足。本来要打好久的字,它帮我解决了,而我却责怪它。我不由得想到关于考试的新奇事件。如果你曾经是一个好学生,你考差了,那么你面对的将是大人严厉的惩罚,可如果你曾经是一个差生,考的稍微好一点儿,大人都会十分开心的来表扬你如果你生病了,大人肯定会细心的陪在你身边哄你或者是对你很好,可是呢,我们平常没有生病的时候比这情况还有好的时候,为什么却什么也没得到呢?
贪婪,是人之本性,我告诫自己,不要太贪心了,不要让贪婪蒙住自己原本的心!语音输入范文第6篇
当然不用。听说科大讯飞公司最近推出的《讯飞输入法》PC体验版(以下简称“讯飞”)主打的“手写输入”功能,就能够很好地利用笔记本触摸板实现手写输入,果断带老爸试试!
首先,将讯飞下载安装至电脑(下载地址:http://ime.voicecloud. cn,软件大小为29.2MB)。讯飞默认的输入方式是键盘输入,使用起来和其他输入法并无二致,无需赘述。
既然我们是冲着讯飞的“手写输入”功能来的,那立马点击其右下状态栏的“手写”按钮进入该功能吧!这时,讯飞会自动对笔记本电脑的触摸板进行检测。如若可用,软件将会进入触摸板手写模式,否则只能进入鼠标手写模式(注:讯飞对部分笔记本电脑触摸板的识别存在问题,遇到类似现象的用户请更新触摸板的驱动程序)。点击手写区域窗口右上的三角按钮,我们还可以对“手写输入”功能进行相关的设置,在二级菜单列表中选择是否开启“叠写”功能(如图1)。
“老爸,”我笑着对他说道,“现在试试?”老爸开始在触摸板写起来。随着输入的速度越来越快,他的脸上也露出了满意的神色:“嗯,不错!而且不用写完一个字先得等上老半天(如图2)。”这里,不得不赞一下讯飞的这个“叠写”功能—无需停顿即可在同一位置连续写多个字,极大提高了手写输入的效率。
给力的PC语音输入
讯飞的“语音输入”功能也将其在移动设备上的良好表现沿袭到了PC端。点击状态栏的“麦克风”按钮,按照软件提示进行校准之后我们就可使用“语音输入”功能。这时,屏幕上会多出一个“语音输入”的标识栏(如图3),这也意味着我们的双手可以离开键盘了。
“昨天给老爸买这个……”我随意地念着,而电脑屏幕上则同步出现着:“昨天给老爸……”老爸在一旁看着,也赞叹道:“懒得写字的时候,靠说话来输入也挺方便的嘛!”值得一提的是,在使用“语音输入”功能的时候,讯飞还会自动输入标点进行断句。除了依靠我们说话的停顿来判定,我想,其云识别技术也在背后发挥了很大作用。语音输入范文第7篇
关键词:Windows;语音助手;C#;XML
中图分类号:TP391.42 文献标识码:A 文章编号:1007-9599 (2012) 11-0000-02
目前专门针对于老年人的计算机软件还是很少,特别是忽略了老年人使用计算机的渴望。他们不能独立使用计算机,这就极大的影响了老年人的生活质量。但是,老年人迫切希望学会使用计算机,计算机会对他们的生活产生很多很大的便利,提高更好的晚年生活质量问题被提上了日程。随着社会老龄化的发展,老年人的市场变得无比巨大,已经有不少软件企业瞄准了这个新兴的市场。语音软件助手的开发能够帮助老年人方便使用计算机。
一、开发环境
Visual Studio 2008是微软公司推出的开发环境,Visual Studio可以用来创建Windows平台下的Windows应用程序和网络应用程序,也可以用来创建网络服务、智能设备应用程序和Office插件。数据库XML即可扩展标记语言,它与HTML一样,都是SGML,标准通用标记语言)。XML是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。
二、Windows语音助手功能
Windows语音助手由四个主功能模块构成。语音助手可以帮助用户使用语音进行Windows的常规操作。
(一)语音识别模块 利用语音识别引擎实现对语音的识别,从而对语音指令做出相应的操作。程序内置了Windows的常用命令,用户也可以根据自身需求增加、查看、删除命令。另外本模块还提供了语音训练和语音选项。帮助计算机更好的识别用户的声音。
(二)语音阅读模块 利用语音识别引擎实现Text To Speech(将文本转化为语音)功能,即将文本转化为音频资料。你可以随意打开系统内的text文本,也可以向文本框中输入文本。系统将会根据用户提供的文本进行朗读,在朗读过程中还可以进行语音和音速的改变。还可以将text文本转化为wav文件。
(三)语音输入模块 利用语音识别引擎实现Speech To Text(将语音转化为文本)功能。即实现语音输入,将用户的声音转变为文本。可以帮助不会拼音和汉字的用户完成文本的输入。
三、Windows语音助手详细设计
语音识别功能 语音识别功能可以识别用户的语音指令,并让计算机执行用户的指令。
(一)语音识别引擎 可以通过单击窗体右下角的喇叭图标使斜杠消失,这时语音引擎会打开。语音引擎打开时小精灵会有提示,这时你就可以通过麦克风控制电脑了。
(二)指令的添加,查看与删除 可在窗口的名称,路径,类型中输入相应数据单击添加按钮,实现命令的添加,程序路径的添加可通过点击路径输入旁的圆形按钮,在系统中找到程序的主执行程序。可以单击已存在的指令查看指令信息,及正确格式。单击选中已存在的指令单击删除按键删除指令。
(三)语音训练与语音选项 单击窗体右边的语音训练按键,可打开语音训练窗口,只有经常进行训练才能实现语音的高识别率。单击窗体右面的语音选项可以打开语音选项界面。当打开程序时要保证语音属性中的语音识别选项卡中的语言选项选中Microsoft Simplified Chinese Recognizer V5.1,这样引擎才会识别中文。
语音阅读功能 点击主窗体上的语音阅读与输入按键可打开语音阅读与输入界面。
1.阅读文本的载入
当要使用阅读文本功能时,可以手工输入要阅读的文本或点击打开按键导入系统中已存在的文本。
2.语音阅读功能
1)朗读:开始对文本进行朗读。2)暂停:暂停对文本的朗读,点击继续可继续当前的朗读。3)停止:停止当前的朗读,开始点退回文本开头。4)保存为wav文件:可将文本文件保存为wav格式的音频文件。5)清空内容:清空阅读框中的内容。
3.语音阅读操作
1)语音选择:实现对发音语言的选择。2)音量:调节音量。3)音速:调节音速。
语音输入功能 通过点击语音输入按钮可以实现语音输入功能。语音输入功能可以实现语音到文本的转化。
四、系统测试
测试是软件开发的重要环节之一。按照软件开发的过程测试可分为:单元测试、集成测试等。单元测试的目的在于发现各模块内部可能存在的各种差错。单元测试又称模块测试、逻辑测试或结构测试。测试的方法一般采用白盒法,以路径覆盖为最佳准则,且系统内多个模块可以并行地进行测试。集成测试也称组装测试,综合测试或联合测试。集成测试是按设计要求把通过单元测试的各个模块组装在一起以后进行测试,以便发现与接口有关的各种错误。在进行集成测试时,常需要考虑的有关问题有:数据经过接口是否会丢失;一个模块对另一个模块是否造成不应有的影响;几个子功能组合起来能否实现主功能;误差不断积累是否达到不可接受的程度;全局数据结构是否有问题。经严格测试,系统总体功能达到了设计要求,能够实现语音识别,语音阅读,语音输入和扩展模块。
五、结论
本文提出了开发利用语音助手帮助老年人方便使用计算机的思想。在此思想的基础上设计并开发了基于Speech SDK的Windows语音助手。系统功能总体达到了设计需求,已经能够实现语音识别,语音阅读,语音输入和扩展模块。语音助手能够方便老年人使用电脑,帮助提高老年人熟练地运用电脑进行生活和娱乐。
参考文献:
[1]沃森,内格尔.C#入门经典[M].北京:清华大学出版社,2010.1-199.
[2]王小科,王军.C#开发实战1200例[M].北京:清华大学出版社,2011.65-234.
[3]内格尔.C#高级编程[M].北京:清华大学出版社,2008.107-348.语音输入范文第8篇
1 垃圾清了 “组织失联”怎么办
有的朋友的手机使用越来越慢,平时主要是用微信,发现原来是微信产生的垃圾惹的祸。于是通过“我设置聊天”的操作路径,找到“清空聊天记录”选项,清空了微信聊天信息(图1)。但是,清理完微信垃圾后发现,原来和好友聊天的几个群不见了,找不到群的入口,也就不知该如何向群内发送信息了。
其实,发生这种情况的原因,是当初没有将群保存到通讯录所致。找回的方法:可让别人在该群里任发一条消息,之后您只需点击收到的群消息,进入该群的聊天窗口,点击窗口右上角的双人头像(图2),进入“聊天信息”窗口后,向下拖动列表,直至看到“保存到通讯录”选项,将该选项置于打开状态(绿色显示)(图3)。这样,今后清空微信记录之后,还可以通过“通讯录群聊”,看到之前保存的群名称,从这里找到“组织”。
还有一个清理聊天记录的方法,是从具体的群中进行。从这里清空记录,但该群名称不会丢失。在进入某群之后,点击右上角双人头像,进入群友列表,然后拖动到最底部,可见“清空聊天记录”一项,点击该项即可清空该群聊天记录。若要删除该群,则点击最下端的“删除并退出”按钮即可(图4)。如果进行了误操作而删除了该项,也会出现上述找不到“组织”的情况。
2 寻找消失的语音输入和视频聊天
微信的语音输入功能不同于语音聊天,语音输入可以将您的发言转换为文字,发送给对方,非常适合于对方要求安静的场合。按照常规,点击消息发送栏右侧的+号按钮,选择“语音输入”或“视频聊天”按钮,即可进行语音输入或视频聊天(图5)。但是,有时您可能会发现找不到语音输入或视频聊天按钮的情况。该怎么办?
点击“我设置”,然后在设置窗口中点选“通用”选项(图6),在“通用”选项窗口中点选“功能”选项(图7)。
在“功能”列表中,您会看到“视频聊天”和“语音输入”的项目,点选这两个项目,添加开启功能后,语音输入或视频聊天的按钮就会在输入选择面板中出现(图8)。
3 找到并藏起重要的图片与音视频
在聊微信的过程中,您会收到许多图片、视频或音乐等。过后,您可能还需要其中的某些媒体文件。那么这些文件保存在哪里?如何找到它们?同时,这些文件很容易会随着清理微信缓冲一同被删除,又如何将它们转移到一个安全的地方?
打开手机文件资源管理器,定位到内部存储卡或SD存储卡的“\tencent\MicroMsg\Weixin”文件夹,在其中就可以看到聊天过程中保存下来的图片和视频文件。按照其中文件后面的日期信息和文件缩略图,可轻松判断您所需的图片或视频。长按并选择自己需要的文件,然后点击上方工具栏上的复制按钮;返回到存储卡自建一个收藏文件夹,点击粘贴,就可以将图片或视频复制到自定义的专用文件夹中收藏了(图9)。
孝道提示
在聊天过程中,对于有收藏价值的图片或视频,都可以在长按对话框中的图片或视频后,选择弹出菜单中的“保存到手机”,留存在手机中(图10)。保存后的图片或视频文件一般也可以通过手机相册中的Winxin子文件夹查看到。如果您在使用手机助手软件来管理手机,那么其自带的“导出微信小视频”功能可以很方便地将手机中聊微信时涉及到的小视频拷贝到电脑中(图11)。
4 聊天背景如何才能按需实现DIY
每天使用微信,老面对着一个白底黑字的微信窗口,晃眼不说,时间长了也可能心生腻歪。那么,如果我们对微信聊天窗口背景不满意,是否可自行设置?如何设置?
点击“我设置聊天”,进入聊天设置窗口,点击“聊天背景”(图12)。语音输入范文第9篇
关键词: 听力 言语理解 模仿 第二语言习得
一、引言
第二语言学习者普遍存在着发音不准确的问题,能够接近母语者水平的实属凤毛麟角。
与之相对应的是第二语言学习者的听力理解能力较之其他能力,包括阅读和口语能力,相对偏低,学生往往难以理解声音材料,视听力课为畏途。
一些教师对听力课性质理解不透彻,听力课上常常采用“放录音―对答案―再放录音”的简单机械模式,导致课堂气氛沉闷枯燥,学生缺乏兴趣。有些教师看到这种测试性听力课的不足,力图改变,采取先讲解、领说、操练生词与课文以降低听力难度,最后再听几遍录音的方法,虽然课堂气氛有所改变,却失去了听力课的课型特点,有违设立听力课的初衷。
二、对听力课性质的认识及其问题
上面提到的三个问题其实是同一个根本性问题在三个不同侧面的具体表现。这个根本性的问题就是对初级阶段听力课性质的理解。
王钟华等(1999)将初级阶段听力课的性质定义为“提高学生听音理解能力的训练课”,而“听音理解就是根据声音来建立意义,理解的过程就是意义建立的过程”。听力课的目标是“培养学生在言语交际中听音理解的能力”。
这一认识有其合理性,但也存在可置疑之处。
首先,学习者的听力问题究竟是否听音理解问题。从心理学的角度讲,言语理解可以分为知觉分析和句法意义加工两个阶段。学习者对听力材料的理解是从辨音开始的,即首先对听觉模式进行识别。“模式识别过程是感觉信息与长时记忆中的有关信息进行比较,再决定它与哪个长时记忆中的项目有着最佳匹配的过程”(王等,1992)。学习者能否识别一个词语或句子,取决于他所听到的语音与长时记忆中的信息能否正确匹配。听力课强调听音理解,实质上是基于“学习者长时记忆中已有相关语音项目”的假设。然而在听力课之外,学习者又从何处获得这些语音项目呢?唯一较稳定的输入来源只能是综合课。那么综合课上是否能够提供充足的语音输入,足以帮助学习者在长时记忆中建立正确的语音表征呢?答案无疑是否定的。从实际情况来看,一个综合课的教师要面对十几甚至几十个学生,一堂课要进行语音、词汇、语法、课文、练习等多方面的内容,教师提供的语音输入真正平均到每个学生身上实在少得可怜,远远不足以形成正确的语音表征。因此我们可以说在学生的长时记忆之中其实往往是不存在第二语言的正确语音表征的。
在正确的辨音之后,能否理解便取决于句法语义加工。通常的听力课仍然是建立在“学习者长时记忆中已存在相应词汇和语法项目”的假设之上的,也就意味着听力课上不应出现或尽可能少出现新的词汇和语法项目,但事实却并非如此,几乎所有听力教材每篇课文都有生词和新的语法项目。可以说出发点与现实的做法是矛盾的。我们的疑问是,学习新词和新的语法项目是听力课应该或者必须承担的任务吗?这些任务放在其他课型上(如综合课)是否更好?综合、听力、口语、阅读、写作等各课型的明确分工到底是什么?恐怕这个看似简单的问题其实许多人还不是很清楚。
这种出发点与操作方法的矛盾在听力课上演变成为现实问题。有些教师把听力课上成了放录音对答案的测试课,使课堂沉闷压抑,枯燥乏味,有些教师则矫枉过正,将听力课上成了综合课或口语课,其实是从根本上否定了听力课存在的必要。
这种模式的第二个问题是:只是听音理解是否足以引发习得,是否能够帮助学生建构第二语言系统?
学习者本能地对语言输入进行解码,发现意义,以实现成功交流,但是从意义加工中吸收的信息不等于或者说达不到习得所需的信息。输入加工理论认为,学习者的输入加工重视意义甚于形式,有意识注意的地位不及无意识注意。Van Patten(1995)指出,只有对输入的有意识注意才有助于习得,“仅凭潜意识感知是无法学习外语的”。形式与意义争夺认知资源,学习者总是首先去发现输入中包含的信息,而非信息的编码方式。教师必须引导学生重视语言的形式,而不能只停留于理解层面。
Swain(1985)关于一个浸入式法语项目的研究显示,仅仅通过交际性可理解输入,可以使学习者在理解方面达到接近母语者的水平,但其产出的流利度和准确度则远远落后于母语者。这一研究表明,仅凭可理解性输入,并不必然导致习得。如今,理解性加工与习得加工之间的区别已经成了第二语言习得研究界的一个广泛接受的概念。
三、对听力课性质的再认识
我们认为,听力课的性质是为学生提供可理解性语音输入,通过学生的口头模仿、复述发音器官的运动,在学习者的大脑中建立正确的语音表征,形成语言输出的肌动程序,促进第二语言发展。
首先,听力课是语音输入课,是学生正确的第二语言语音示范的主要来源。
输入是习得语言的必要条件。输入主要包括视觉输入和听觉输入两种。人类在习得第一语言时,听觉输入占主要地位。从人类整体来看,书面语的产生远远晚于口语。从人类个体来看,人们总是先学会听说,然后才学会读写。一个人不懂书写形式并不妨碍其口头的交流。某些残障儿童无法学会语言,就是因为不能获得必要的语音输入。
但第二语言习得则不同,大多数学习者都是视觉输入和听觉输入同时开始的,并且视觉输入往往占了主要地位,而听觉输入则相对不足。第二语言学习者往往难以从周围环境中获得目的语输入,输入来源主要依靠课堂教学。因此我们必须充分发挥听力课的作用,改变听力课的性质是提高听音理解能力的认识,将听力课重新定义为为学生提供语音输入的输入课,为学生提供丰富、充足、多样的语音输入,为他们的口头模仿提供样例,帮助学生了解目的语的语音范畴,形成正确的语音表征。
其次,听力课是口头模仿课。学生在听取录音文本,了解目的语语音特性的同时,还要同时进行口头模仿,多次复述,主动建构。Stern 认为,语言学习主要是模仿,应该像儿童那样模仿一切。言语知觉的肌动理论认为,听话者听到说话人发什么音,是因为他知道说话人的发音方式,当他看到说话人发出语音的口形,由于知道自身做出同样口形时会发出什么音,从而知道说话人发出的是什么音。研究显示,言语知觉与语言输出密切相关,言语的知觉表征存储在记忆当中,引导言语肌动程序的发展,二者紧密联系,共同登记。通过发音器官的运动,模仿母语者的发音,学习者可以了解目的语发音部位和发音方法,经过反复的模仿练习,逐渐形成肌动程序,从而提高口头表达能力和听音理解能力。
模仿是言语存在的一个必要过程。人类语言是基于词汇的交流形式,如果儿童不能迅速掌握词汇,语言将无法存在。而儿童学习词汇需要直接模仿。研究表明,24个月大的婴儿说出的词语中至少有5%到45%是通过模仿学会的;13个月大的模仿新词语的孩子,在4个月后学会名词的数量更多,8个月后学会非名词的数量更多;用来预测年龄稍长孩子词汇学习能力的一个主要指标就是他们复述非词语性音素串的能力。语言习得方面存在的问题往往与口头模仿损害有关,在牙牙学语期做气管开口手术的婴儿,其语言能力的发展会出现明显滞后。除了帮助词汇习得外,模仿可以帮助儿童说出超出他们当前能力的长句子来,如果不是通过模仿,仅凭他们本身的能力是说不出这样的句子的;儿童可以通过复述先前听到的短语和句子来分析语言规则和句型。可见,模仿在儿童习得第一语言过程中发挥着重要作用。成人学习第二语言与儿童习得第一语言虽然有所区别,但是,正如Lakoff指出的,尽管人们的概念系统不尽相同,但其概念化能力(Lakoff将认知机制称为概念化能力)却是一致的(转引自Gragera 2005)。意义法(meaningful approach)在成人和儿童当中都获得了成功,表明儿童和成人的认知机制是相同的,儿童使用的认知机制也适用于成人(Gragera 2005)。因此成人在学习第二语言时,也应充分利用模仿这一方法。
学习第二语言时使用的模仿不是一两次的重复,而是多次复述,而复述本身也是信息在短时记忆中保持并进而进入长时记忆的重要手段。通过大量的模仿和复述,学习者不仅可以熟练掌握发音部位和发音方法,在大脑中形成第二语言的肌动程序,也可以复习巩固学过的第二语言知识,帮助这些知识进入学习者的长时记忆。
四、结论
第二语言学习者发音不准,实际上是由于缺少足够的语音输入,没有依照正确的听觉输入进行大量的口头模仿,学习者的大脑中没有形成正确的第二语言语音表征所导致的。而按照言语知觉理论,言语产出与言语感知是密切相关的,不能正确地发音又反过来影响了学习者的听力理解能力,形成恶性循环。要改变这一情况,必须改变传统的对听力课性质的认识,将听力课真正作为语音输入课和练习模仿课,让学习者主动学习,反复建构,才能不断提高他们的第二语言能力。
参考文献:
[1]李晓琪.对外汉语听力教学研究.商务印书馆,2006.
[2]李雁冰.简论教学模式.山东教育科研,1994,(3).
[3]王,汪安圣.认知心理学.北京大学出版社,1992.
[4]王钟华.对外汉语教学初级阶段课程规范.北京语言文化大学出版社,1999.
[5]张宝林.对外汉语语法知识课教学的新模式.语言教学与研究,2008,(3).
[6]Gragera,A Input Processing Revisited.Academic Exchange Quarterly,June,2005.
[7]Stern,H.H.Fundamental concepts of language teaching.Toronto:OISE,1970.
[8]Sun Y.A.Input Processing in Second Language Acquisition:A Discussion of Four Input Processing Models,TESOL & Applied Linguistics,Vol.8,No.1,2008.
[9]Swain,municative competence:Some roles of comprehensible input and comprehensible output in its development.In S.M.Gass&C.G.Madden(Eds.),Input in second language acquisition.Rowley,MA:Newbury House,1985:235-253.语音输入范文第10篇
参加本次语音功能测试的浏览器分别为:
UC浏览器8.2 For Android
百度手机浏览器Android Beta3
海豚浏览器Android版
手机QQ浏览器2.9.1For Android语音内测版
评测环境:由于移动联通的上网速度较慢和不稳定,因此测试所用的网络为稳定的2M宽带WiFi网络。测试手机平台为小米手机,手机系统为Android2.3.5。
一、浏览器语音功能测试
首先,我们对这几款都自称支持语音的手机浏览器进行了功能对比测试,看看他们分别都支持哪些语音功能,是否真正做到了对语音的全面支持,只要用语音就能轻松完成大部分的浏览器操作。
从测试结果来看,除了UC浏览器能够实现语音控制浏览器操作和语音控制打开网页、语音控制输入;手机QQ浏览器推出的语音内测版能够支持语音控制浏览器操作和部分支持语音控制打开网页,不支持语音输入之外;其他两家浏览器均不能实现语音控制浏览器操作、语音控制打开网页和语音输入,仅能支持语音搜索功能。现在UC浏览器在语音功能的支持完整度上,更胜一筹。
二、语音识别能力测试
一款软件语音功能中很重要的两点,就是它的语音识别准确率和语音识别速度,如果不能够又快又好地识别使用者的语音,那一切就都是浮云。因为四款浏览器都支持语音搜索,因此我们针对语音搜索,使用各个浏览器的默认搜索引擎,用大家较常搜索的中文、英文、阿拉伯数字混合词语“淘宝iPhone4”,以及几个常用网站为例,对这四款国产浏览器的语音识别度进行了逐一的测试。
经过测试我们发现,在这个环节中表现最好的还是UC浏览器,不仅小编说出来的中英文单词和阿拉伯数字都能识别,并且当小编以较快的语速说出网站名称时,仍可以轻松识别,同时会直接打开淘宝网的iPhone4搜索结果页面;手机QQ浏览器能够识别中英文,但是进入的是搜搜的搜索结果页,而不会像UC那样直接匹配进入淘宝网;百度浏览器的识别度也不错,识别较快语速的能力也比较高,但百度浏览器仅能识别中文,因此搜索结果就变成了淘宝爱疯4;海豚浏览器对于英文的识别度比较高,但中文小编必须用很慢的语速说出来才能够识别。
另外值得一提的是,由于UC浏览器在后台采用了指令匹配,当小编说出淘宝、新浪等指令匹配的网站时,UC浏览器就会直接打开这些网站,而当指令不匹配时,浏览器也会将结果进行百度搜索处理。手机QQ浏览器的语音内测版也部分支持这一功能,比如语音指令为“淘宝”时可以打开淘宝网,但语音指令如果稍微复杂比如“淘宝iPhone4”,便会进入搜索页面。而其它两个浏览器则不支持指令匹配直接打开网站,只是将语音指令进行搜索处理,再点击才能打开网站,操作简易性有待提高。
三、浏览器使用体验测试
一款浏览器的好与不好,用户的使用体验是最直接的感受。能不能给予用户最好的使用体验,是每一个用户选择浏览器最直观的因素。在本环节,小编对这四款浏览器语音功能的使用体验也进行了对比,从而找到最为优异的那一款。
在这个环节的测试中,UC浏览器不但在任意输入和搜索框的右侧都能看见语音按钮,同时,将菜单栏向右滑动,也能调出语音功能,可谓面面俱到;百度浏览器则需要在插件库中长按语音浏览图标并拖动到主页才能够实现语音搜索功能,操作较为繁琐;而海豚浏览器和手机QQ浏览器则都需要点击输入框或长按菜单栏才会弹出语音功能按钮。
四、浏览器语音控制及语音输入功能测试
由于只有UC浏览器和手机QQ浏览器支持语音控制浏览器操作,只有UC浏览器支持语音输入,这一项我们就测试UC浏览器和手机QQ浏览器对于语音控制浏览器操作和语音输入的准确性。
经过测试发现,UC浏览器不但可以接受小编通过语音发出的多种控制指令,包括前进后退以及加入书签、全屏、夜间模式等系统菜单第一层级的指令均可使用语音控制打开,手机QQ浏览器可以实现对加入书签、夜间模式等系统菜单指令的语音控制,但是“设置”这样的指令则无法识别。
同时,在论坛、新浪微博等需要发表帖子、微博的网站,UC浏览器也能通过语音进行文字输入。这种独特的使用纯语音进行控制和输入的方式,体验新颖,操作简单,同时还可以和传统输入混合使用互不干扰,大大提升了输入效率和浏览器操作体验,但很遗憾,内测中的QQ手机浏览器暂时还没有这一功能,期待正式版改进。
但是同时语音的输入还存在缺憾,表现在小编如果需要输入一段比较长的文字时,语音的识别准确率就会大大降低,这点尚待进一步提高。

产品特性AI音控鼠标按键数6个产品尺寸109.7* 65.2*39mm?工作方式语音操控光学分辨率1600DPL加印LOGO支持类型光电 AI语音控制品牌康佳适用对象笔记本台式线长无线型号X66颜色黑 黄产品重量80g上市时间2020.03售后服务1年滚轮数1无线技术10M最快出货时间1-2是否支持一件代发支持发票支持鼠标大小109.7* 65.2*39mm?是否支持即插即用支持是否支持人体工程学支持
展开
供应商信息
深圳市希迈科科技有限公司
进入公司首页
公司产品方向:AI智能平板电脑,AI智能英语学习机,AR智能健身一体机,
主要产品方向:K12智能教育客厅学习机,AI智能平板电脑学习机,AI智能无线语音鼠标、AI智能无键盘办公类产品及AI智能教育机器人等。
查看更多 >
企业类型
有限责任公司(法人独资)
统一社会信用代码
91440300561533798D
成立日期
2010-09-17
法定代表人/负责人
郭兆泉
注册资本
2,000万(元)
注册地址
深圳市光明区新湖街道楼村社区第一工业区大坡河1号2层B区
营业期限
2010-09-17 至 5000-01-01
登记机关
光明局
经营范围
一般经营项目是:国内贸易、进出口业务,企业管理咨询、投资信息咨询、商务信息咨询(以上均不含限制项目)、市场营销策划、投资项目策划、品牌形象策划、企业形象策划。第二类医疗器械的销售(备案后方可经营) 。集成电路设备新工艺、新技术的研究开发、技术转让、技术服务、技术咨询及相关加工系统的研究开发;(不含国家政策规定的专营、专控项目),经营和代理各类商品及技术的进出口业务。,许可经营项目是:大屏显示产品、室内及户外广告机、液晶屏、液晶显示器、液晶模组、触控显示终端、互动电子显示产品、网络控制器、网络播放器、商显集控系统及应用软件、其他智能显示设备、产品及配件的研发、制造、销售、安装及售后服务。彩色液晶电视机、液晶模组、液晶显示器、广告机、数字网络显示器、LED背光源产品、平板电脑的生产;第二类医疗器械的生产。
数据来源联系方式

我要回帖

更多关于 qq语音自由麦改按键 的文章

 

随机推荐