最新保证怎么关掉手机语音助手手怎么不能从屏幕下方打开了

奇点机智联合创始人林德康:前Google高级管理科学家(senior staff research scientist)主攻自然语言处理。在加入Google之前林德康是加拿大Alberta大学计算机教授,发表过逾90篇论文、被引用超过12000次他也是华人圈少数几个国际计算语言学会ACL Fellow之一。

雷锋网按:距离苹果Siri的推出已经快6年了期间很多智能手机厂商也纷纷将怎么关掉手机语音助手手列為卖点之一,但是其使用率一直不高究其原因,还是怎么关掉手机语音助手手的功能有限不过随着深度学习带来的技术进展,以及亚馬逊的Alexa的大获成功智能怎么关掉手机语音助手手获得了前所未有的关注,很多人都认为语音将是下一个流量入口。

上周乐视推出了帶有智能怎么关掉手机语音助手手的手机,这款手机搭载的怎么关掉手机语音助手手就是去年雷锋网(公众号:雷锋网)曾报道过的创业公司渏点机智的产品——“小不点”对此,雷锋网对奇点机智联合创始人林德康进行了专访

奇点机智成立于2014年11月,两位创始人邬霄云和林德康曾在谷歌工作并且在自然语言处理方面都有着深厚的技术和经验积累。该公司曾先后入驻微软创投加速器(MVA)第六期、以及TechCode孵化器至于为何会选择做怎么关掉手机语音助手手?林德康表示最主要的目的并不是因为门槛的降低,而是因为怎么关掉手机语音助手手确實有用

虽然都是怎么关掉手机语音助手手,但是“小不点”和苹果的Siri、微软的Cortana等不同传统怎么关掉手机语音助手手除了能够执行系统級别的功能,比如设置闹钟、打电话等功能十分有限,更像是一个“搜索引擎”;“小不点”则抛弃了业界流行的单独的语音对话界面转而帮助用户用语音来更便捷地操作手机里的各种APP,比如发微信红包、打车、定外卖等更像是一个“动作引擎”。

因此使用小不点嘚用户虽然是用语音在与手机交互,但是同时也在与手机的图形界面进行交互这就是林德康提到的CGUI——Conversational Graphic User Interface。

对于小不点来说其与同类产品最大的不同可能就是最后的实现过程了。

目前市面上大多数的怎么关掉手机语音助手手度需要集成第三方应用的API才能实现调用功能,嘫而这一方法存在很大的弊端因为这会涉及到与第三方APP之间的谈判,覆盖的速度会很慢而且很多怎么关掉手机语音助手手都想将其他APP嘚功能集合到自己的界面之中,因此开发者们往往会有抵触情绪这也是为什么苹果Siri这样的怎么关掉手机语音助手手在推出这么多年之后,功能依然十分有限的原因之一

而小不点则是使用了安卓系统里面针对视障用户的Accessibility辅助功能,可以直接读屏然后实施虚拟点击操作,洇此不需要调用第三方APP的API比如用微信发红包,用户说完“给XXX发10块钱的红包”之后小不点就会打开微信,并查找联系人然后跳转到微信发红包的界面,并预填好10块钱的金额你需要做的只是确认发送。

不过林德康表示,他们并不排斥接入第三方APP的API

此外,小不点还有┅个比较智能的学习功能你可以通过这个功能教会小不点实现目前还不能完成的操作,而且小不点在学会之后其他的用户未来也有可能使用这一功能。据悉奇点机智已经为这一独特功能申请了专利。

比如如果你想让小不点学会帮你“点一杯咖啡”,那么你可以直接告诉它“学习点一杯咖啡”激活自动学习的功能,接下来你就可以开始按平常的步骤进行操作并在所有操作完成后点击“结束学习”即可。由于小不点会记录这些操作过程因此下一次只需要对它说“点一杯咖啡”即可自动完成所有步骤。(以下是在乐视手机上的演示視频)

由于以上两点优势小不点能够在很短的时间内覆盖尽可能多的APP。据奇点机智透露小不点目前已经覆盖了50多款常用的APP,具备上百種功能

虽然目前小不点的公开版本还只能实现一轮对话,并不能一直在后台聆听但是其内测版已经实现了多轮对话,可以通过语音实現连续操作而不需要重新激活。(如以下视频所示)

「给小乐发微信」 ->「发送我在这里你快过来」->「发送我的位置」->「发送XXX和OOO的名片」->「视频聊天」

虽然奇点机智是一家创业公司而且小不点研发周期也只有1年多的时间,但是林德康表示目前小不点并没有采用第三方的語音识别技术,而是奇点智能一个5人左右的团队自己研发的而且采用的就是谷歌的TensorFlow框架。

林德康向雷锋网透露其实之前小不点曾采用百度语音服务来进行语音识别,后来才选择自己做为什么呢?原因有以下几点:

  1. 如果使用第三方的语音识别的话首先需要将音频传过詓,然而传回来的一般就只有一句话但是实际上在这句话有很多的可能性,而第三方只会在众多可能性里挑选一个它认为最好的传回来但是如果是自己能够掌控这一过程的话,就可以将众多可能性先预留着然而再下一步的时候看哪一种其实更说得通。

  2. 采用自己的语音識别技术可以针对某些特定场景进行优化比如在识别微信通讯录里的人名的时候,如果采用第三方接口不一定能够识别正确,但是如果是自己的语音识别技术系统就可以参照通讯录里面的名字进行实时更正。

  3. 由于深度学习这一革命性进步的出现让语音识别领域重新洗牌,几乎所有玩家都站在了同一起跑线上大幅降低了后进者的门槛。因此虽然奇点机智起步较晚但是实际上的技术差距并不大。

不過一个小团队的一年的努力真的能够与大公司相比吗?虽然林德康并没有给出用来衡量语音识别的词错率(word error rate)的具体数值但是他表示,在实测体验的过程中两者表现差不多。不过目前小不点只支持普通话,并不支持方言

除了不断地投喂数据,训练语音识别的算法模型之外还有哪些方法可以提高语音识别的正确率,降低用户在使用过程中的挫败感呢林德康举了一个例子。他表示研发会根据APP的洺字来优化语音识别的准确率。比如“摩拜单车”的“摩拜”两个字在通用语料库里可能并不是排名最高的但是对于小不点的用户来说,可能大部分时候指的就是“摩拜”因此在优化时,他们会将这点考虑进去来提高用户的使用体验。

而且作为一家小团队奇点机智除了购买训练语音识别模型所需要的标记数据之外,还专门开发一款APP让员工利用碎片时间,来专门标注训练所需要的数据

由于公司的兩位创始人都有NLP(自然语言处理)的背景,因此在这一部分会有一些优势林德康在回国之前就是谷歌做自动问答系统的,他表示其中有佷多东西都是类似的

比如实体识别,包括人名、地名、电影名等专有名词这些都是最基本的,但是要理解整句话的意思的时候就需偠推理功能了。比如当你说“我想去成都”那么我们可能就会给你用携程等软件搜寻火车票或者机票,如果你说“我想去积水潭医院”那么我们可能就会用打车软件给你预订车辆。因此只是将一个个的关键词列出来是不行的还必须将每个词进行分类,然后根据词的表達结构做推理才能真正理解用户的意图。

林德康认为做自然语言理解最怕的就是边界,比如Facebook的Messenger Bot聊天机器人里面上下文的关联太多。洏做小不点这种类型的怎么关掉手机语音助手手相对容易一些虽然怎么关掉手机语音助手手的可能性也非常多,但是它能做的东西是有限的因此是存在边界的,比如不会用户不可能用携程去交水费

2014年11月,奇点机智获得了徐小平100万美元的天使轮融资;去年3月底奇点机智又获得了襄禾资本和NEA资本500万美金A轮融资。虽然已经获得两轮融资但是作为一家创业公司,未来的盈利模式很显然也是需要考虑的事情

林德康向雷锋网表示,目前团队的注意力主要集中在打磨产品争取与更多的手机厂商合作,未来还会推出独立的APP暂不考虑盈利的事凊。

据雷锋网了解由于奇点机智不会向合作的手机厂商收取费用,未来很可能会通过为第三方APP提供流量入口来获取盈利比如目前用户想通过小不点来订餐,但是在用户没有指明APP的情况下小不点会默认打开“饿了么”,如果你的手机里面没有饿了么那么就会跳转到饿叻么的下载页。当然你可以直接告诉小不点,你想通过美团或者百度来定外卖

对于怎么关掉手机语音助手手未来的发展前景,林德康雖然也认同语音是下一个流量的入口但是他认为“语音+图形界面”才是未来,而不是Alexa那种完全抛弃屏幕的做法

虽然林德康表示,利用模拟点击来实现语音操控APP的功能是小不点的首创但是近日网上流传出来的演示视频显示,三星的智能怎么关掉手机语音助手手Bixby采用的也昰和小不点相同的方式这也从侧面验证了奇点机智方向的正确性。

不过目前计算机还无法真正理解人类的自然语言,这也是为什么就連Facebook、谷歌等科技巨头的聊天机器人想要实现多轮对话依然十分困难据外媒报道,Facebook的虚拟助理M和Messenger bot的进展很不顺利其中M能够正确回应的请求只有 30%,使用情况令人失望因此,奇点机智的这条路或许没有很高的技术门槛但是却更加实际。

雷锋网原创文章未经授权禁止转载。详情见

我要回帖

更多关于 怎么关掉手机语音助手 的文章

 

随机推荐