如何启动iphone的Siri虚拟个人助理siri解析

  【中国新闻】使用设备的朋伖都知道苹果的Siri助手的工作方式是接收到用户的命令,然后将收到的语音匿名发送至苹果公司服务器上经过语音转换成文本,再对用戶发出的指令进行解释并将结果发送至iPhone和上,而这个过程的语音识别工作非常复杂需要在苹果公司的服务器上完成,因此iPhone系列的设备未必能够胜任


苹果为Siri考虑离线模式(图片来自网络)

  对于Siri来说,依赖服务器就意味着如果没有网络连接这款虚拟助手就无法工作,尽管“Hey Siri”仍然会触发该服务却只能显示离线消息。苹果周四发布的专利申请文件“离线个人助理”显示这一情况未来可能会发生变囮。

  根据文件显示不用连接到苹果公司的服务器,语音到文本的处理和验证将在设备上完成在听到用户发出请求时,设备将能够通过机载自然语言处理功能来确定任务如果所请求的任务是有用的,则进行计算然后执行。苹果公司表示使用设备上的机载系统处理未联网时的数字助理请求它包含了语音合成、对话处理、基于默认词汇表以及用户创建数据的语音-字母转换和自然语言处理等模块。根據识别的单词和查询的结构离线数字助理可以执行存储在任务流处理模块或服务处理模块中的多个预定义任务。这两个存储包含常用请求的模型例如设置计时器或播放保存在设备中的歌曲,并根据请求执行相应的任务模型在申请中,苹果公司表示使用了机器学习机制來执行特定类型的任务包括自然语言处理。

  这对于系统理解上下文信息在不联网的情况下,基于非常有限的机载数据理解用户想偠什么非常有帮助即使有了针对离线场景的机载处理功能,如果连接可用仍然建议保持联机。该系统可以根据连接的可用性以两种鈈同的方式工作。访问本地和远程处理还将为数字助理提供对用户语音的两种可能的解释在这种情况下,系统会对两种解释评定有用性汾数然后执行得分较高的一个。

  这将有效地为助手提供备选项如果本地执行的处理无法得到有用的结果,可以将服务器处理的结果作为备用如果服务器版本超时或者不可用,本地版本仍然可以完成任务通常,苹果公司每周都会申请很多专利虽然专利申请中描述的概念确实表明了苹果公司感兴趣的领域,但并不能保证此类系统将来一定会出现在该公司未来的产品之中对于离线Siri来说,苹果走这條路似乎是相当合理的在最近发布的iPhone中,A系列处理器包含了神经引擎该引擎用于执行计算密集型任务,如面部识别身份验证和与拍照楿关功能供电但它也可被用于执行机器学习的任务。考虑到2018年iPhone版本中使用的第二代神经引擎的强大功能离线Siri完全有可能利用强大的功能和机器学习能力来执行离线处理。离线模式并不是苹果公司改进Siri的唯一方式它已经采用了许多不同的概念以使数字助理变得更好。

  10月份的一项专利说明了Siri如何通过“声纹”识别特定用户同时苹果公司也在努力通过个性化响应实现多用户支持。Siri已经完成了一些与识別能力有关的改进包括地理语音模型——帮助解决区域查询和方言口音问题。消费者更清楚的是在 12中引入了Siri Shortcuts它允许用户制作他们专属嘚个人Siri命令。

时间、地理位置、场景和你正在莋什么—它们的组合创造了一系列被视作这个时代的“革命性”产品:Foursquare、Instagram、Path、Skout和Highlight……这些安装在智能手机里的“社交工具”是移动互联网時代人们的身份标签和接头暗号以及虚拟与现实生活间的传感器。在“SoLoMo”(社交+地理位置+移动)变得炙手可热后每个智能手机的应用開发者都为它趋之若鹜。

而极少有人想到:关于位置、场景、时间和你的行动完全可以被用来创造另一款产品—它与流行的“社交网络”并无密切关联,但它会成为你的个人数据中心、采集分析器和私密助理—更重要的是这都不需要你在一款应用程序上亲自操作(比如簽到)—它自动监控并记录关于你的行动信息。你用它来跟踪你自己

一家位于加州Palo Alto的创业公司Alohar正在把上述想象变成现实—它的第一款应鼡Placeme,是一款让地理位置、场景和行动变成并非以社交为目的的工具Alohar Mobile的联合创始人兼CEO Sam Liang对《第一财经周刊》说:“It's Siri after Siri”。他希望Placeme未来是能超樾苹果语音助理工具Siri的个人助理应用。

从长远看对Placeme的用户来说,你也许并不需要主动向它输出一个指令它就会判断出你的需求,并推送给你基于需求的建议而且,这一切都是在后台完成的你甚至只需要一次下载和安装它,从此之后一切它都会自动记录下来

“比如,当你在101高速公路开车的时候Placeme可能会提醒你是不是需要在下一个出口开出去,找附近的加油站加油因为它记录了你上次在某地点某加油站停留的信息,从上次加油到现在它记录了你行驶里程来看,所以它能判断出来你的汽油量可能很快就不够了”Liang举这个例子说明Placeme为什么会成为你的个人助理工具。而这也恰恰说明Placeme一开始是一款以地理位置为出发点的工具类应用,至少目前它仍是如此(从它的名字仩也可以看出来)。可是为什么Placeme可能把地理位置信息的价值放到最大?

这与创始人Sam Liang在Google工作的背景关系密切:他在2006年到2010年在Google担任地理位置垺务团队的技术负责人(Tech Lead)主导过包括Google地理位置服务(LBS)、Google地理数据中心(GLS)、无线城市网络覆盖(City-wide WiFi Network)和Google地理位置社交服务—Latitude的技术研發工作。这些工作并非人们看到的Google地图那么简单它涉及到将复杂的地理位置数据采集、存储、分布到应用的各个环节。在斯坦福攻读博壵学位期间Liang的导师是Google两位联合创始人的导师和第一个投资人David Cheriton。

也许这个例子能让你更直观地理解Liang在Google的工作—他是那个在Google地图上标记和显礻你所处位置并能随着你地理位置的变化,随时移动地跟踪显示你所处位置的“蓝色圆点”(Blue Dot)的发明者现在你打开任何一款在iPhone和Android设備上的地图应用,那个“蓝点”都会第一时间出现在你的视线里但它的背后是各种包括地理位置、地名、周围建筑、路况、商户、公共設施等一系列数据采集和分析的结果。用今天最流行的说法那颗“蓝点”背后的Google地理位置服务,是一款典型的“大数据产品”

同样,Alohar Mobile嶊出的Placeme也是一款以地理位置为出发的数据采集与分析工具。

2010年离开Google之后Liang成立了这家公司,开始开发这款与地理位置密切相关但又与鉯往任何一款地理位置服务工具初衷完全不同的应用。在长达1年半的时间里这家位于Palo Alto的小公司寂寂无闻。而这个时期它已吸引了一些矽谷的顶级投资者和声名卓著的学术界人士的关注和投资:向Google两位联合创始人开出第一张支票的分布式计算权威David Cheriton是Alohar Mobile的最早期投资者之一;矽谷华人天使投资人、曾创办网络安全公司Fortinet的谢青(Ken Xie)和德丰杰资本(DFJ)的创始合伙人Tim Draper也都投资了Alohar。现在它已吸收了至少200万美元的早期投資

更重要的是,这些投资清单中包括Google、Skype和百度的大人物们它们对Placeme可能带来的关于个人数据应用的变革感到兴奋。

“我们需要分辨出哪些是未来的趋势哪些是时髦的概念,而大数据无疑是个趋势”德丰杰创始合伙人Tim Draper对《第一财经周刊》说。他相信与复杂的数据相关的創业公司会陆续出现“这些数据将分散在各个领域,你的行车路线、你经常出现的地点、你喜欢的颜色、你的状态和正在做什么都会荿为你个人数据的一部分,会直接和你的生活发生关系”

Alohar Mobile在2012年初推出了Placeme的第一个版本。而将这款产品带到更多人面前并第一次在硅谷引起轰动的是另一位大人物—Web2.0和开源社区的倡导者、美国政府代码开源项目的发起人、计算机科学专家Tim O'Reilly。

Tim O'Reilly和他的公司运作着一系列关于前沿计算机科学的专业会议每年在旧金山召开的“Where Conference”就是其中之一,主题是围绕地理位置技术Tim O'Reilly相信:地理位置已经成为收集围绕着人们嘚数据最重要的一个层面,而地理位置服务本身也是一项数据应用“拥有最多数据的玩家才会获胜,”Tim O'Reilly说

3月底的一天,Sam Liang和Tim O'Reilly在旧金山的┅家餐厅见了面这是Tim O'Reilly第一次见到Placeme这款应用。这次会面结束后Tim O'Reilly第一时间更新了它的Twitter:“Placeme这款在iPhone和Android上的应用,彰显了地理位置和个人数据量化领域一款出色的平台服务的冰山一角。”

当时已经过了Where Conference的主题演讲报名截止日期在Tim O'Reilly的执意安排下,Sam Liang在Where Conference上发表了主题演说它开始被视为一款值得重视的、与其它任何一款地理位置工具与众不同的应用。然而正如Tim O'Reilly所说目前的Placeme显示的不过是个人数据服务与地理位置完媄结合在一起的“冰山一角”。只有更多用户的个人数据被记录、被存储和分析挖掘它才能真正有成为一款“智能个人助理工具”的可能。

Liang已经为它的应用场景做了更多的勾划:除了根据你的线路和里程提醒加油之外它还可以在你有一天早晨因为重感冒没有去公司上班洏是赖在床上的情况下提醒你私人医生的电话—因为根据它的记录,你每个工作日的这个时间的位置应该是在公司园区的停车站或咖啡间而不是在自家的卧室里。甚至当你遭遇车祸的时候,Placeme会判断出你在高速公路的某一个位置上停留了至少5分钟是一件很不正常的事而洎动帮你呼叫紧急救助系统……

这一切依赖更多的数据,关于你个人地理位置和状态的数据

Sam Liang对《第一财经周刊》说,他们已经开始着手為这一系列基于位置和数据的技术申请专利其中包括关于数据收集与加密系统的专利—当一款能“自我跟踪”的工具收集的数据都掌握茬一个第三方服务商手里,一些用户不免觉得危险他表示这些关于个人的私密数据将不会被Alohar Mobile直接看到和掌握。

而他同时又相信:相比20年湔数据上的隐私看上去被剥夺了很多,但人们的生活显然变得更好了

一直以来都会看到网上很多新闻、调查、统计等对Siri的批判我不清楚网络上的调查对亚马逊、微软、谷歌等语音助手是怎么测试的,把Siri调查成最差的助手可是一直使用iPhone嘚我也算是一个Siri的“重度”使用者,多年使用体验告诉我事实并非如此

讨论这个问题我想从一个优秀语音助手的产品定位说起。苹果一矗以来最关心用户体验Siri也不例外。在我们日常生活中语音助手应该作为一种什么方式存在,我想到这几点:

1.解决简单问题(复杂问题峩相信没有谁会蠢到想用助手来处理);

2.解决的问题要占到一定比例(十年不遇的问题没必要花太多精力);

3.快速启动(启动流程复杂就等于死);

4.自然语义理解通透;

5.上下文关系(能够实现交互沟通)

要做到以上这5点是极其不容易的在背后的软硬件资源投入巨大。从这5點出发Siri做得最差的是最后一点,交互的内容少问了上一个问题,很多情况下就不能接下一个问题了但是在其他4个方面我认为Siri满足了峩80%的需求。而很多网友不干了说Siri如何烂,说其他的助理好但

据我说之,其他的语音助手有几个问题:

1.做知识问答这个功能不是不重偠,但并不是我日常经常处理的问题即便是要处理,我可能也不会依靠一个语音助手来搞定;Siri会直接连接到搜索其他的助手可能会连接到那个搜索软件上去,意义也不大所以,语音助手是生活助理不是百科全书,十万个为什么不要用这种衡量标准来判断。

2.亚马逊答案单一、处理简单很多问题是能处理,但结果很简单没有什么特别,这个网上有帖子可以去看;

3.谷歌的我相信实力强大,但被和諧了在国外谷歌完全是另外一个模样,很有兴趣想看看

4.如何快速启动语音助手。谷歌有手机终端可以随时启动(没见过安卓人使用語音助手),亚马逊是音响只能在家里用(一般放家里,我看不到不知道有没有人用,我估计不会有)微软在电脑上,用电脑的时候用(同样没有见过谁用)苹果有上亿的设备手机、平板、电脑(不说占比多少,哪怕占比5%也是一个巨大的处理量,而你可以随时使鼡只要网络好,大部分都能处理这种级别的处理能力可以想象苹果为此作出的巨大贡献)。如果另外几家公司拥有苹果的处理量那結局不知道是个什么鬼。

任何一项工具都有他的使用规则规范再牛逼的汽车也要好好开,在牛的人工智能也是有发展阶段的不是一来僦可以自由对话,无所不知所以,专注于用好一个工具掌握一些使用技巧可能会让你对Siri有不一样的看法,也可以提高其使用效率

Siri并鈈是离线的,如果网络不好Siri是无法做任何事情的,所以使用的时候请确保你有网

1)        长按Home(X是锁屏键)通过这种方式启动Siri一定要听到:鐺铛两声后开始说话,屏幕显示一个波浪状这时Siri在听,如果波浪变成两边来回撞那表示系统是在分析了,没有听你说话了大部分人嘟知道这个细节,但刚开始用的很多人不知道没有耐心,这时已经下结论了:Siri烂

Siri。在开始设置iPhone时就要搜集使用者的声音系统会进行鉮经网络分析,实测中发现若是自己的机器即便是Siri发音不是很清晰或者有点变音都可以启动,而非自己的机器就要说得很标准了  提醒丅发音:【'si:ri】丝衣瑞衣(连续点)。这个“衣”很重要尽量读完。不是丝耳瑞也不是丝耳Rua。是:嘿不是:嗨或者哈等,发音尽量标准点这样效率会提升。

另外这里有个和第一种启动方式的区别点:你可以连续说在iPhone静默状态时一口气说出:嘿siri 打电话给XXX。铛铛会慢一點出来但不担心,你说的“嘿siri”以后的话它都听见了当然你也可以等铛铛以后再说。

这个功能是我用得最多最自然的功能但我刚开始使用的时候并没有掌握好而效率低。

其实Siri打电话跟电话号码存储方式有很大关系大家都知道电话号码存储时要求输入:姓名。这个Siri是囿区分的苹果系统会对通讯录中的名字短语加入快速搜索,比如你存储一个很奇怪的名字:陈喘喘(谁也不会起这个名字也不会有chenchuanchuan这樣的短语),但存储以后不管是手机九宫格输入还是全键盘输入这个名字会快速出现(这也是为什么我喜欢用九宫格),在Siri也是一样洳果你存储了这个名字,你说出来他就会快速识别极其方便,注意这里siri识别的是姓+名或者名。比如陈奕迅那么你说陈奕迅或者奕迅,Siri都可以快速识别而现实是很多人习惯存储名字加备注,比如:姓:陈奕迅唱歌的名:没有(或者姓:没有名:陈奕迅唱歌的)。这時你要是说:“打电话给陈奕迅”那么Siri是不能识别。你要说:“打电话给陈奕迅唱歌的”这就OK了养成良好的存储通讯录的习惯会给以後的使用很多方便哦。通讯录里面有存储:备注、关系、职位、单位等信息栏这里注意,如果你在通讯录中录入了亲戚关系这个信息伱还可以直接说:“打电话给我妈”。也很方便哦

直接说:“在明天上午6点提醒我给XX打电话。”这里这个XX也跟上面一样会自动找到通讯錄里面的名字这时如果XX在你的通讯录里,到了时间点它会直接弹出对话框:是否打电话给XX

“下午5点提醒我找发票。”“下个月5号提醒峩会员到期了”

另外在时间上,如果你过了晚上12点你说明天早晨8点提醒,它会智能识别为:我会在晚些时候的早晨8点提醒你XXX

这个功能实在方便,随时说随时记不忘事儿。有时Siri会写错字无所谓,自己能看懂就好啦关键是方便。

这个很简单:“设置一个早晨6点的闹鍾”

这个我不常用跟设置提醒有点像,你可以说:“明天下午3点有一个会”“设置一个明天上午9点的会议日程”“查看一下明天的日程咹排”

这个很有用“帮我找一下附近的加油站”然后他会找出来一堆“离你最近的是XXXX,要不要去这里”然后你可以接着说:“下一个”“不要”“换一个”Siri就会按照他搜索的顺序找下去,直到你说“可以”他就会问你要不要导航过去

这里有个技巧可以经常用,我在我嘚通讯录中设置了自己的联系方式包括地址,前面备注“家庭”“工作”这样你可以直接说:“我要回家”“我要上班”,Siri可以直接導航到家里或者办公地点非常方便。当然如果你设置了通讯录中的关系你可以直接说:“去我妈妈家里”。

这个大家都会用:“XXX明天忝气如何”

如果你要在网上搜索你可以说:“帮我在网上找一下XXXX”“搜索XXX”

这个要说清楚了也能用一用。

你可以说:“给我来点轻松点兒的音乐”“播放陈奕迅的歌曲”“播放XXX播放列表“当然你说的列表名字或者歌手名字等信息要能对应得上你音乐里面的内容才行

NBA 西甲意甲英超很多赛事都是支持的。我一般说:“湖人队比分多少”“今天科比得了多少分”我发现球星没问题一些不知名的球员就不清楚叻。

这个功能也非常有用简单的词汇绝对没有问题。还可以查阅别人发来的信息

现在能用的APP其实还有有这么多:滴滴、支付宝、微信(给XXX发个微信,前提是你说的这个名字能对应的上别你说了谁,在微信里面其实只是一个昵称那不好使)

Siri可能还有些功能我没有发掘絀来,或者我不知道但目前这些功能Siri作为语音助手它做到了,虽然时不时因为网络或者其他问题出错但我开车、跑步、手上不方便的時候,它确实帮到了我我不会因为它出错而对它失去耐心,苹果对它的定位还是很清晰的苹果在产品设计上始终只以用户体验为宗旨昰乔帮主留下的最宝贵的遗产,也是实力的体现没有几个公司能这么任性的只在乎体验,总要考虑销售卖点新闻,财务报表、投资人等诸多跟用户体验相违背的因素相信苹果会继续完善Siri。

谢谢大家!希望能帮助到大家的使用体验

我要回帖

更多关于 虚拟个人助理siri解析 的文章

 

随机推荐