当前位置:首页 > 科技 >

微软的小冰怎么使用(微软小冰下载教程)

来源:原点资讯(www.yd166.com)时间:2023-02-09 11:52:58作者:YD166手机阅读>>

当用户去说了一句“我爱你,宝贝”,这个连续的流,从语音流,从客户端流向了云端,语音识别它会根据它现有听到的最新的语音开始尝试把每一个音节都尽可能地识别出来。这样的话,我们就会看到它每多听到一个音节的时候,它就会突出一个中间的结果,会看到“我,我爱,我爱你,我爱你抱”,这个应该是听了一半,所以它的想象有些不一样。然后“我爱你宝贝”。最后再经过确认,确实这个用户说到这儿的时候有了一定的停顿之后,它最终语音识别的引擎突出了一个最终结果,说这句话最好,最后其实就是“我爱你宝贝”。在这一句话听完整之前,事实上很多的运算就已经被开始进行了。这里边每一个语音识别的中间结果出来的时候,我们都会根据现在的前缀进行一个语言的预测,就是说从概率上来讲,也许用户有可能在说什么,你可以看到,当看到我的时候,我就算猜也猜不到太多。当出了一个“爱”字的时候,它其实已经能猜到“我爱你”了。但后来出了一个“宝”的时候,话锋变了,发现这个最终的话其实也不是“我爱你”,是“我爱你宝贝”。最后事实上当最终结果出来的时候,也验证了我这个猜测是正确的,它就是“我爱你宝贝”。

这里面一个优势就是,其实用户的这个“宝”字刚落下来的时候,经过一个简单的对策,对话的引擎就已经可以开始计算我应该怎么回答“我爱你宝贝”这句话,因为图中的这六条线都在进行平行的计算。等到它确定最后这三个平行的预测全都是正确的时候,它只需要等到这三个回答的计算中最快的那一个结果就可以了,因为它们算的其实都是同一个问题。这无形中就可以让人和AI进行语音交互时候,AI有机会能更快地去给你一个回复,而这个对于一个交互的自然度、流畅度是非常重要的。从我们后台的数据可以看到,哪怕机器的平均回答速度平均起来能快100毫秒,100毫秒其实对于人的感觉来说几乎是感觉不到的,会觉得1/10秒,人是感觉不到。但是只要AI的回答速度能快那么1/10秒的话,那么人类就会很明显地更愿意跟这个机器人聊得更长,我们可以通过像A/B test这样的东西能看到这样的结果。这个就是说,事实上对于人机的语音交互来说,速度是一个非常非常重要的环节。我们有了这种连续识别语音语言的预测,再加上平行的处理,就可以让机器,让AI回答得更快,也能让这整个人机交互变得更加流畅。

微软的小冰怎么使用,微软小冰下载教程(13)

下面一个图解释了说我们如何进行一个节奏控制?事实上我们会把机器现在正在说的话和未来可能要说的话建一个池子,然后它就像有一个播放的指针一样,不断地从这个池子里去拿音频的针,去塞到那个连续的流里。然后每出来一个新的话的时候,我们会通过各种各样不同的输出关系来决定说,我这句话是应该放到播放的最前面,还是应该放到排队的池子里,还是应该直接扔掉?有了这样一个内容的池子的话,我们就可以保证一个稳定的对外音频的输出。这个是节奏控制的方法。

最后还有几分钟时间,我再给大家介绍一下一对多,我们会说非对称的这种动态的回复。这种动态回复又包括几点,其中一个叫铺垫回复,也就是当我觉得可能我还需要想一会儿的时候,人有一个非常重要的技巧,就是我听到了你的话,我会说,嗯,或者说我想想,或者讲英文的人最爱说的well。这句话其实没有表达任何意思,但它在对话的技巧中非常重要,它是让用户立刻知道说我已经听懂你的意思,我知道你跟我说的话了,但是我正在想。我们在全双工的AI实现中同样使用了这样的技术,就是当我听到了这句话,当我自己的预测,觉得我需要较长的时间,我可能需要较长时间才能算出最终回答的语音文件的时候,我先要垫一句“嗯”,或者垫一句“我想想”,然后等什么时候这个语音好了,我就再把它播出来。这样的话,会很大地减轻用户能感知的延迟。第二个避免用户以为你没有听见,我又追问了一句。

微软的小冰怎么使用,微软小冰下载教程(14)

类似的,尤其是在远程的智能家居控制的时候,还有另一种方法,我们叫意图-执行回复。就是在听到中间结果的时候,可能我知道是打开床头灯,但是我事实上如果真正想要把这个床头灯打开,这是一个非常复杂的联动,我需要通过很多的服务器,从云端落到你家里的路由器,然后再由路由器把你的智能家居打开,这是一个非常漫长的过程,通常需要两三秒都是很正常的。对于人工智能来说,这两三秒我再回答,这会让用户说觉得你到底听没听清我?微软小冰在全双工使用的方法是:我首先只要识别出你的意图,那么我不尝试真正执行它,我就先给一个对于你的意图的回复,就是说我先试试或者说我正在开灯,然后等我的智能操作真正完成了,我拿到了它的智能设备传回来的返回设备码的时候,我再告诉他说,你家的智能电视已经打开或者说那个智能电视现在处于离线状态无法打开,再把真正的结果告诉他。所以一个问题事实上我可以拆成两步答案再去回答,这是一种非对称的交互。

微软的小冰怎么使用,微软小冰下载教程(15)

还有更多,比如当一个用户说“我好无聊,你给我讲一个笑话吧”,这个时候人工智能给他讲了一个笑话。讲完笑话之后,它听到用户沉默了,他可能还不高兴,它事实上可以过了几秒钟之后说,“那我再给你讲一个吧”,我可以再讲第二个、第三个,直到用户再说些什么或者说AI自己也觉得无趣了,它再断开。我们可以认为一个主回复中,其实后面可以再挂着很多额外的回复,如果用户没有反应的话,我可以源源不断地把它播出来。

微软的小冰怎么使用,微软小冰下载教程(16)

栏目热文

微软小娜支持语音唤醒吗(win10小娜没有语音唤醒功能)

微软小娜支持语音唤醒吗(win10小娜没有语音唤醒功能)

唤醒词keyword spotting(KWS):在连续语流中实时检测出说话人特定片段。这里要注意,检测的“实时性”是一...

2023-02-09 11:46:42查看全文 >>

微软小娜为什么用不了(微软小娜怎么在手机上用不了)

微软小娜为什么用不了(微软小娜怎么在手机上用不了)

在win101909版本号使用小娜通话的过程中发觉小娜不会聊天只能搜索怎么办?假如遇上这样的事情,我认为可能是网络出错了...

2023-02-09 11:09:58查看全文 >>

微软小娜有什么用(微软小娜怎么设置中文)

微软小娜有什么用(微软小娜怎么设置中文)

图片来源@视觉中国文 | 元宇宙日爆5天突破100万用户,聊天机器人模型ChatGPT创造了AIGC产品史上里程碑式的一...

2023-02-09 11:13:40查看全文 >>

小冰和微软小娜的区别(微软小娜为什么是小冰的姐姐)

小冰和微软小娜的区别(微软小娜为什么是小冰的姐姐)

图片来源@视觉中国文 | 元宇宙日爆5天突破100万用户,聊天机器人模型ChatGPT创造了AIGC产品史上里程碑式的一...

2023-02-09 11:46:24查看全文 >>

微软小娜与小冰(微软小娜公众号)

微软小娜与小冰(微软小娜公众号)

图片来源@视觉中国文 | 元宇宙日爆5天突破100万用户,聊天机器人模型ChatGPT创造了AIGC产品史上里程碑式的一...

2023-02-09 11:17:27查看全文 >>

泡红茶的正确方法(泡红茶的正确方式和禁忌)

泡红茶的正确方法(泡红茶的正确方式和禁忌)

红茶,因为其温和的属性,老少皆宜,受到很多茶友们的喜爱。就像再温和的人也有发脾气的时候。红茶虽然冲泡简单,但泡不好的时候...

2023-02-09 11:37:27查看全文 >>

红茶配什么最佳(肝最怕三种茶叶排毒)

红茶配什么最佳(肝最怕三种茶叶排毒)

冬天天气寒冷,此时喝上一杯热热的茶,真是再好不过的了。除了绿茶之外,红茶也深受大众的喜欢。红茶香甜味醇,是不少人都喜欢喝...

2023-02-09 11:49:43查看全文 >>

红茶最佳泡法步骤(红茶一般怎么泡才正确)

红茶最佳泡法步骤(红茶一般怎么泡才正确)

红茶,因为其温和的属性,老少皆宜,受到很多茶友们的喜爱。就像再温和的人也有发脾气的时候。红茶虽然冲泡简单,但泡不好的时候...

2023-02-09 11:05:25查看全文 >>

苹果xr抬头灯怎么设置一闪一闪(苹果xr 怎么设置来电灯闪)

苹果xr抬头灯怎么设置一闪一闪(苹果xr 怎么设置来电灯闪)

步骤1、打开设置,找到辅助功能,打开音频视觉;步骤2、在音频视觉页面,将下方LED闪烁以示提醒打开即可。,...

2023-02-09 11:06:51查看全文 >>

苹果灯光闪烁怎么设置xr(最新苹果xr前置灯闪烁怎么设置)

苹果灯光闪烁怎么设置xr(最新苹果xr前置灯闪烁怎么设置)

步骤1、打开设置,找到辅助功能,打开音频视觉;步骤2、在音频视觉页面,将下方LED闪烁以示提醒打开即可。,...

2023-02-09 11:48:11查看全文 >>

文档排行