24小时联系电话:185 8888 888

商业
您现在的位置: 首页 > 商业 > Google在联络中心AI中推出了更好的转录,无限流式传输等功能
  • “酷”大脑研究的扭曲观念扼杀了心理治疗

    “酷”大脑研究的扭曲观念扼杀了心理治疗

    发布时间:2020/03/31

      ‘对于人类的每一个问题,总是存在着众所周知的解决方案-简洁,合理和错误。” 人类从来没有遇到过比了解我们自己的人性更复杂的问题。而且,不乏任何试图探究其深度的简洁,合理和错误的答案。 在我职业生...

  • SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    SpaceX赢得NASA合同,使用新型Dragon XL工艺将货物运送到月球网关

    发布时间:2020/03/31

      美国国家航空航天局(NASA)挖掘出一种尚未建造的SpaceX货运飞船,用于向尚未发射的绕月轨道前哨基地运送补给品。 SpaceX的机器人Dragon XL是其主力Dragon太空船的圆柱形超大型版本,将作为第一批从NASA获得...

  • Spaces应用程序使人们可以参加VR中的Zoom会议

    Spaces应用程序使人们可以参加VR中的Zoom会议

    发布时间:2020/03/30

      一个名为Spaces的新PC VR应用程序使用户可以从VR内部加入Zoom会议和其他视频通话。 该应用是根据最近发生的COVID-19大流行而开发的,该大流行已经使世界各地许多人在家中工作并使用诸如Zoom之类的虚拟会议...

  • 汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    汇盈医疗声称其AI可以从CT扫描中检测冠状病毒,准确率达96%

    发布时间:2020/03/30

      总部位于中国惠州的医疗设备公司慧英医疗声称已开发出一种AI成像解决方案,该解决方案使用CT胸部扫描来检测COVID-19的存在。该公司断言,如果不使用逆转录聚合酶链反应(RT-PCR)(COVID-19的标准测试方法),...

Google在联络中心AI中推出了更好的转录,无限流式传输等功能

发布时间:2019/07/24 商业 浏览次数:741

 
去年7月,在旧金山举行的Cloud Next会议期间,Google推出了Contact Center AI。机器学习驱动的客户支持工具包利用Dialogflow(会话体验开发平台)和云语音到文本(一套音频到文本技术)通过电话与呼叫者进行交互。这已经很长一段时间了,但本周这家科技巨头凭借一系列功能大大提高了语音识别的准确性,从而巩固了这项新兴服务。
“联络中心对许多企业至关重要,正确的技术在帮助他们提供出色的客户服务方面发挥着重要作用,”产品经理Dan Aharon和Shantanu Misra在博客中写道。 “我们很高兴看到语音识别的这些改进如何改善各种形状和大小的联络中心的客户体验。”
联络中心AI的新自动语音自适应功能可在测试版中使用,目标是Dialogflow代理的语音识别系统可能会混淆类似听起来的单词。它考虑了上下文 – 特别是训练短语,实体和其他特定于代理的信息 – 使用称为语音适应的学习过程进行适当的响应。例如,如果呼叫者试图安排产品退货,Contact Center AI将利用其对退货流程的了解,以避免将“邮件”一词误认为“钉子”。
默认情况下,自动语音自适应功能已关闭。您可以在Dialogflow控制台中找到它。
基线模型改进
谷歌最近推出了针对具体使用案例的预览高级语音到文本模型,并在2月份制作了其中一种 – 针对两到四人对话优化的手机型号 – 通常可用。山景公司当时声称,与前一代54%相比,该模型的转录错误减少了62%。今天,谷歌透露其工程师已经进一步优化了美国英语短语的模型。相对于之前公布的改进,该模型现在准确度提高了15%。
“应用语音适应还可以在这一收益之上提供额外的改进,”Aharon和Misra写道。 “我们不断为路线图增加更多质量改进 – 对任何IVR或基于手机的虚拟代理都有自动优势,无需任何代码更改 – 并且将在未来分享更多有关这些更新的信息。”
更好的转录和无限流媒体
增强的上下文感知和增强的语音到文本并不是联络中心AI管道中唯一新的自然语言理解改进。谷歌今天推出测试版“更丰富”的手动速度改编和实体类,此外还有扩展的短语限制,无限流媒体等等。
SpeechContext参数中有三个新功能,云语音到文本设置的集合以及为企业和垂直行业定制转录的切换。 SpeechContext类 – 反映数字序列,地址,数字和货币面额等概念的预建实体 – 一次优化单词列表的ASR。至于SpeechContext增强,它有助于调整语音适应强度,同时减少误报的数量 – 即,当没有提到短语但出现在抄本中时。最后,SpeechContext现在支持每个API请求最多5,000个短语提示(从500开始),增加了ASR捕获不常见的单词或短语的可能性。
也许更重要的是,Cloud Speech-to-Text自启动以来仅以一分钟为增量支持流式音频,现在可以处理长达五分钟的会话,并恢复之前会话停止的流式传输。 (Google指出,这有效地使得实时自动转录的长度无限。)此外,Cloud Speech-to-Text现在原生支持MP3文件格式;以前,MP3文件必须在处理之前扩展为LINEAR16格式。
“我们很高兴看到这些语音识别改进如何改善各种形状和规模的联络中心的客户体验 – 无论您是与我们的合作伙伴合作部署Contact Center AI解决方案还是采用我们的DIY方法会话式的AI套件,“Aharon和Misra写道。

姓 名:
邮箱
留 言: