追觅电视重磅硅谷成功发布变形电视+ Soundbar within刷新视听体验

发布时间：2026/04/29

4月27日至30日，追觅科技在美国旧金山成功举办“DREAME NEXT”硅谷全球发布会。为期四天的发布汇聚了全球媒体与科技从业者，成为近年来中国品牌在硅谷最具规模的发布事件之一。在本次发布会上，追觅电视正式面向北...
脱发难题有新招：振东制药达霏欣推出“内服外治”方案，助力毛囊新生

发布时间：2025/07/24

近年来，随着生活压力加剧、作息不规律及环境因素影响，脱发、白发问题呈现年轻化趋势，成为困扰现代人的普遍健康难题。面对庞大的市场需求，传统单一治疗手段逐渐显露出局限性。近日，专注毛发健康领域22年的达...
“大健康”中医药技术壁垒下，振东制药靠“一问一答”成功破局

发布时间：2025/06/26

6月17日，中国药理学会党委书记杜冠华率专家团队赴振东制药开展专项技术对接，全国学会服务地方产业发展项目正式启动。此次会议聚焦中药现代化研发重难点，诚邀全国中医药专家共同讨论“大健康”新时代背景下传统药...
振东出题，专家解题：“大健康”背景下，振东制药率先“破冰”！

发布时间：2025/06/25

6月17日，全国学会服务地方产业发展试点项目正式落地山西。该项目由中国科协主导，振东制药协办，研发总裁游蓉丽主持。旨在通过嫁接全国学会的学术资源助力山西地区药企实现技术升级，推动当地中医药企业集群全面...

“酷”大脑研究的扭曲观念扼杀了心理治疗

发布时间：2020/03/31

‘对于人类的每一个问题，总是存在着众所周知的解决方案-简洁，合理和错误。” 人类从来没有遇到过比了解我们自己的人性更复杂的问题。而且，不乏任何试图探究其深度的简洁，合理和错误的答案。在我职业生...
SpaceX赢得NASA合同，使用新型Dragon XL工艺将货物运送到月球网关

发布时间：2020/03/31

美国国家航空航天局(NASA)挖掘出一种尚未建造的SpaceX货运飞船，用于向尚未发射的绕月轨道前哨基地运送补给品。 SpaceX的机器人Dragon XL是其主力Dragon太空船的圆柱形超大型版本，将作为第一批从NASA获得...
Spaces应用程序使人们可以参加VR中的Zoom会议

发布时间：2020/03/30

一个名为Spaces的新PC VR应用程序使用户可以从VR内部加入Zoom会议和其他视频通话。该应用是根据最近发生的COVID-19大流行而开发的，该大流行已经使世界各地许多人在家中工作并使用诸如Zoom之类的虚拟会议...
汇盈医疗声称其AI可以从CT扫描中检测冠状病毒，准确率达96%

发布时间：2020/03/30

总部位于中国惠州的医疗设备公司慧英医疗声称已开发出一种AI成像解决方案，该解决方案使用CT胸部扫描来检测COVID-19的存在。该公司断言，如果不使用逆转录聚合酶链反应(RT-PCR)(COVID-19的标准测试方法)，...

Google在联络中心AI中推出了更好的转录，无限流式传输等功能

发布时间：2019/07/24 商业 浏览次数：1097

去年7月，在旧金山举行的Cloud Next会议期间，Google推出了Contact Center AI。机器学习驱动的客户支持工具包利用Dialogflow(会话体验开发平台)和云语音到文本(一套音频到文本技术)通过电话与呼叫者进行交互。这已经很长一段时间了，但本周这家科技巨头凭借一系列功能大大提高了语音识别的准确性，从而巩固了这项新兴服务。
“联络中心对许多企业至关重要，正确的技术在帮助他们提供出色的客户服务方面发挥着重要作用，”产品经理Dan Aharon和Shantanu Misra在博客中写道。 “我们很高兴看到语音识别的这些改进如何改善各种形状和大小的联络中心的客户体验。”
联络中心AI的新自动语音自适应功能可在测试版中使用，目标是Dialogflow代理的语音识别系统可能会混淆类似听起来的单词。它考虑了上下文 – 特别是训练短语，实体和其他特定于代理的信息 – 使用称为语音适应的学习过程进行适当的响应。例如，如果呼叫者试图安排产品退货，Contact Center AI将利用其对退货流程的了解，以避免将“邮件”一词误认为“钉子”。
默认情况下，自动语音自适应功能已关闭。您可以在Dialogflow控制台中找到它。
基线模型改进
谷歌最近推出了针对具体使用案例的预览高级语音到文本模型，并在2月份制作了其中一种 – 针对两到四人对话优化的手机型号 – 通常可用。山景公司当时声称，与前一代54%相比，该模型的转录错误减少了62%。今天，谷歌透露其工程师已经进一步优化了美国英语短语的模型。相对于之前公布的改进，该模型现在准确度提高了15%。
“应用语音适应还可以在这一收益之上提供额外的改进，”Aharon和Misra写道。 “我们不断为路线图增加更多质量改进 – 对任何IVR或基于手机的虚拟代理都有自动优势，无需任何代码更改 – 并且将在未来分享更多有关这些更新的信息。”
更好的转录和无限流媒体
增强的上下文感知和增强的语音到文本并不是联络中心AI管道中唯一新的自然语言理解改进。谷歌今天推出测试版“更丰富”的手动速度改编和实体类，此外还有扩展的短语限制，无限流媒体等等。
SpeechContext参数中有三个新功能，云语音到文本设置的集合以及为企业和垂直行业定制转录的切换。 SpeechContext类 – 反映数字序列，地址，数字和货币面额等概念的预建实体 – 一次优化单词列表的ASR。至于SpeechContext增强，它有助于调整语音适应强度，同时减少误报的数量 – 即，当没有提到短语但出现在抄本中时。最后，SpeechContext现在支持每个API请求最多5,000个短语提示(从500开始)，增加了ASR捕获不常见的单词或短语的可能性。
也许更重要的是，Cloud Speech-to-Text自启动以来仅以一分钟为增量支持流式音频，现在可以处理长达五分钟的会话，并恢复之前会话停止的流式传输。 (Google指出，这有效地使得实时自动转录的长度无限。)此外，Cloud Speech-to-Text现在原生支持MP3文件格式;以前，MP3文件必须在处理之前扩展为LINEAR16格式。
“我们很高兴看到这些语音识别改进如何改善各种形状和规模的联络中心的客户体验 – 无论您是与我们的合作伙伴合作部署Contact Center AI解决方案还是采用我们的DIY方法会话式的AI套件，“Aharon和Misra写道。

上一篇: 星巴克与Uber Eats达成新协议，扩大了美国各地的菜单送货服务

下一篇: Apple发布了iOS 12.4，并为Apple Card提供了潜在的软件支持

相关推荐