注册
闽南网 > 科技 > 互联网 > 正文

谷歌AI在在语音识别取得新进展 区分声音准确率达92%

来源:网易科技 2018-11-13 17:46 http://www.mnw.cn/

  11月13日消息,据VentureBeat报道,在语音嘈杂的环境中,要想分辨出有几个人讲话、在什么时间讲话,对于机器来说非常困难。但谷歌人工智能(AI)研究部门在语音识别方面取得了新进展,能以92%的准确率识别出每个人声音的专属模式。

­  谷歌AI研究部门在最新名为《Fully Supervised Speaker Diarization》的论文和相关博客文章中,研究人员描述了一种新的AI系统,它“能以一种更有效的方式识别声音”。

­  这套系统涉及到Speaker diarization任务,即需要标注出“谁”从“什么时候”到“什么时候”在说话,将语音样本分割成独特的、同构片段的过程。强大的AI系统必须能够将新的演讲者发音与它以前从未遇到过的语音片段关联起来。

­  这篇论文的作者声称,核心算法已经可在Github上的开源软件中可用,它实现了一个在线二值化错误率(DER),在NIST SRE 2000 CALLHOME基准上是7.6%,这对于实时应用来说已经足够低了,而谷歌之前使用的方法DER为8.8%。

­  谷歌研究人员的新方法是通过递归神经网络(RNN)模拟演讲者的嵌入(如词汇和短语的数学表示),递归神经网络是一种机器学习模型,它可以利用内部状态来处理输入序列。每个演讲者都从自己的RNN实例开始,该实例不断更新给定新嵌入的RNN状态,使系统能够学习发言者共享的高级知识。

­  研究人员在论文中写道:“由于该系统的所有组件都可以在监督环境下学习,所以在有高质量时间标记演讲者标签训练数据的情况下,它比无监督系统更受青睐。我们的系统受到全面监督,能够从带有时间戳的演讲者标签例子中学习。”

­  在未来的工作中,研究团队计划改进模型,使其能够集成上下文信息来执行脱机解码,他们希望这将进一步减少DER。研究人员还希望能够直接对声学特征进行建模,这样整个Speaker diarization系统就可以进行端到端训练。(小小)

原标题:谷歌开源AI能区分声音 准确率达92%
责任编辑:曾少林
相关阅读:
新闻 娱乐 福建 泉州 漳州 厦门
猜你喜欢:
热门评论:
频道推荐
  • 以下哪项重大科技成果与科学家邓稼先密切相
  • 君子兰是一种兰花吗 蚂蚁庄园5月3日答案
  • “江南园林甲天下,苏州园林甲江南”说的是
  • 新闻推荐
    @所有人 多项民生礼包加速落地快来查收 三峡大坝变形?专家:又有人在恶意炒作 北京新一波疫情为什么没出现死亡病例? 戴口罩、一米线 疫情改变了哪些习惯? 呼伦贝尔现幻日奇观 彩虹光带环绕太阳
    视觉焦点
    石狮:秋风起,紫菜香 石狮:秋风起,紫菜香
    石狮环湾生态公园内粉黛乱子草盛放 石狮环湾生态公园内粉黛乱子草盛放
    精彩视频
    簪花献妈祖,同谒妈祖,共襄盛会(视频)
    簪花献妈祖,同谒妈祖,共襄盛会(视频)
    2025泉州时尚周启幕大秀精彩纷呈(视频)
    2025泉州时尚周启幕大秀精彩纷呈(视频)
    专题推荐
    关注泉城养老服务 打造幸福老年生活
    关注泉城养老服务 打造幸福老年生活

    闽南网推出专题报道,以图、文、视频等形式,展现泉州在补齐养老事业短板,提升养老服

    新征程,再出发——聚焦2021年全国两会
    2020福建高考招录
     
    48小时点击排行榜
    “江南园林甲天下,苏州园林甲江南”说的 短时间内失血量超过总血量20%会导致休克 超37万人次!假期首日南平客流增长明显 5月2日全社会跨区域人员流动量超2.9亿人 北京今天以晴为主 阵风6级左右 五一假期 因雷雨、沙尘等天气 这些机场航班运行可 中央气象台:江南南部华南北部降水显著偏 逛博物馆、游西湖……“五一”假期多地旅