人工智能技术终结“耳聋工厂”:85分贝噪声下仍可识别语音

2年前

        对于大多数人来说,语音识别技术的应用场景大多在智能手机的语音输入法、语音助手等日常行为中。实际上,语音识别技术在许多噪音工厂正发挥更多的作用。

        近日,阿里巴巴机器智能技术实验室称,团队正将语音识别的应用领域拓宽到了工厂,以解决“耳聋工厂”问题。

说话基本靠吼的生产车间

        在许多中小型工厂车间里,工人之间的交流通常靠喊、吼。噪声,也成为了工厂工人摆脱不掉的困扰,“职业性噪声聋”已成“尘肺病”后,全国第二大职业病。

在97分贝环境中作业的编织厂工人

        根据《职业性噪声聋诊断标准》等相关标准,噪声大于等于85分贝便可认定为噪声作业环境,工人需有所防护。

        据北京中医药大学东直门医院耳鼻喉科主任医师刘建华介绍,目前,职业性噪声聋呈增发趋势。另外,高噪声对人听力损害是逐步显现,潜在危害比较高。很多工人习惯了在超85分贝的高噪音环境工作后,觉得没事。但暴露在该噪声环境中超过3个月,对听力将造成不可逆的损害。这样的损害持续积累,当工人发现听力出现问题时,已很难恢复。

        然而,大多数中小制造企业没经验和能力考虑降噪。最现实的,还是给工人戴防护耳罩,但又不便于交流。在金华一家小型印刷厂,车间噪声接近90分贝。一位工人说,他每天工作10个小时左右,工厂接单多,他和同事须时刻交流、协同调适印刷机。但“带上防护耳罩就听不见同事说话。”

手机+语音终端,让防噪器具真正奏效

        为了解决上述问题,阿里巴巴机器智能技术实验研发了高工业噪声环境下的语音识别及传输技术。这项技术已经实现在85分贝工业噪声下,将一米处正常音量语音转换为文字,并可发送至手机等设备上。

在高噪声环境下,阿里巴巴工程师正在测试语音识别设备

        “实现高噪声下的语音识别,主要依靠是阵列麦克风技术以及AI语音识别模型。阵列麦克风配合算法,可有效提取出纯净语音信号。AI语音模型则能识别语音信号含义并转换成正确文字。”阿里巴巴语音工程师云铠说道。

        据阿里巴巴介绍,语音转换的过程都在云端完成,只要有网络并配上类似智能音箱的语音终端,便可构建局域性的语音文字转换和传输系统。

        “转换为文字的信息,可指定传输至手机等带显示屏设备。只要一部手机,一个语音终端,便可组建高噪声语音交互系统。” 云铠说。

        目前,阿里巴巴的语音识别技术能在85分贝的噪音环境下,对一米外正常音量语音做到准确识别,按照预期,他们希望能实现在95分贝噪音下的语音识别。

相关推荐