阿里达摩院发布新一代自研语音AI芯片技术

编辑：Olivia 发布：2019-08-21 15:38

8月22日，在美国旧金山举行的HOTCHIPS上，阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术——Ouroboros，该技术能将语音生成算法的计算效率提高百倍以上。这是业界首款专用于语音合成算法的 AI FPGA芯片结构设计。

针对 ASIC 实现的性能仿真预估表明， Ouroboros 的设计可以实时运行 WaveNet 等业界先进的文字转语音(TTS，Text-to-Speech)算法，实现实时语音合成。

算法很好但难以进行实时计算是语音芯片的行业难题。Ouroboros的突破在于它使用了端上定制硬件加速技术，替代云端服务器，有效避免了对网络连接和云端服务的强依赖性，解决了这一问题。以计算量最大的AI语音合成算法WaveNet为例，为了生成1秒的语音，CPU和GPU需要消耗50秒的计算时间，但Ouroboros在FPGA环境下只需要 0.3秒，大大提升计算效率，同时将整体服务成本降低 10 倍以上。

阿里用户在使用天猫精灵、高德导航、智能点餐机等服务时，将率先得到媲美真人语音交互的体验。

阿里发布的 Ouroboros 技术，同样适用于达摩院于今年 7 月发布的新一代的语音合成算法KAN-TTS。该算法将商用系统里的合成语音与原始语音的相似度提高到97%以上，是目前业界体验最好的语音生成算法。自研算法与自研AI芯片设计的结合，意味着阿里在语音生成领域实现了真正的“软硬一体化”计算结构的落地。

据了解，Ouroboros 芯片技术除了语音合成之外，还将支持AI语音识别。基于 Ouroboros 研发完整的语音AI芯片，有望率先在天猫精灵上落地。

推荐：电脑用的少，手机扫一扫，资讯快一步！

CFM闪存市场

阿里达摩院发布新一代自研语音AI芯片技术

推荐：电脑用的少，手机扫一扫，资讯快一步！

产业推荐更多»

周边看点更多»

CFM闪存市场

阿里达摩院发布新一代自研语音AI芯片技术

推荐：电脑用的少，手机扫一扫，资讯快一步！

本文标签:

产业推荐 更多»

周边看点 更多»

产业推荐更多»

周边看点更多»