喜马拉雅AIGC项目荣获工信部“超卓互联网应用”称号
时间:2023-03-24 11:30:49 来源: 网络 阅读量:5063 会员投稿
近日,喜马拉雅的“单田芳大师声音重现”项目在2022年度工业和信息化部新闻宣传中心(人民邮电报社)“ICT优秀案例”征集活动中,荣获“超卓互联网应用”荣誉称号,这肯定了喜马拉雅通过技术不断创新内容生产方式、赋能音频行业发展所作出的努力。喜马拉雅已成为音频领域AIGC的先行者,推动着音频行业的技术革新。
喜马拉雅始终坚持以科技赋能文化,通过AI技术,赋能创作者、服务用户。如今,喜马拉雅正在现有的“UGC+PGC+PUGC”内容生态之外,探索多模态AIGC的更多可能性。单田芳大师声音重现项目是喜马拉雅AIGC的标杆项目,喜马拉雅通过TTS(文字转语音)技术完美还原已逝的单田芳先生的声音,首次将单田芳先生的AI合成音全新演绎听众耳熟能详的经典之作。截至目前,喜马拉雅已上线100多张运用单老AI合成音制作的AIGC专辑,总播放量超过1亿。其中,有15张专辑播放量破百万,例如,《民国四大家族》播放量近730万,《十二金钱镖》播放量近700万,《卧虎藏龙全集》播放量超390万。
这一项目所使用的TTS技术由喜马拉雅珠峰智能实验室自主研发,该实验室定位于新一代数字出版平台技术研发,长期专注于语音合成、识别、语音信号处理、编解码以及智能音效的研究和开发,由喜马拉雅首席科学家卢恒博士带领。目前,这一实验室已在多种技术的研究和应用上取得了突破。
喜马拉雅自研的TTS前端文本处理分析模块已经能够高精度、全自动地对文本进行多音字识别、韵律预测和风格分类,并已开发出可以实现多情感、多风格、多语种声音的TTS技术模型,不仅可以演绎不同情绪的文字,还可以自动区分旁白、对白,并支持英文,极大地丰富了TTS能表达的情感和韵律,这让单田芳先生声音的重现成为可能。为了最大程度保留单老那苍劲、沙哑的独特嗓音以及情感充沛、跌宕起伏的评书腔调,喜马拉雅珠峰智能实验室还通过自主设计单独的韵律提取模块,让单老的AI合成音仿佛本尊再现。
喜马拉雅成多情感、多风格、多语种声音的TTS技术模型可广泛运用于图书、期刊、报纸、新媒体等多种内容的数字出版、语音修复、语音再现等。另外,AIGC制作速度快、成本低,这极大地革新了音频行业的内容生产方式,让内容生产更高效。
目前,喜马拉雅已经与近百家网络平台和出版机构合作,运用TTS技术上线近6万张AIGC专辑。不仅为上游出版产业数字化转型提供技术平台支持,通过数字化分发提高其经济效益,也让下游用户能更便捷地享受边听边看的内容消费体验。
同时,喜马拉雅也通过AIGC也进一步赋能创作者,帮助其高效生产音频内容,推动创作者布局音频,让作家、撰稿人、主播等内容创作者能更轻松地将内容通过声音带到用户耳边。
目前,喜马拉雅已申请了20多项语音技术相关专利,其中有10多项TTS语音合成相关专利, 还有两项语音技术成果先后被世界顶尖学术会议“2022年IEEE国际音频、语音与信号处理会议”收录。除了TTS技术,喜马拉雅在其他技术领域也成果颇丰。2022年8月,喜马拉雅ASR技术在SpeechIO TIOBE评测中获得第一名。 同时,喜马拉雅还通过AI文稿、喜马拉雅专属音效、全景声长音频内容打造、喜韵音坊AI剪辑工具等,赋能创作者、服务用户,让内容生产提效,让内容体验增值。未来,我们将有望看到更多AI技术在喜马拉雅平台上落地生根,推动着音频行业不断发展。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
- HUD能否取代仪表盘?看理想L9的设计师怎么说2023-09-27
- 高塔复合肥价格多少钱一吨?2023-09-27
- 喝粤式早茶,手敲桌面3下啥意思?弄懂6大规矩,服务员2023-09-27
- 什么是角质?为什么要去角质?2023-09-27
- 蛋价上涨,现在鸡蛋价格多少钱一斤?2023-09-26
- 好心情穿出来!你也可以驾驭的多巴胺穿搭2023-09-26
- 炖鱼总是有腥味?葱姜蒜靠边站,多加一勺它,腥味全无,2023-09-26
- 女人如何培养气质2023-09-26