文章主题:语音合成, 科大讯飞, 星火V3.5, 情感超拟人
讯飞星火多情感超拟人合成功能发布,AI语音更具“人情味”
🌟语音合成技术,不仅存在于童年的录音乐趣中,它已经进化为现代科技的闪耀明珠,引领着创新潮流。就像那只风靡全球的“会说话的汤姆猫”,用生动形象的方式展现了其无限可能。🚀然而,真正的挑战在于如何让这项技术在更广泛的场景下深度渗透,触及人们生活的每一个角落。就在4月26日,讯飞星火V3.5春季新品发布,以其卓越的技术实力和创新思维,给出了一个令人眼前一亮的答案。🎯这款产品不仅提升了语音合成的精准度与自然度,更是将娱乐与实用完美融合,为用户带来了前所未有的交互体验。它不仅仅是一款工具,更是一种智能化生活的新趋势。💻🌟让我们期待,未来讯飞星火如何用科技语言,编织出更多丰富且实用的声音故事,让语音合成技术在每一个细节中闪耀,服务于我们的日常生活。🏆
🌟科大讯飞旗下的🌟讯飞星火🔥,作为国内首屈一指的全自主研发大模型,引领了全国产算力训练的潮流。它已迭代到V3.5版本,此次更新更是亮点满满:🚀长文本处理能力升级,让信息传递更加流畅;🖼️长图文创作辅助,提升内容表达的艺术性;🗣️长语音转译无缝对接,打破语言障碍。音频层面,它实现了革命性的飞跃:🎶“多情感超拟人合成”,赋予声音更丰富的情感层次;[“$音复刻”],一言一行,声音如真人再现。🌟讯飞星火,不止于智能,更是创新与技术的完美融合!SEO优化词汇:#科大讯飞# #讯飞星火V3.5# #全国产算力训练# #语音升级# #情感超拟人合成# #声音复刻
如何让语音合成由“千篇一律”进化到“千人千面”?这需要强大的技术储备做支撑。在语音合成领域,Blizzard Challenge是极具影响力的国际赛事,科大讯飞自2006年参赛夺冠以来,就开启了连续14年的冠军之路。这次讯飞星火V3.5新版首发的多情感超拟人合成功能,将全自然语音交互体验带上了新的台阶。
根据发布会上讯飞研究院院长刘聪的演示,这项功能让人机对话变得不再生硬和冰冷,AI女声被赋予撒娇、安慰等拟人化的情感表达,同时传递出困惑、高兴、难过等外化情绪。当刘聪告知“五一”要看演唱会后,AI充满感情地回答道“我都能够想到你在现场欢呼的样子,哈哈,我好羡慕啊”,像是朋友间的一场对话,陪着你一起高兴。
整个演示都感觉是在与真人对话,抑扬顿挫悦耳入心,语气助词恰到好处。根据PPT资料显示,讯飞星火多情感超拟人情绪表达的可感知度达到了85%以上,无限接近于真人的口语表达,生动而富有情感,语气夹杂情调。另外多情感超拟人合成还支持“多语种智能语音”,早在2020年科大讯飞60个语种的语音识别、翻译和37个语种的语音合成就超过了谷歌与微软,达到国际领先水平;而在2024年1月份,科大讯飞发布的讯飞星火V3.5,首批37个主流语种的语音识别效果已超过Open AI语音大模型Whisper V3。
而基于多情感超拟人合成,还带来了另一项实用的功能,那就是“一句话声音复刻”。当年高德地图首创的明星原声播报功能,其实就是基于讯飞的语音合成技术,只不过当时志玲姐姐需要录制一个礼拜的声音。过了几年,随着讯飞语音合成技术的升级,再录制郭德纲原声缩短至1小时。现如今,你只要创建“发音人”,再朗读一段指定文本,人人都可以利用一句话声音复刻功能,轻松复刻出自己的声音。
别以为这是一种炫技的功能,它将能够在家庭亲子场景中扮演重要角色。试想一下,当孩子习惯了每晚在你童话故事的朗读声中熟睡,一旦你出差该怎么办?现在只要利用讯飞星火的一句话声音复刻功能,就能让AI还原你的声音,让孩子在你声音的陪伴下安然入睡。每逢节假日,可爱的孙子看望爷爷奶奶,给他们读书说报,让老人内心暖暖的,一旦孙子回家二老内心总是空落落的。如今有了一句话声音复刻,AI可以模仿聪明可爱的小孙子的声音给老人读书说报,让声音的陪伴温暖而持久。
从技术迭代角度,一句话声音复刻可以视为多情感超拟人合成技术的进阶,赋予声音个性化表达。这个功能的上新,不仅意味着AI丰富的情感表达迈入新台阶,也将会在科技助老、陪伴机器人等方向产生正向价值。“我们希望在安全可控的前提下,能够带给社会更有温度的人工智能体验,能够真的帮助到那些特别需要帮助的人,今天这个世界更需要有温度的科技。”科大讯飞董事长刘庆峰说道。返回搜狐,查看更多
责任编辑: