文章主题:一站式图文, 视频创作, 讯飞星火V2.0多模态能力
原标题:一站式图文、视频创作,讯飞星火V2.0多模态能力重磅升级
大模型通常被认为是无生命力的代码,但事实上,它们也能塑造出具有“血肉之躯”的形象。在8月15日的科大讯飞星火认知大模型V2.0升级发布会上,我们得以一窥虚拟主播以全新的形式向世人展示世外桃源“桃花潭”的壮丽景色,并见证了虚拟外教与刘聪院长进行口语交流时的炫酷表现。这些应用场景的实现,都离不开星火V2.0在多模态能力上的突破,从而使得视频内容制作和英语学习效率得到了显著提升。
中金研报曾经提到,随着大模型等技术的支持,虚拟角色能够实现与用户的实时智能互动,这将极大地增强用户的体验感,从而激活一个庞大的市场潜力。值得注意的是,科大讯飞公司凭借其星火多模态技术,率先将其应用于视频内容生产领域。根据我国电子信息产业发展研究院发布的预测数据,到2023年,我国超高清视频产业的规模预计将达到惊人的4万亿元。此外,视频产业链条覆盖了生产、分发、消费等各个环节,其中仅生产环节市场规模就从2016年的19亿元激增至2022年的3860.7亿元,年均复合增长率高达222.34%。
讯飞星火认知大模型依托多模态技术,成功实现了“虚拟主播”的出镜,这一创新性的应用极大地提升了视频内容的质量和新颖度。不仅如此,该技术还具备化身为“景点导游”、“室内导览”以及“银行客服”等多重身份的能力,从而在旅游、展览、金融等多个领域展现出巨大的价值。据相关资料显示,科大讯飞虚拟人服务已经在各行各业广泛应用,并且与新华社、央视动画、中信银行、中国平安等知名企业建立了合作关系。此外,讯飞虚拟人技术还在北京冬奥会、成都大学生运动会等世界级的体育赛事中得到了精彩的展现,充分展示了其强大的功能和广阔的应用前景。
在科大讯飞星火V2.0发布会上,该企业采取了一项旨在极度简化了使用难度的举措,即升级了其一站式AIGC内容创作平台——讯飞智作2.0。用户只需录制一段长度在3到10分钟之间的视频,然后将其上传至讯飞智作2.0平台进行训练。经过这样的操作,系统就能生成一个与真实人物完全相似的虚拟数字分身,实现了1:1的比例。此外,用户还可以根据需要选择不同的配音风格,赋予虚拟人物多元化的情感表现力。通过这种方式,虚拟人物的语气、语调以及停顿都可以根据内容本身的情绪进行调整,从而呈现出更加生动且充满温情的表演。
在2023年的下半年,许多同类大模型还在文本的“二维”层面挣扎时,我国讯飞星火认知大模型已经突破性地进入了音画“三维”领域,成功实现了AIGC技术在内容生产以及各个行业的“智慧涌现”。与此同时,讯飞星火助手中心所上线的一千多个智能助手,全面覆盖了职场、营销、创作等各类应用场景,从而助力用户全方位地提升工作效率,有效地降低了时间成本。在这个时代,时间无疑是最宝贵的资源。
如今,大模型正在悄无声息、却又影响深远地改变着人类世界。面向未来,正如讯飞董事长刘庆峰所期盼的那样:“今天讯飞星火2.0发布后,我们还会迎来3.0、4.0,希望到那时你已经成为了我们的伙伴,无论是API的开发伙伴、共建行业生态的伙伴、还是做最终应用的伙伴,相信都将成为在星火赋能之下工作和生活更幸福的伙伴。”返回搜狐,查看更多
责任编辑:
一站式图文, 视频创作, 讯飞星火V2.0多模态能力
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!