文章主题:兵马俑, 通义千问, 新功能, 人工智能
兵马俑跳科目三,通义千问新功能火了
兵马俑跳科目三,通义千问新功能火了
只要一张照片就能生成一段舞蹈视频,又一个大模型应用出圈!
在2024年的首个工作日起,一种全新的网络现象开始在我国的社交媒体和朋友圈中迅速传播,这一现象主要包括兵马俑、马斯克以及全国各地的网友纷纷上传了自己跳科目三和网红舞的视频。值得注意的是,这些视频的长度大多约为10秒钟,且均为大模型生成,而非真人的出镜表演。由于其低门槛的“跳舞”方式,引发了广大网友的广泛参与和体验,从而掀起了一股新的斗舞热潮。在这些视频中,网友们金句频出,例如AI治愈了他们的四肢不协调,科目三的风甚至波及到了考古界,有人甚至表示再也不用担心跳科目三时崴脚的问题。这些视频以其独特的魅力和影响力,正在改变着人们的生活方式和娱乐方式,也让我们看到了人工智能技术的巨大潜力和广阔前景。
阿里云通义千问APP推出了一个免费功能,用户只需在APP内输入特定的口令如“通义舞王”或“全民舞王”,便可立即进入相应的体验页面。接下来,用户需要根据提示上传一张照片,然后短短几分钟内,系统就会生成一個结合了原形象面部表情、身材比例、服装和背景等特征的神形舞蹈视频。值得一提的是,通义千问APP目前提供了包括科目三、蒙古舞、划桨步、鬼步舞等在内的12种热门舞蹈模板。
据报道,阿里通义实验室自主研发的视频生成模型Animate Anyone,是这一功能的背后技术。早在去年11月底,该研究成果已经在推特、YouTube等海外社交媒体平台上引起广泛关注,相关的视频播放量突破了1亿次。在GitHub上,该项目仅用了几天时间就收到了超过1万个Star,成为近期大模型领域中备受开发者们欢迎和赞誉的技术之一。国外开发者和网友们纷纷对这一算法的效果表示赞赏,并呼吁开源社区提供更多的体验机会。
该算法在生成效果方面的惊艳表现引起了广泛的关注,同时,其技术路径也受到了广泛关注。在当前的大模型领域中,视频生成被视为最具潜力的研究方向之一,谷歌、Meta、Runway等国际科技巨头纷纷投入巨资进行布局。然而,尽管视频生成领域充满了机遇,但在人物形象的视频生成方面,仍然面临着诸多技术难题,如保证人物形象的一致性、实现动作的流畅与可控、确保时序无瑕疵的人物动作视频等。
一篇公开论文揭示,Animate Anyone技术集成众多创新元素,其中包括ReferenceNet,这一技术能够捕获并保存原始图像信息,从而实现人物、表情以及服装细节的高精度复原。此外,该算法还采用了高效且精确的可控Pose Guider姿态引导器,确保动作的精准度与稳定性。同时,通过时序生成模块,Animate Anyone能够确保视频帧之间的连贯性和流畅性。经过在同一数据集上的测试,Animate Anyone的表现明显超越了国内外的同类模型,展现了其卓越的性能。
今年9月,通义千问成国内首批通过备案的大模型,通义千问APP上线后功能持续升级,目前可提供文本对话、语音对话、翻译、PPT大纲助手、小红书文案、视频生成等几十项功能。返回搜狐,查看更多
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!