文章主题:阿里云, CTO, 周靖人, 通义千问
4月7日,阿里云公开“阿里版GPT”通义千问邀测入口引发关注。4月11日,阿里云智能CTO周靖人在北京云峰会现场宣布,将开放通义千问的能力,帮助每家企业打造自己的专属大模型。未来阿里所有产品也将接入通义千问进行全面改造。
阿里云CTO周靖人。
我很荣幸地向大家推荐通义千问,这是我国人工智能领域中最新加入的“通义”模型家族成员。通义千问是一款超大型语言模型,具备出色的理解能力,能够识别并解读人类的指令,进而与用户展开深入的多轮互动。此外,它还整合了多元化的多模态知识处理能力,并能与各种外部增强型API实现互联互通。这些特点使得通义千问在功能上超越了一般的人工智能助手,为用户提供更为智能化、人性化的服务体验。
在周靖人的现场演示中,展示了通义千问的多项能力,其中包括出色的多轮对话能力以及强大的文案创作力,涉及小说续写、邮件撰写和企业策划等多个领域。此外,它还拥有丰富的多语言技能和多元化的多模态能力。然而,值得注意的是,目前开放的邀请测试入口仅针对文字对话功能。
据消息报道,钉钉和天猫精灵已率先加入测试,并在经过评估认证后,将正式推出全新功能。钉钉的Demo展示了一种类似于微软Copilot“副驾驶”的设定,让用户能够随时随地召唤AI助手。在钉钉文档中,通义千问能够创作诗歌、小说、撰写邮件以及制定营销策划方案等各种办公任务,全方位地协助用户进行工作。同时,在钉钉会议上,通义千问还能实时生成会议记录,并自动总结会议纪要,生成待办事项。除此之外,钉钉还展示了拍照生成小程序的场景,只需上传一张功能草图,无需编写任何代码,就能立即生成订餐轻应用。
通义千问具备多轮对话能力、文案创作能力。
天猫精灵官方预告的演示Demo表明,新接入通义千问系统后的天猫精灵,能够实现自由对话,用户可以随时打断或切换话题,并根据需求和场景生成相应的内容。例如,用户在跑步时可以要求天猫精灵 “合成1小时歌单,50%穿插摇滚风格的歌曲”,或者与天猫精灵探讨文化及人生。新天猫精灵不仅可以回答小朋友的各类难题,还能与用户共同创作新的故事,如”宇宙大爆炸”。
发布会后,阿里云智能CTO周靖人接受南都采访时表示,阿里体系内产品何时完成AI化升级改造并未有时间表,目前还有很多探索性的工作,“在智能化时代,如何利用好这些模型,能够把它结合在自己的业务体系里面,这是大家所面临的同样的机遇。”
在探讨通义千问与OpenAI旗下ChatGPT之间的能力差异时,周靖人毫不掩饰地表示:“ChatGPT在各个领域均保持着优势,这是科技发展的必然结果。目前,我们都在努力跟上它的步伐,尽可能地提升自己的技术水平。在这个阶段,ChatGPT的技术优势尤为明显,我们需要持续追踪并努力弥补自身的不足。期待在下一个阶段,通义千问也能为技术创新贡献自己的力量。”
周靖人接受包括南都
在内的媒体采访摘要
记者:目前阿里大模型的整体规划是怎么样的,未来有什么目标?
周靖人:阿里算是中国最早投入大模型研究的公司之一,我们从2019年开始,就在做各种各样预训练大模型的研发,一直以来,我们认为大模型正在从多模态、自然语言、视觉等各个方面逐渐逼近于人的智慧,能够把我们的相关知识体系、推理能力逐渐融合在一起。
今天发布的通义千问其实是我们在这条既定技术路线上面的产品,也是向大家展示我们过去几年的工作,但这并不代表我们最终的技术成果,因为我们还在不断地探索,包括阅读、自然语言、视觉、语音等方方面面都是我们持续创新和突破的方向。
记者:阿里所有的APP接入通义千问有没有时间表,进度有多快?
周靖人:我们目前没有一个时间表,我觉得今天这部分的工作,也有一定的探索性的元素在里面,如何能够使用好这个模型,其实就像CEO张勇讲的,今天包括阿里在内的所有企业,都是在同一起跑线上。这并不是一蹴而就的,如何能够把模型的能力真正发挥出来,能够结合在自己的业务体系里面来,需要业务系统的创新。
今天,通义千问为大家展示了一种技术能力,然而要将这种能力转化为实际业务应用,仍需大家共同努力与探索。只有通过携手合作,我们才能充分发挥千问模型所具备的潜力。
记者:在您自己的评估中,通义千问跟ChatGPT对比,水平如何?
周靖人:坦诚讲GPT在各个方面都是处于一个领先地位,这是科技进步的一个必然阶段,今天大家是你追我赶,在这个阶段,它的很多技术比较领先,这是我们需要去补偿的,需要不断弥补我们一系列的不足,希望下个阶段,千问也能够贡献自己的一系列技术的创新。
但千问并不是为了针对ChatGPT而做的,我们其实在大模型的研究方面,一直坚持了自己的路线,过去做了多模态,做了视觉,又做了自然语言等等,其实今天千问只是我们在预训练大模型上探索的一个方面或者一个节点,也并不代表它是一个终态。
我相信ChatGPT的发布,最大的价值之一就是把整个语言模型的潜力发挥出来,今天这个潜力还有巨大的空间,还有非常多令人无限遐想的应用场景,我们期待接下来和大家一起不断创新,不光是技术的创新,也包括业务体系的创新。
记者:怎么样做到把模型的训练和运行成本降到1/10或者1/100?
周靖人:这有很多的技术细节。比如模型训练,涉及到如何有效地把所有的资源用起来,也许你可能用到了几千张卡,如果某一个时间点只有几百张卡在跑,其他的卡都闲置掉,其实在无形之中没有有效的把资源应用起来。具体一点,包括分布计算的执行图,怎么做动态的优化,怎么避免网络的拥塞等等,都是非常细致的工作,才能真正把训练一个模型的效率提升。甚至今天用更少的计算资源,能解决更大规模的模型训练的问题。
模型在服务这部分也是类似的情况,包括如何做到模型的压缩,模型的裁减,模型知识的蒸馏等,如当我们进入到一个专属模型,真正在部署的时候,如何对专属模型进行进一步成本的降低,能够有效的把真正解决行业问题所需要的那部分智能保留,把其他部分的智能能够节省下来,这中间有非常多的技术的创新和技术的突破,这正是阿里云在这方面比较有优势的地方。
记者:为企业定制的专属大模型和现在的通用大模型有何不同?
周靖人:通义千问是一个通用大模型,并不是为某一个业务问题去优化或者定制的,更多是从整个知识体系方面做的一系列融合。应用到实际场景中,每个企业有自己特殊的需求,有很多行业知识和经验,把这些知识体系,也融入到大模型里面来,这是今天我们企业专属大模型要解决的一个问题。
背后的实现路径之一是,我们会为企业提供一个专门的数据空间,企业能够把它相关的信息放入到这样一个数据空间,这个数据空间是完完全全隔离、安全的,也是专属的。企业在把相关信息注入到数据空间的时候,不需要做任何的数据预处理,不管是PPT的方式还是PDF方式,还是Word的方式,甚至以前一些手册、图片、视频的方式,都可以授权到今天的数据空间里面来。我们会提供一键式生成大模型的能力,在企业的授权下去理解相关企业的各种模态的数据,有效地跟通义千问结合在一起,让千问能够深刻了解企业所处的行业,吸取行业知识,帮助解决行业特定问题。
另外一种方式是通过API的方式,把模型的能力释放出来,我们需要更多的开发者,让开发者通过API,通过SDK把模型的能力、模型的应用场景拓宽,能从而产生更大的业务价值。
采写:南都记者 马宁宁
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!