首届通义千问AI挑战赛启动:720亿参数模型Qwen-72B免费使用,推动AI技术发展

通义千问11mos agoupdate lida
53 0 0

文章主题:首届通义千问AI挑战赛, 通义开源模型家族, AI for Science, 通义千问大模型

666ChatGPT办公新姿势,助力做AI时代先行者!

原标题:首届通义千问AI挑战赛开赛,参赛者可畅玩通义开源模型家族

在12月1日,首届“通义千问AI挑战赛”正式开启,这一盛大的比赛向所有参赛者提供了免费的机会,让他们可以尽情体验通义开源模型家族,其中包括最新发布的720亿参数模型Qwen-72B。主办方为了奖励参赛者的努力,提供了价值50万元的免费云上算力和丰厚的奖金。比赛的两个赛道分别是算法和Agent,其中算法赛道主要关注通义千问大模型的微调训练,目的是通过大量高质量的数据来探索开源模型的代码能力极限;而Agent赛道则鼓励开发者利用通义千问大模型和魔搭社区的Agent-Builder框架,开发出新一代的AI应用,以推动大模型在各行各业的广泛应用。感兴趣的开发者可以从即日起通过天池平台报名参加这次挑战赛。

首届通义千问AI挑战赛启动:720亿参数模型Qwen-72B免费使用,推动AI技术发展

通义千问720亿参数模型宣布开源,部分性能超越闭源GPT-4

原内容为:今天中午,新浪科技报道了一则关于阿里云通义千问720亿参数模型Qwen-72B的开源新闻。这个模型采用了基于3T tokens高质量数据的训练方式,并在10个权威基准测试中取得了最佳成绩,甚至超过了闭源的GPT-3.5和GPT-4。这一成果展示了我国人工智能技术的最新成果和发展水平。

在英语任务领域,Qwen-72B在MMLU基准测试中脱颖而出,荣获开源模型最高分。而在中文任务方面,该模型在C-Eval、CMMLU、GaokaoBench等基准测试中表现优异,甚至超过了强大的GPT-4。在数学推理领域,Qwen-72B在GSM8K、MATH测评中展现出了断层式的优势,超越了其他所有的开源模型。此外,在代码理解方面,Qwen-72B在HumanEval、MBPP等测评中,其表现也显著提升,代码能力实现了質的飞跃。

据阐述,Qwen-72B具备处理最长可达32k字符串的能力,其在长文本理解测试集LEval上的表现甚至超过了ChatGPT-3.5-16k。Qwen-72B的研发团队对其进行了针对性的优化,改进了其指令遵循和工具应用等方面的能力,从而更便于其被下游的应用进行集成。例如,Qwen-72B配备了先进的系统指令(System Prompt)功能,用户只需给出一个关键词提示,就可以轻松地定制AI助手,让大模型代入特定角色或执行相应回复任务。

自从Qwen-72B的开源发布以来,通义千问进一步开放了两个大模型,分别是18亿参数的Qwen-1.8B和音频大模型Qwen-Audio。至此,通义千问已经成功开源了四款大型语言模型,包括18亿、70亿、140亿和720亿参数的模型,同时还推出了视觉理解和音频理解两款多模态大模型,实现了“全尺寸、全模态”的开源目标。

业界最强开源模型,填补中国LLM开源领域空白

首届通义千问AI挑战赛启动:720亿参数模型Qwen-72B免费使用,推动AI技术发展

【在10大权威测评中,通义千问720亿参数模型获得开源模型最优成绩】

首届通义千问AI挑战赛启动:720亿参数模型Qwen-72B免费使用,推动AI技术发展

【通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4】

首届通义千问AI挑战赛启动:720亿参数模型Qwen-72B免费使用,推动AI技术发展

【用户仅用一句提示词就可创建自己的AI助手】

此前,我国的大模型市场尚未涌现出能够与Llama 2-70B相媲美的优秀开源模型。然而,Qwen-72B的出现,不仅弥补了国内这一领域的空白,更以其高性能、高度可控以及高性价比的特点,为用户提供了与商业闭源大模型相媲美的选择。借助Qwen-72B,大中型企业得以开发商业应用,而高校和科研机构则可以开展AI for Science等方面的科研活动。

从1.8B到72B,通义千问率先实现全尺寸开源

Qwen-72B的“向上摸高”策略提升了开源大模型的尺寸和性能上限。相比之下,Qwen-1.8B在发布会上展现出了“向下探底”的能力,使其成为中国迄今为止最小尺寸的开源大模型。这一特性使得Qwen-1.8B具备了在消费级终端部署的潜力,其推理能力甚至能应对2K长度的文本内容,只需3G显存即可实现。

通义千问以其高达720亿的参数规模,成为了业内首个实现“全尺寸开源”的模型。用户现在可以在魔搭社区中,直接感受到Qwen系列模型的强大能力,无需任何中间环节。同时,用户也可以通过阿里云灵积平台的API接口,灵活地调用和使用这个强大的模型。对于那些希望深度定制的用户,阿里云百炼平台提供了完整的解决方案,可以按照用户的需求,定制化打造大模型应用。为了保证模型的稳定性和性能,阿里云人工智能平台PAI对通义千问全系列模型进行了深入的适配,并推出了包括轻量级微调、全参数微调、分布式训练、离线推理验证以及在线服务部署等一系列高效的服务。

首届通义千问AI挑战赛启动:720亿参数模型Qwen-72B免费使用,推动AI技术发展

阿里云是国内最早开源自研大模型的科技企业,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单,得到中小企业和个人开发者的青睐,累计下载量超过150万,催生出150多款新模型、新应用。发布会现场,多位开发者伙伴现身说法,分享了他们用Qwen开发专属模型和特定应用的实践。

阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。

通义千问基座模型持续进化,多模态探索业界领先

通义千问在多模态大模型领域的探索也领先业界一步,当天,阿里云首次开源音频理解大模型Qwen-Audio。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

通义大模型能“听”也能“看”。通义千问8月开源出视觉理解大模型Qwen-VL,迅速成为国际开源社区最佳实践之一。本次发布会又宣布了Qwen-VL的重大更新,大幅提升通用OCR、视觉推理、中文文本理解基础能力,还能处理各种分辨率和规格的图像,甚至能“看图做题”。不论从权威测评成绩还是真人体验的效果看,Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通义千问闭源模型也在持续进化,一个月前发布的通义千问2.0版闭源模型,最近已进阶至2.1版,上下文窗口长度扩展到32k,代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。用户可以在通义千问APP免费体验最新版本的闭源模型。返回搜狐,查看更多

责任编辑:

首届通义千问AI挑战赛, 通义开源模型家族, AI for Science, 通义千问大模型

首届通义千问AI挑战赛启动:720亿参数模型Qwen-72B免费使用,推动AI技术发展

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

© Copyright notes

Related posts

No comments

No comments...