公众号推送机制总在变,为了不失联,请记得点击上方蓝字“芥末堆”→点击右上角“…”→选择“设为星标”,即时获取行业资讯。
图源:Pixabay
♪ 作者|芥末堆 LAN
♪ 编辑|芥末堆
近期,Meta推出了一系列免费且可供商业使用的巨大语言模型——Llama 2.8月3日,阿里云的开源项目通义千问宣布其70亿参数的模型系列,其中包括通用的Qwen-7B模型和对话式的Qwen-7B-Chat模型,这两款模型已在AI模型社区魔搭ModelScope上正式上线,值得一提的是,这两款模型都是开源、免费且可商用的。
据报道,阿里巴巴的达摩院模型开源社区已经正式开放,阿里的云成为我国首个加入这场大型模型开源运动的大型科技企业。
今年四月,我国知名云计算服务商阿里云发布了一款名为通义千问的自研大模型。据科技媒体报道,通义千问Qwen-7B是一款基于Transformer架构的大规模语言模型,经过在超大规模预训练数据上的深度训练而诞生。这些预训练数据涵盖了丰富的网络文本、专业书籍以及代码等领域。作为一款具备多语言处理能力的基座模型,通义千问在超过2万亿token的数据集上进行了训练,其上下文窗口长度更是达到了惊人的8k。此外,通义千问还拥有一款名为通义千问-Chat的中英文对话模型,该模型已经实现了与人类认知的无缝对接。
上月,智谱AI和清华KEG实验室宣布了的一项重要决策,那就是允许ChatGLM-6B和ChatGLM2-6B这两款模型完全免费且商业使用,这一举措旨在为我国的开源社区发展贡献力量。为了实现这一目标,智谱AI和清华KEG实验室在中国中文信息学会社会媒体处理专委会的支持下,联合安硕信息、阿里云、魔搭社区以及北京交通大学,共同推出了一场名为“ChatGLM金融大模型挑战赛”的活动。本次比赛的参赛要求非常明确,那就是参赛者需要以ChatGLM2-6B模型为核心,构建一个完整的问答系统,这个系统需要能够回答用户关于金融方面的各种问题,但是需要注意的是,参赛者不得使用其他的了大语言模型。这样的比赛不仅是对参赛者技术实力的考验,更是对他们对我国金融行业理解和应用能力的考察。
最近,有消息透露,腾讯自研的“腾讯混元大模型”已经进入了实际应用的内测环节,并且已经在腾讯内部的多个业务中得到了应用。
2023年10月17-18日,芥末堆将在北京主办2023GET教育科技大会暨第九届教育消费博览会,今年主题“活力更始:教育与科技的再进一步”,我们在这里诚挚邀请各位伙伴一起参与,做多活力,做多势能。
本文作者:LAN
芥末堆 编辑
用一朵云推动另一朵云
联系邮箱:lanlan.ji@jmdedu.com
欢迎交流,请注明姓名+公司+职位,便于备注
芥末堆共读时间
2023GET教育科技大会暨第九届教育消费博览会
?
国际考试行业协会(亚洲分会)2023峰会
?
球分享
球点赞
球在看
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!