大模型

大模型Grok-1开源

据外媒报道,马斯克领导的人工智能公司xAI近日宣布,他们的大语言模型Grok-1已正式开源,发布了基本模型的权重和网络架构。从xAI在官网公布的消息来看,Grok-1是拥有3140亿参数的混合专家模型。在目前已开源的大语言模型中,Grok-1的参数是最多的。

科大讯飞推出星火4.0 Turbo

科大讯飞在全球1024开发者节上推出了讯飞星火大模型的最新版本——讯飞星火4.0 Turbo。这一版本在七大能力上全面超越了GPT-4 Turbo,包括数学能力和代码能力。据介绍,星火4.0 Turbo不仅在性能上有所提升,效率也相对提升了50%。在数学能力方面,讯飞星火已经完成了超长思维链、树搜索和自我反思评价等算法验证,并预计在年底前实现类o1的高难度数学能力的显著提升。

新一代中文创作大模型

APUS联合战略合作伙伴波形智能正式发布了共同研发的新一代中文创作大模型,并对APUS“萤火小说”产品进行了升级迭代。据了解,该模型是第一个专门为内容创作研发的大型语言模型,在小说写作、营销文案写作、短视频脚本写作、论文写作等benchmark上皆击败了GPT等通用大型语言模型。

xAI发布新模型Grok-2

埃隆·马斯克旗下AI初创公司xAI今日发布了一款新的聊天机器人Grok-2,声称其性能与竞争对手OpenAI、谷歌和Anthropic的产品相当。周三,xAI展示了这款最新的大型语言模型Grok-2。根据独立AI基准机构的测试,这款模型已经跻身前五大AI聊天机器人之列,仅落后于谷歌的Gemini和OpenAI的ChatGPT等模型。

腾讯混元发布开源加速库

近日,腾讯发布针对腾讯混元文生图开源大模型(以下简称为混元DiT模型)的加速库,让推理效率大幅提升,生图时间缩短75%。混元DiT模型的使用门槛也大幅降低。用户可以基于ComfyUI的图形化界面,使用腾讯混元文生图模型能力。同时,混元DiT模型已经部署至Hugging Face Diffusers通用模型库中,用户仅用三行代码即可调用混元DiT模型,无需下载原始代码库。

用友加速智能化布局

对于大模型在B端的探索,用友可谓先行者。早在去年7月,用友就率先发布了首个企业服务大模型YonGPT,与面向C端的大模型不同,用友YonGPT以打造企业数智化大脑为出发点和立足点,真正改变企业的运营方式,辅助企业做关键业务决策,就像为企业创新和企业转型装上一个强大的“AI引擎”。

腾讯计划投资月之暗面

据市场消息,大模型初创公司月之暗面(Moonshot AI)正在进行新一轮融资,腾讯、高榕创投等机构考虑投资。月之暗面最新一轮的估值报价已达30亿美元。据消息称,腾讯参投可能为微信与月之暗面的聊天机器人kimi之间的更深入合作铺平道路。此前腾讯已经投资了 MiniMax、智谱 AI 和百川 AI。对此,腾讯方面向媒体回应称“不予置评”,月之暗面则向媒体回应称,“我们官方不评论融资消息”。

拼多多杀入大模型

拼多多已经成立了一个数十人的大模型团队,团队位于上海。大模型团队将探索大模型在拼多多客服、对话等场景下的应用,且会拓展至其旗下跨境电商平台TEMU智能客服、搜索、推荐等业务场景。目前,整个进程仍处于研发阶段。行业分析人士认为,拼多多的大模型将为其电商体系进行服务,包括在AI导购、商品图片智能生成等方面的应用。

「天工」大模型开放

昆仑万维「天工」大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务。用户在应用商店下载“天工APP”或登陆“天工官网”均可直接注册使用。「天工」是国内首个对标ChatGPT的双千亿级大语言模型,也是一个AI搜索引擎,一个对话式AI助手。