大模型

文心大模型4.0 Turbo发布

百度WAVE SUMMIT 深度学习开发者大会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布文心大模型4.0 Turbo,速度更快,效果更好。目前文心大模型4.0 Turbo网页版、APP、API陆续面向用户开放。企业用户即刻起登录百度智能云千帆大模型平台即可使用API服务。

AI产业的大模型赛道迎来“开源热

随着科技的疾驰,人工智能已逐渐成为当今世界最炙手可热的焦点。尽管人工智能、大模型的发展频频陷入“抄袭”的泥潭,但我们不能忽视的是,这些技术正在为各行各业的进步“添砖加瓦”。近日,中国电信宣布将自主研发的星辰大模型全面开源,同时开放1T高质量清洗数据集,正式成为央企中首个完成LLM开源的“选手”。

xAI将推出Grok-2大模型

据媒体报道,在3月份推出Grok-1.5,4月份推出Grok-1.5V之后,由马斯克创立并领导的人工智能初创公司xAI,在今年还将对Grok系列大模型进行两次重大更新,先后推出Grok-2和Grok-3。Grok-2和Grok-3大模型将在今年推出,是由马斯克在社交媒体上透露的,其中Grok-2将在8月份推出,Grok-3则是将在年底推出。

Anthropic推出Claude 3系列

据外媒报道,去年年初开始的生成式人工智能及人工智能大模型热潮目前仍在继续,各大厂商在不断升级他们的模型,作为OpenAI强力竞争对手的Anthropic,就已推出了他们新一代的Claude系列大模型。Anthropic新推出的是Claude 3系列大模型,有三个版本,分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,三版本模型按能力升序排列,为用户提供更多的选择,便于他们根据智能程度、速度和成本,选择适合他们需求的特定模型。

Meta发布Llama 3.1 405B

Meta推出开源模型Llama 3.1,包括3个大小版本,分别是迄今为止最强大的开源模型Llama 3.1 405B,以及全新升级的Llama 3.1 70B和8B模型。Meta CEO扎克伯格的公开信也在官网贴出,他指出,开源大模型正在迅速缩小差距。去年,Llama 2 还只能与上一代闭源模型性能相当。

紫光云发布紫鸾5.0云平台

近日紫光云公司正式发布全新一代“紫鸾5.0云平台”, 全面拥抱云原生、大数据和大模型等技术升级,该平台集成了六大焕新能力:全栈国产化、全面AIGC、数据要素全流程、应用敏捷开发、应用智能运维和政企行业数字化。随着AI产业爆发,各行各业都将被AI重塑,而AI的发展离不开算力的支撑。紫鸾5.0围绕PaaS+MaaS+SaaS进行产品布局,为AIGC落地提供全面支撑。

xAI发布新模型Grok-2

埃隆·马斯克旗下AI初创公司xAI今日发布了一款新的聊天机器人Grok-2,声称其性能与竞争对手OpenAI、谷歌和Anthropic的产品相当。周三,xAI展示了这款最新的大型语言模型Grok-2。根据独立AI基准机构的测试,这款模型已经跻身前五大AI聊天机器人之列,仅落后于谷歌的Gemini和OpenAI的ChatGPT等模型。

「天工」大模型开放

昆仑万维「天工」大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务。用户在应用商店下载“天工APP”或登陆“天工官网”均可直接注册使用。「天工」是国内首个对标ChatGPT的双千亿级大语言模型,也是一个AI搜索引擎,一个对话式AI助手。

大模型Grok-1开源

据外媒报道,马斯克领导的人工智能公司xAI近日宣布,他们的大语言模型Grok-1已正式开源,发布了基本模型的权重和网络架构。从xAI在官网公布的消息来看,Grok-1是拥有3140亿参数的混合专家模型。在目前已开源的大语言模型中,Grok-1的参数是最多的。

科大讯飞推出星火4.0 Turbo

科大讯飞在全球1024开发者节上推出了讯飞星火大模型的最新版本——讯飞星火4.0 Turbo。这一版本在七大能力上全面超越了GPT-4 Turbo,包括数学能力和代码能力。据介绍,星火4.0 Turbo不仅在性能上有所提升,效率也相对提升了50%。在数学能力方面,讯飞星火已经完成了超长思维链、树搜索和自我反思评价等算法验证,并预计在年底前实现类o1的高难度数学能力的显著提升。