3 月 4 日消息,基于 ChatGPT 的必应聊天已经让不少用户感受到了 AI 的强大,而微软于近日推出了更为强悍的全能型 AI——Kosmos-1。


ChatGPT 是纯文本 LLM,而它是更强大的多模式大型语言模型(MLLM)。Kosmos-1 可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智能,可以像人类思维一样来处理任务。

研究人员在他们的学术论文中写道:「作为智能的基本组成部分,多模态感知是实现人工智能的必要条件」。Kosmos-1 论文中的视觉示例显示模型分析图像并回答有关图像的问题,从图像中读取文本,为图像编写标题,并以 22-26% 的准确度进行视觉智商测试。

微软表示,它计划向开发人员提供 Kosmos-1,尽管该论文引用的 GitHub 页面在本文发表时没有明显的 Kosmos 特定代码。


责编:聚观365

*此内容归聚观365整编发布,未经聚观365书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。

点赞(0)

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部