豆包视觉理解模型发布

5296 阅读 0 评论 82 点赞来源：网友投稿

继大语言模型价格以厘计算之后，视觉理解模型也宣告进入“厘时代”。在火山引擎 Force 大会上，字节跳动正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。

据介绍，豆包视觉理解模型千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比行业价格便宜85％。

火山引擎总裁谭待表示，豆包视觉理解模型不仅能精准识别视觉内容，还具备出色的理解和推理能力，可根据图像信息进行复杂的逻辑计算，完成分析图表、处理代码、解答学科问题等任务。此外，该模型有着细腻的视觉描述和创作能力。

此前，豆包视觉理解模型已经接入豆包App和PC端产品。豆包战略研究负责人周昊表示：“豆包一直在努力，让用户的输入更快更方便”。为此，豆包产品非常注重多模态的输入和打磨，包括语音、视觉等能力，这些模型都已通过火山引擎开放给企业客户。

责编：聚观365

此内容归聚观365整编发布，未经聚观365书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。

本文分类：国内早报
本文标签：豆包大模型视觉理解模型字节跳动
浏览次数：5296 次浏览
发布日期：2024-12-19 09:16:15
本文链接：https://juguan365.com/guoneizaobao/11923.html
声明：本站所有资源均是网上搜集或网友上传提供，本站内容仅供观摩学习交流之用，将不对任何资源负法律责任，如有侵权请及时联系我们，本站将在核实后立即删除。

上一篇 > 小米15 Ultra或已定版
下一篇 > 阿维塔完成C轮融资

评论列表共有 0 条评论

暂无评论

发表评论取消回复

微信小程序

微信扫一扫体验

微信公众账号

微信扫一扫加关注

发表
评论返回
顶部