近年来,人工智能(AI)领域经历了重大的变革,尤其是在生成式AI的推动下,越来越多的企业和投资者涌入这个迅速发展的市场。初期的亢奋情绪促使各大公司争相推出具有高算力的大模型,但随着时间的推移,市场开始逐渐冷静,务实成为新趋势。

通用大模型的兴起

AI发展的早期阶段,创投圈对生成式AI的热情空前高涨,许多科技公司投入巨资,致力于开发比以往更强大的模型。其中,以ChatGPT为代表的通用大模型展现了强大的算力,极大地提升了自然语言处理的能力。这些大模型通常需要庞大的计算资源支持,训练时依赖“万亿参数”的规模,使得性能趋于巅峰。

例如,英伟达凭借强大的Blackwell GPU芯片,成为了AI算力市场的领导者,20246月市值突破3.3万亿美元,超越了微软与苹果,成为全球市值最高的公司之一。这一现象不仅显示了AI技术的力量,也突显了其对计算资源的极高需求。


高昂的成本与资源消耗

虽然大模型代表了AI的技术巅峰,但其高昂的部署和运行成本却成为行业面临的重要挑战。随着模型体积的增加,计算资源、存储资源以及能源消耗的需求也水涨船高。这要求企业在投资时必须谨慎,考量未来能否实现投资回报。

数据显示,自2024年初以来,国内AI领域的融资案例大幅减少,融资金额约为2023年的80%。显然,务实的思维逐渐占据上风,投资者更加关注投入的效益和回报。

模型降价潮与新技术的兴起

随着市场的转变,国内模型厂商开始出现降价潮,以争夺市场份额。同时,技术创新也为行业带来新的契机。例如,一些公司通过在推理阶段引入强化学习和思维链等新技术,提升了模型在推理端的能力。这一变化促使行业从单纯的参数竞争,转向更加注重逻辑学习和知识计算推理的新路径,尤其是在金融、医疗和教育等高信息密度领域。

华为在20237月发布的盘古大模型3.0版之后,其5.0版加入了更多行业应用,展现了其从“通用”向“有用”转变的能力。这种模式的变化不仅提高了模型的适用性,也能更好地满足行业特定需求。


小模型崛起:经济与效率的结合

与此同时,小模型的迅速崛起为行业带来了新的活力。这些小规模模型在保持与大模型相当甚至更优性能的同时,显著降低了成本和资源消耗。例如,阿里巴巴推出的Qwen-7B模型,在一次基准测试中展现出超强的得分,而小规模的Qwen1.5-7B的得分更是提升了一倍多。这表明,通过改进训练方法和使用更高质量的数据,小模型同样能够达到卓越的性能。

此外,vivo推出的蓝心端侧模型与微软的Phi系列模型,均在性能和功耗方面进行了优化,展现出小模型在实际应用中的独特优势。英伟达的Minitron小语言模型也是在保持性能的前提下降低了模型规模。

大小模型的协作未来

值得注意的是,AI的未来并不是“大小模型”的简单竞争,而是二者的协作关系。普遍的做法是,先训练出具备强大能力的通用大模型,然后通过筛选数据训练出小模型,从而以更低的成本实现与大模型相媲美的应用效果。这种逐步优化的策略,不仅提高了效率,也降低了资源的消耗。

综上所述,人工智能模型的发展呈现出从大型化到小型化的趋势。这一转变不仅是技术进步的体现,也是市场需求变化的反映。随着大小模型各自的优势被充分发挥,AI行业将迎来更加多元化和务实的发展未来。

点赞(34)

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部