首页 行业研报 开源Llama 3.1发布,对端云AI的影响

开源Llama 3.1发布,对端云AI的影响

行业研报 122

  摘要

  Llama3.1发布,开源大模型王者易主。7月24日报道,美国科技巨头Meta推出迄今为止性能最强大的开源大模型——Llama3.1405B(4050亿参数),同时发布了全新升级的Llama3.170B和8B模型版本;Meta评估了超150个基准数据集的性能,Llama3.1405B在代码生成和评估、数学推理、长上下文处理、工具使用和多语言支持等一系列任务中,可与GPT-4o、Claude3.5Sonnet和Gemini Ultra相媲美;在其他场景中,Llama3.1405B进行了与人工评估的比较,其总体表现优于GPT-4o和Claude3.5Sonnet。

  开源引领,加速构建META生态。与闭源模型不同,Llama3.1是公开可用的模型,模型的权重可供下载;Llama3.1开源使得更广泛的开发者及社区可以为其应用程序定制模型,并在任何环境中运行,包括本地服务器、云端、笔记本电脑、甚至手机等,同时无需将数据分享给Meta。同时,Meta透露,其更新了许可证,允许开发人员首次使用包括405B参数规模的Llama模型的输出来改进其他模型。

开源Llama 3.1发布,对端云AI的影响

  未来预期:转向MOE结构,落地三种商业模式。MoE(混合专家模型)是一种基于Transformer架构的模型,旨在提高模型的计算效率和性能。其基本思想是通过多个“专家”网络(子模型)协同工作,根据输入数据的特征动态选择最合适的专家,从而优化计算资源的使用和模型的预测精度。基于Meta的商业模式,我们认为Llama3.1在未来将有以下商业化落地模式:1)云厂商使用费用:谷歌、亚马逊等下游云服务商提供基于Llama3.1模型的服务,Meta将从中收取部分费用;2)通过Meta生态间接变现:在Meta开发的Facebook、Instagram等软硬件产品上使用基于Llama3.1模型的AI助手,从而吸引用户在软件内消费;3)广告服务:基于Llama3.1模型提供广告开发以及精准投放服务,并收取费用。

  风险提示:大模型研发进展不及预期,AI应用落地不及预期,AI算力投入不及预期。

国信证券 熊莉