计算机:AI动态跟踪系列(六)-OpenAI o3、豆包新品首发,关注原生Agent与多模态推理

股票资讯 阅读:12 2025-04-18 09:01:00 评论:0

  事项:

  4月17日,OpenAI公司发布o系列模型中的最新款o3和o4-mini,火山引擎发布豆包1.5·深度思考模型等新品。

  平安观点:

  OpenAI o3、o4-mini新增图像深度思考与Agent能力,Codex CLI智能体开源推动AI编程生态开放。o3和o4-mini被称为是OpenAI迄今为止发布的最智能的模型,我们认为,在o1优越能力的背后,核心突破在于运用思维链(chain ofthought)方法来处理复杂任务,而o3和o4-mini的主要突破在于两个能力:1)图像深度思考。首次实现在思维链中用图像来思考,结合高级推理与Web搜索、图像处理等工具(自动缩放、裁剪、翻转或增强图像)。2)Agent能力(代理能力)。OpenAI推理模型首次可以代理使用和组合ChatGPT中的各个工具,包括搜索网络、使用Python分析上传的文件和其他数据、对视觉输入进行深入推理,甚至生成图像。此外,OpenAI进一步推动AI编程生态开放,开源了轻量级编程智能体Codex CLI,仅需OpenAI API key即可零配置启动,开发者可直接从命令行体验多模态推理。

  豆包1.5·深度思考模型对标全球推理模型第一梯队,视觉理解模型实现更强视觉定位能力。火山引擎在4月17日FORCE LINK AI创新巡展·杭州站上,发布豆包1.5·深度思考模型等新品,我们认为以下进展值得重点关注:1)推理模型。性能上,豆包1.5·深度思考模型在数学、代码、科学等专业领域推理任务中表现已经达到或接近全球第一梯队水平,对标DeepSeek R1、QWQ-32B等顶尖模型,并增加了视觉理解能力;功能上,豆包APP基于豆包1.5·深度思考模型进行了定向训练,可以实现“边想边搜”。2)多模态。升级的豆包·文生图模型3.0在最新的文生图领域权威榜单Artificial Analysis竞技场中排名全球第一梯队;新版本豆包·视觉理解模型实现更强的视觉定位能力,可应用于线下门店的巡检场景、GUIagent、机器人训练、自动驾驶训练等。3)企业级服务。面向Agent服务,发布OS Agent、GUI Agent大模型(豆包1.5·UI-TARS),面向大规模推理,发布AI云原生·ServingKit推理套件。

  投资建议:我们认为,近期包括OpenAI、豆包在内发布的新模型,解题思路在此前思维链CoT基础上,更多体现对模型原生Agent能力(即工具使用)以及多模态推理能力的重视。全球大模型领域的竞争依然白热化,我们坚定看好AI主题的投资机会,当前Agent在企业端落地进度较为靠前,AI应用建议关注OA/ERP/编程/办公等领域;算力方面,Agent将带来更多的推理端应用需求,从而拉动推理端算力乃至整体算力需求向上。当前全球贸易摩擦持续演化,从性价比以及供应链安全的角度,我国国产AI算力在国内AI算力市场的接受度将进一步提高,市占率有望进一步提升,我们坚定看好国产AI算力产业链。标的方面:1)AI应用:AI+企服,建议关注泛微网络、致远互联、卓易信息、金蝶国际、税友股份、博思软件、普联软件;AI+办公,推荐金山办公、福昕软件、万兴科技,建议关注合合信息。2)AI算力:推荐海光信息、龙芯中科、浪潮信息、紫光股份、中科曙光、神州数码、工业富联、深信服,建议关注寒武纪、景嘉微、华勤技术、软通动力、拓维信息。

  风险提示:1)AI算力供应链风险上升。2)大模型产品的应用落地低于预期。3)国内大模型算法发展可能不及预期。


平安证券 闫磊,黄韦涵,王佳一
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。