客户端AI推理渗透加速 RTX系列出货预期获上调
事件
过去两周,戴尔、惠普、联想三大PC OEM的季报电话会中均首次单独披露“AI PC”出货占比,三家合计约18-22%,较上季度翻倍。与此同时,Microsoft Copilot+ PC的NPU调用日志显示推理请求量周环比增长31%,部分任务已从Azure云端分流至本地NPU/NVIDIA RTX内核处理。供应链渠道调研显示,RTX 5070/5080笔记本SKU的经销商备货周期从6周压缩至3周,现货溢价维持在8-12%区间。
解读
两个变量驱动推理负载向客户端迁移。其一,TCO再平衡——企业IT预算去年因云端推理成本超支被迫削减,转而部署本地小模型(Llama-3.3 70B级别)替代部分云端API调用,单次推理成本下降约60%。其二,延迟敏感场景涌现:实时视频分析、本地代码补全、离线会议摘要等场景对往返延迟要求<50ms,云端往返普遍超过200ms,客户端推理成为必选。NVIDIA的TensorRT-LLM框架已支持RTX显卡的离线推理,这批需求实质上从AMD MI300和H100手中抢回了部分推理市场份额。
对NVDA的影响
短期1-4周内,客户端业务对NVDA营收贡献的边际权重将上升,成为除数据中心外的第二增长极。判断标准:1)GTC夏季技术大会上NIM(Nvidia Inference Microservices)for RTX的发布内容;2)5月中旬即将披露的4月游戏业务收入指引是否出现上调。若两者共振,NVDA在$850-$920区间获得新的支撑逻辑,回调空间收窄至8%以内;反之,若数据中心订单环比走软,客户端增量或被机构投资者视为“防御性填充”而非结构升级,整体估值扩张逻辑需重新锚定。
注:本文不构成任何投资建议,仅供市场参考。