客户端AI推理渗透加速 RTX系列出货预期获上调

事件

过去两周，戴尔、惠普、联想三大PC OEM的季报电话会中均首次单独披露“AI PC”出货占比，三家合计约18-22%，较上季度翻倍。与此同时，Microsoft Copilot+ PC的NPU调用日志显示推理请求量周环比增长31%，部分任务已从Azure云端分流至本地NPU/NVIDIA RTX内核处理。供应链渠道调研显示，RTX 5070/5080笔记本SKU的经销商备货周期从6周压缩至3周，现货溢价维持在8-12%区间。

解读

两个变量驱动推理负载向客户端迁移。其一，TCO再平衡——企业IT预算去年因云端推理成本超支被迫削减，转而部署本地小模型（Llama-3.3 70B级别）替代部分云端API调用，单次推理成本下降约60%。其二，延迟敏感场景涌现：实时视频分析、本地代码补全、离线会议摘要等场景对往返延迟要求<50ms，云端往返普遍超过200ms，客户端推理成为必选。NVIDIA的TensorRT-LLM框架已支持RTX显卡的离线推理，这批需求实质上从AMD MI300和H100手中抢回了部分推理市场份额。

对NVDA的影响

短期1-4周内，客户端业务对NVDA营收贡献的边际权重将上升，成为除数据中心外的第二增长极。判断标准：1）GTC夏季技术大会上NIM（Nvidia Inference Microservices）for RTX的发布内容；2）5月中旬即将披露的4月游戏业务收入指引是否出现上调。若两者共振，NVDA在$850-$920区间获得新的支撑逻辑，回调空间收窄至8%以内；反之，若数据中心订单环比走软，客户端增量或被机构投资者视为“防御性填充”而非结构升级，整体估值扩张逻辑需重新锚定。

注：本文不构成任何投资建议，仅供市场参考。