外媒《The Information》报导,知情人士透露DeepSeek(深度求索)即将推出最新模型R2,不过由于执行长梁文锋仍对表现不满意,将调整优化至梁文锋认可后才会放行,日期未定。
报导指出,就算R2发布后的表现优于其他开源模型,中国云端服务供应商恐怕也无法应付客户需求,主因在于客户目前多半是透过云端上部署的辉达(NVIDIA)降规版AI晶片H20来运行上一代模型R1,但这些云端服务供应商正面临辉达晶片日益短缺问题。
报导指出,在美国一步步收紧对AI晶片的出口限制下,DeepSeek以相对受限的运算资源实现模型效率、R1模型年初推出后掀起外界对中国技术突破重围的讨论,但是美国4月针对辉达H20晶片祭出出口管制的效果正在发酵,凸显中国仍高度依赖美国技术。
R1发布后,中国云端服务供应商、开发者、国营企业、政府机构竞相使用,这款模型以辉达的硬体和软体进行训练,在辉达晶片上运行表现最好,使R1和H20成了绝配。
为满足需求,阿里巴巴、字节跳动、腾讯等中国企业今年前3个月订了约120万颗、总值高达160亿美元(约4800亿新台币)的H20晶片;不过,美国出口管制粉碎了中国企业想要囤积更多H20的希望。辉达执行长黄仁勋曾表示须认列高达55亿美元损失。
据中国云端服务供应商员工的说法,DeepSeek和中国企业保持著联系、提供技术规格以协助企业规划如何使用即将发布的R2模型,包含须「准备足够数量的H20晶片」。
根据中央社,中国企业目前仅能仰赖现有的H20库存,这将限缩R2的使用。尽管华为和中国其他晶片商提供了辉达晶片的替代方案,但由于辉达晶片和DeepSeek模型的相容性,中国云端服务供应商若改用中国制晶片,不仅模型效率会降低,管理上也将更为不易。
