摘要
本周AI行业呈现两大核心张力:一极是开源生态的持续狂飙——MiniMax开源M2.7模型、灵初智能Psi-R2登顶具身智能榜单、Kimi K2.5上线Nscale,国产开源力量多点突破;另一极是算力告急引发的连锁反应——GPU租赁价格数周上涨近50%,OpenAI被迫取消视频项目,Mistral获8.3亿美元融资建数据中心追赶差距。斯坦福2026年AI指数报告显示全球AI采用率首超50%,中美模型性能差距基本消失,但美国私人AI投资仍是中国的23倍。与此同时,日本软银联合八大企业成立万亿级国产AI公司、政府五年投入1万亿日元;OpenAI获得亚马逊最高500亿美元投资,与微软渐行渐远;Harvey完成2亿美元融资估值110亿美元,AI法律代理平台运行超2.5万个。开源狂飙与算力告急的双重变奏,正在重塑AI行业的竞争规则与价值分配。
一、开源生态的中国攻势:MiniMax M2.7与Psi-R2的多点突破
开源领域,本周传来密集的中国声音。
MiniMax正式开源其M2.7模型,在SWE-Pro基准测试中达到56.22%,Terminal Bench 2达到57.0%,展现出业界领先水平。更为关键的是,M2.7是MiniMax首个深度参与自身进化过程的模型,具备构建复杂智能体框架的能力,可通过智能体团队、高级技能和动态工具搜索完成高度复杂的生产力任务。模型发布首日即完成华为昇腾和NVIDIA等芯片平台的适配,用户可通过Hugging Face平台访问。
灵初智能发布的Psi-R2同样引人注目。凭借近10万小时人类操作数据和双模型架构,Psi-R2登顶MolmoSpaces榜单。其策略模型与世界模型协同的设计颇为独特:策略模型学习成功任务轨迹,世界模型Psi-W0通过「梦里试错」建模失败场景。训练数据覆盖294种场景、4821种任务,并包含5417小时真机数据。公司还开源了1000小时高质量人类操作数据集,推动具身智能生态发展。
Kimi K2.5的上线同样值得关注。Moonshot AI开发的Kimi K2.5现已在Nscale推理端点上线。该模型拥有1万亿参数,采用专家混合架构,具备原生视觉处理能力,支持256K上下文窗口。在多项基准测试中表现优异:SWE-Bench Verified达76.8%,BrowseComp达60.6%(优于Claude Opus和Gemini 3 Pro),GPQA-Diamond达87.6%。
这三项发布构成一个共同信号:中国AI开源力量正在从「单点突破」走向「矩阵式布局」,覆盖代码生成、具身智能、多模态理解等多个关键领域。当开源与闭源的差距持续收窄,「开源」本身正在从一种姿态变成一种战略选择。
二、算力告急:GPU价格暴涨与行业洗牌的前奏
与开源狂飙形成对照的,是算力侧的系统性告急。
全球AI算力供应出现严重短缺,NVIDIA最新芯片现货价格数周内上涨近50%,CoreWeave等供应商提价超20%并要求长期合约。OpenAI因算力紧张被迫取消视频项目,Anthropic频繁遭遇系统宕机。Token处理量在数月内翻倍以上,但数据中心建设周期长,产能无法及时跟上。
这场算力危机的深层影响正在浮现。基础设施的滞后已成为制约AI发展的关键瓶颈,行业正从「软件主导」转向「资源密集型」模式。当算力成为硬性约束,企业必须对AI使用进行优先级排序和架构优化——这将倒逼整个行业走向更高效的模型设计和部署策略。
法国AI公司Mistral选择了一条本土化路径。本周Mistral宣布获得8.3亿美元债务融资,用于在巴黎附近建设数据中心,推动欧洲AI基础设施发展并保障数据主权。公司计划到2027年在欧洲建成200兆瓦算力容量,采用NVIDIA GB300 GPU构建定制化AI环境,减少对第三方云服务的依赖。
这个决策背后是欧洲AI自主化的战略考量。当算力成为AI竞争的核心资源,「数据主权」的概念正在扩展为「算力主权」。Mistral的做法代表了非美国AI公司的一种选择:通过锁定本土算力资源,降低对AWS、Azure、Google Cloud的依赖,在地缘政治的缝隙中寻找生存空间。
三、斯坦福AI指数报告:采用率过半、中美差距收窄背后的隐忧
斯坦福大学以人为本的人工智能研究所本周发布的2026年度AI指数报告,为行业提供了宏观视角。
核心发现之一是全球生成式AI采用率三年内达到53%,超过互联网早期普及速度——这个数字意味着AI不再是少数玩家的专属领地,而是正在成为企业运营的基础设施。企业AI应用率升至88%,79%的常规工作已使用生成式AI。
另一个重要发现是中美AI模型性能差距基本消失。中国在论文、专利和机器人部署方面领先,但美国私人AI投资达2853亿美元,是中国的23倍。这个数据揭示了一个深刻矛盾:中国在AI的「产出」侧已与美国比肩,但在「投入」侧——尤其是私人资本的持续投入——仍存在数量级的差距。
报告还揭示了一些令人警醒的趋势。22至25岁美国软件开发者就业率下降近20%——AI对劳动市场的影响已开始显现。AI环境成本同样高企,Grok 4训练碳排放相当于1.7万辆汽车一年排放量。当AI能力指数级增长时,其能耗和碳足迹同样在指数级增长,这将是未来不可回避的议题。
四、日本AI主权梦:软银联合八巨头、万亿日元押注
地缘政治维度,日本本周抛出了一枚重磅棋子。
软银主导,联合NEC、本田、索尼、三大银行、日本制铁等8家企业成立新公司「AI基盤モデル開発」,目标在2030年前构建参数规模达万亿级的国产AI基盘模型,支持文本、图像、音声、影像等多模态处理,并面向机器人自律控制等「物理AI」领域。日本政府通过经济产业省计划在未来5年提供约1万亿日元支持。
这个动作的战略意图非常清晰:应对美中AI领先态势,推动日本AI自主化。日本在半导体制造设备、精密制造等领域拥有优势,但在基础模型层面明显落后于中美。通过政府资金引导、头部企业联合的方式,日本正在试图打破这一困局。
值得关注的是「物理AI」的定位。与单纯追求语言模型性能不同,日本将重心放在机器人自律控制等物理世界上。这既是日本制造业优势的延伸,也是差异化竞争的体现——当全球都在卷语言模型时,日本选择了「身体」这个赛道。
五、企业AI格局生变:OpenAI-亚马逊结盟与Harvey的垂直深耕
企业AI市场本周同样传来重磅消息。
OpenAI获得亚马逊最高500亿美元投资。根据内部备忘录,OpenAI正积极推进与亚马逊的合作以拓展企业市场,减少对微软的依赖。许多企业客户已基于AWS Bedrock平台构建AI应用,自2月底宣布合作以来需求「惊人」。
这个合作的战略意义在于:OpenAI正在微软之外寻找新的盟友。微软曾是OpenAI最大的支持者,但双方的关系正在微妙变化。OpenAI选择AWS作为新的算力伙伴,既是分散风险的商业考量,也是IPO前优化股权结构的需要。
AI法律科技公司Harvey本周完成2亿美元新一轮融资,估值达110亿美元,累计融资超10亿美元。目前Harvey平台上运行超过2.5万个自定义AI代理,服务覆盖全球60多个国家的1300个组织中逾10万名律师。
Harvey的成功代表了一种垂直深耕的模式。在通用AI竞争白热化的当下,在法律等高价值垂直领域建立护城河,可能是中小型AI公司的可行路径。当通用模型趋于商品化时,领域知识和客户关系的价值将更加凸显。
六、安全警报持续:LangChain漏洞与AI开发框架的系统性风险
安全领域,本周的警报声同样密集。
安全研究人员披露LangChain和LangGraph中存在三个关键漏洞:CVE-2026-34070允许通过路径遍历访问任意文件;CVE-2025-68664可通过反序列化泄露API密钥和环境变量;CVE-2025-67644是LangGraph中SQLite检查点的SQL注入漏洞。
由于LangChain和LangGraph广泛用于AI开发框架,这些漏洞可能在整个AI技术栈中产生连锁影响。此前Langflow的漏洞在公开披露后仅20小时即遭利用,凸显快速修补的紧迫性。
这个案例揭示了一个深层问题:AI开发框架的普及速度远超其安全成熟度。当这些框架被广泛应用于企业级AI系统时,其安全漏洞的影响将被放大。「安全」不应是AI发展的奢侈品,而应是基础设施。
AWS本周宣布Amazon Bedrock上线Claude Mythos预览版,同时推出Agent Registry帮助企业管理AI代理部署。这些动作表明,头部云厂商正在将AI安全从「单点防护」升级为「系统性治理」。
七、AI Agent生态加速:从工具链到基础设施的跨越
AI Agent的产品化和生态建设本周继续稳步推进。
Vercel开源Open Agents,为企业构建自有编程Agent平台提供参考实现,其核心架构采用Agent与执行环境分离的设计。腾讯云发布CloudBase CLI V3,专为AI Agent全面重新设计,新增15个顶层命令、内置自解释能力、结构化JSON输出和文档检索功能。
LlamaIndex开源ParseBench,这是Agentic时代首个专注于语义正确性的文档OCR基准测试集。斯坦福团队提出LLM-as-a-Verifier方法,在Agentic基准测试中取得SOTA成绩。这些工具和基准的完善,标志着AI Agent生态正在从「单点能力」走向「系统工程」。
值得关注的是「表格Agent」的兴起。阿里云千问上线「表格Agent」功能,将AI从信息提供者升级为结果交付者——用户只需描述需求,Agent即可直接生成可下载、可编辑的专业Excel文件。这种「端到端」的能力封装,可能是AI Agent大规模落地的关键形态。
结语
回望本周的AI行业图景,两极张力愈发清晰:
开源狂飙。MiniMax M2.7、灵初智能Psi-R2、Kimi K2.5——中国开源力量正在代码生成、具身智能、多模态理解等多个领域同时突破。斯坦福报告显示中美模型性能差距基本消失,开源与闭源的质量差距持续收窄。当开源成为战略选择而非情怀表达,整个行业的竞争逻辑将被改写。
算力告急。GPU租赁价格数周上涨近50%,OpenAI被迫取消视频项目,Mistral砸下8.3亿美元追赶欧洲算力差距。这场危机既是挑战也是机遇——它将倒逼行业走向更高效的模型设计和部署策略,同时加速算力资源的重新分配。
主权竞逐。日本软银联合八巨头、万亿日元押注国产AI;欧盟审查ChatGPT是否应受更严格监管;16家中国科技社团联合发布AI治理倡议。当AI能力成为国家竞争力的核心变量,「AI主权」的概念正在从技术议题升级为地缘政治议题。
企业落地。OpenAI-亚马逊500亿美元合作、Harvey 110亿美元估值、AI Agent工具链的持续完善——这些进展显示,AI正在从「技术展示」走向「商业交付」。当AI能够真正创造商业价值,行业的增长逻辑才能真正闭环。
AI的故事,从来不是单一维度的线性叙事。本周的碎片拼凑出的是一个正在从「技术驱动」转向「技术+资本+资源+治理」多轮驱动的行业格局。理解这个新世界,需要更多的耐心与敬畏。
标签:开源模型、AI基础设施、斯坦福AI指数、AI Agent、算力危机、地缘政治、AI安全
评论