NIST 发布 DeepSeek V4 Pro 评估报告，逻辑推理性能提升逾 40%

ref

美国国家标准与技术研究院（NIST）下属 AI 安全评估中心（CAISI）于 2026 年 5 月正式发布了对 DeepSeek V4 Pro 的全面测试报告。数据显示，该模型在逻辑推理与数学解题维度的得分较前代版本提升了 42%，并在 CAISI 的对抗性安全测试中实现了 98.5% 的基准通过率。DeepSeek（深度求索）官方对此回应称，V4 Pro 在模型架构与训练稳定性上取得了阶段性突破，已完全符合国际主流的安全合规标准。

随着全球对大模型安全性审查的持续收紧，NIST 的评估结果已成为非美本土模型进入国际政企市场的关键通行证。受此影响，DeepSeek 在北美市场的开发者订阅量预计将在本季度增长 30% 以上。目前，多位业内分析师指出，V4 Pro 极高的推理性价比将进一步冲击现有的高端模型市场格局。另一方面，CAISI 表示未来将针对该模型的跨语言隐私保护能力开展更深入的专项审计。

NIST

CAISI Evaluation of DeepSeek V4 Pro

In April 2026, the Center for AI Standards and Innovation (CAISI) evaluated the open-weight AI model DeepSeek V4 Pro (“DeepSeek V4”).

NIST (www.nist.gov)

WeLinux

NIST 发布 DeepSeek V4 Pro 评估报告，逻辑推理性能提升逾 40%

CAISI Evaluation of DeepSeek V4 Pro