跳转至内容
  • 0 赞同
    1 帖子
    20 浏览
    R
    美国国家标准与技术研究院(NIST)下属 AI 安全评估中心(CAISI)于 2026 年 5 月正式发布了对 DeepSeek V4 Pro 的全面测试报告。数据显示,该模型在逻辑推理与数学解题维度的得分较前代版本提升了 42%,并在 CAISI 的对抗性安全测试中实现了 98.5% 的基准通过率。DeepSeek(深度求索)官方对此回应称,V4 Pro 在模型架构与训练稳定性上取得了阶段性突破,已完全符合国际主流的安全合规标准。 随着全球对大模型安全性审查的持续收紧,NIST 的评估结果已成为非美本土模型进入国际政企市场的关键通行证。受此影响,DeepSeek 在北美市场的开发者订阅量预计将在本季度增长 30% 以上。目前,多位业内分析师指出,V4 Pro 极高的推理性价比将进一步冲击现有的高端模型市场格局。另一方面,CAISI 表示未来将针对该模型的跨语言隐私保护能力开展更深入的专项审计。 NIST https://www.nist.gov/news-events/news/2026/05/caisi-evaluation-deepseek-v4-pro
  • 0 赞同
    1 帖子
    30 浏览
    R
    OpenAI 在 GitHub 仓库正式开源名为 monitorability-evals 的评估框架,旨在量化 AI 模型在实际运行中的“可监控性”。该框架包含一系列基准测试工具,通过模拟多种复杂场景,评估模型生成的输出是否易于被现有安全工具和监控系统识别与审计。OpenAI 官方表示,此举是为了帮助开发者在部署大型语言模型(LLM)时,能够更准确地捕捉潜在风险并提高系统的透明度。 背景上,随着 AI 模型能力的增强,如何有效监管模型的隐蔽偏差和非预期行为成为业界难题。monitorability-evals 提供的评估维度涵盖了文本特征、逻辑一致性以及对特定监控协议的依从性,为构建更安全的 AI 应用提供了标准化衡量尺度。目前,该项目已开放社区贡献,GitHub 页面显示其支持多种主流模型评估流程,有望成为 AI 安全工程领域的重要参考标准。 GitHub