跳转至内容
  • 0 赞同
    1 帖子
    8 浏览
    R
    据 The Information 援引两位知情人士报道,DeepSeek 首轮外部融资的目标规模已升至最高 500 亿元人民币(约 73.5 亿美元),将成为中国 AI 公司迄今规模最大的单轮融资。此前 5 月 6 日的报道显示融资估值约为 450 亿美元,由大基金领投;而本次 The Information 披露的最新进展新增了一项关键细节:DeepSeek 创始人兼 CEO 梁文锋将在本轮中认购最大份额,以维持其对公司的主导控制权——这一安排与此前市场担心融资会稀释创始人话语权的预期有所出入。融资所得将主要用于扩充算力基础设施并向员工提供股权激励,后者被认为是遏制人才流失的关键举措。 商业化方面,The Information 称 DeepSeek 已向部分投资者表示将加快模型发布频率,使其更贴近行业主流节奏;公司计划于 6 月发布 V4 模型的更新版本。此前 DeepSeek 以研究实验室模式运营,收费极低且开放权重,盈利路径长期存疑;本次融资伴随的商业化加速承诺,是其向投资者提供的最明确的营收规划信号。 The Information
  • 0 赞同
    1 帖子
    15 浏览
    R
    据《金融时报》援引四位知情人士报道,中国集成电路产业投资基金(俗称"大基金")正与 DeepSeek 洽谈领投其首次对外融资,拟议估值约 450 亿美元,但本轮融资的具体规模与参与方尚未敲定。大基金为国家主导的半导体专项投资载体,现有持股名单涵盖中芯国际等国内头部芯片企业。DeepSeek 由量化私募幻方科技创始人梁文锋于 2023 年创立,此前拒绝了来自国内头部风投及大型科技公司的多轮融资邀约,完全依靠幻方自有资金运营。 背景上,约三周前的 4 月 18 日,The Information 曾报道 DeepSeek 拟以 100 亿美元估值融资至少 3 亿美元,而此番 FT 披露的 450 亿美元估值较彼时已大幅跳升,折射出市场对其热度的持续升温。4 月 24 日,DeepSeek 正式发布旗舰模型 V4,该模型采用混合专家架构,参数规模达 1.6 万亿,支持百万 token 上下文窗口。据 Grey Journal 此前报道,腾讯曾提议收购 DeepSeek 最多 20% 股权,阿里巴巴亦据报参与谈判,但 DeepSeek 对出让大额股权态度审慎。 FT | Reuters
  • 0 赞同
    1 帖子
    20 浏览
    R
    美国国家标准与技术研究院(NIST)下属 AI 安全评估中心(CAISI)于 2026 年 5 月正式发布了对 DeepSeek V4 Pro 的全面测试报告。数据显示,该模型在逻辑推理与数学解题维度的得分较前代版本提升了 42%,并在 CAISI 的对抗性安全测试中实现了 98.5% 的基准通过率。DeepSeek(深度求索)官方对此回应称,V4 Pro 在模型架构与训练稳定性上取得了阶段性突破,已完全符合国际主流的安全合规标准。 随着全球对大模型安全性审查的持续收紧,NIST 的评估结果已成为非美本土模型进入国际政企市场的关键通行证。受此影响,DeepSeek 在北美市场的开发者订阅量预计将在本季度增长 30% 以上。目前,多位业内分析师指出,V4 Pro 极高的推理性价比将进一步冲击现有的高端模型市场格局。另一方面,CAISI 表示未来将针对该模型的跨语言隐私保护能力开展更深入的专项审计。 NIST https://www.nist.gov/news-events/news/2026/05/caisi-evaluation-deepseek-v4-pro
  • 0 赞同
    1 帖子
    31 浏览
    R
    据《金融时报》援引知情人士报道,华为基于已收到的订单预计其 2026 年 AI 芯片收入将达约 120 亿美元,较 2025 年的 75 亿美元增长逾 60%。核心催化剂是 DeepSeek V4 于 4 月 24 日发布——该模型经针对华为硬件优化并在 Ascend 950 系列上完成训练,华为随即宣布整个 Ascend SuperNode 产品线全面支持 DeepSeek V4,阿里巴巴、字节跳动、腾讯等中国互联网巨头随后密集下单。本年度绝大多数订单集中于最新款 Ascend 950PR,该芯片由中芯国际 N+3 工艺制造,3 月进入量产,分析师估计其性能介于英伟达 H100 与 H200 之间;华为目标全年出货 75 万颗,全面放量预计在下半年。此外,华为计划在第四季度推出 Ascend 950DT 升级版。DeepSeek 亦预告,随着 950PR 产能扩张,V4-Pro 价格有望在 2026 年下半年进一步下降。 此轮增长直接折射出中国 AI 基础设施市场的深层结构性变化。TrendForce 预测中国高端 AI 芯片市场 2026 年整体增长逾 60%,国产芯片有望占据约一半份额。与此同时,出口管制对供给端构成持续约束——先进制程光刻设备的禁运使中芯国际扩产受限,需求远超产能的局面已推动 Ascend 950 系列芯片价格上涨约 20%。路透社表示暂未独立核实 FT 报道,当前数字为基于订单的预测而非已确认收入。英伟达方面,其 H20 芯片此前亦遭美国政府限制对华出口,进一步加速了中国科技企业转向国产替代的节奏。 FT | Reuters | Yahoo Finance
  • 0 赞同
    1 帖子
    28 浏览
    R
    DeepSeek 4 月 30 日在 GitHub 发布技术报告《Thinking with Visual Primitives》,提出一种新的多模态推理范式——不再依赖纯文字描述或更高分辨率图像,而是在模型的推理轨迹中直接嵌入空间标记(点坐标与边界框)作为"最小思维单元",以此弥合所谓"Reference Gap":自然语言在描述密集空间布局时固有的歧义性,往往导致模型在推理过程中出现逻辑崩塌与幻觉。类比人类用手指逐个数数或在迷宫中用指尖描绘路径,该框架让模型"边指边推理",将抽象语言概念锚定到具体物理坐标。模型底层架构基于 DeepSeek-V4-Flash,将每 4 个视觉 token 的 KV Cache 压缩为单一条目,大幅降低图像 token 消耗;在计数与空间推理基准上,该紧凑规模模型的得分与 GPT-5.4、Claude Sonnet 4.6、Gemini 3 Flash 相当——团队特别注明这些分数仅覆盖与本研究直接相关的维度子集,不代表模型的整体能力。 模型权重将在未来整合进 DeepSeek 基础模型后一并开源,近期计划先公开内部基准与部分冷启动数据;代码以 MIT 许可证授权。这是 DeepSeek 在 V4 发布后一周内首次正式披露多模态方向的技术进展,也与此前社区观察到识图模式(Vision)灰度上线相互印证——尽管二者聚焦层面不同,本报告更偏向"推理时空间锚定机制"这一基础研究课题。 GitHub - deepseek-ai/Thinking-with-Visual-Primitives https://github.com/deepseek-ai/Thinking-with-Visual-Primitives
  • 0 赞同
    1 帖子
    35 浏览
    R
    GitHub 明星数达 36.3 万、全球最受关注的开源 AI Agent 框架 OpenClaw 于 4 月 24 日发布新版本,正式将 DeepSeek V4 Flash 设为默认大模型,同时上线 V4 Pro 供用户切换——意味着全球每个更新 OpenClaw 的用户,开启对话时底层默认调用的已是 DeepSeek V4 Flash。新版本同步修复了 DeepSeek 在多轮工具调用中 thinking 与 replay 的行为问题,补齐 reasoning_content 缺失时的占位逻辑,提升长链路 Agent 任务的稳定性。此外,OpenAI gpt-image-2 图像生成与参考图编辑功能通过 Codex OAuth 打通,无需额外 OPENAI_API_KEY;OpenRouter 侧同步支持 image_generate 工具。 功能扩展方面,Google Meet 被内置为 bundled participant plugin,支持个人 Google 账号授权、Chrome 与 Twilio 实时音频传输、麦克风权限处理与标签页复用,会议结束后可自动导出转写内容、智能笔记与参会人会话记录为 Markdown 文件;Voice Call 与 Talk 也同步支持实时语音调用完整 OpenClaw Agent,电话中的问题可经由 openclaw_agent_consult 交后台 Agent 处理后以语音返回。浏览器自动化新增 viewport 坐标点击作为控件识别的兜底方案,默认 action budget 延长至 60 秒。架构层面,模型目录改为从 manifest 静态加载,减少启动时枚举开销,并移除旧版 Pi-only 的 api.registerEmbeddedExtensionFactory 接口,要求插件开发者迁移至 api.registerAgentToolResultMiddleware。 GitHub - openclaw/openclaw | 新浪财经 https://github.com/openclaw/openclaw/releases
  • 0 赞同
    1 帖子
    26 浏览
    R
    DeepSeek 官方 API 定价页更新,V4-Pro 限时 2.5 折优惠期由原定 5 月 5 日延长至北京时间 2026 年 5 月 31 日 23:59;同时标注全系列模型缓存命中输入价格降至首发价 1/10 的调整自 4 月 26 日 20:15 起生效。两款新模型 deepseek-v4-flash 与 deepseek-v4-pro 上下文长度统一为 1M、最大输出 384K,均支持非思考与思考模式切换;JSON Output、Tool Calls 与对话前缀续写均支持,FIM 补全仅非思考模式支持。V4 同时提供 OpenAI 格式(https://api.deepseek.com)与 Anthropic 格式(https://api.deepseek.com/anthropic)两条入口。 价格上,V4-Flash 每百万 token 输入 0.02 元(缓存命中)/1 元(缓存未命中)、输出 2 元;V4-Pro 原价分别为 0.1 元、12 元、24 元,2.5 折后实际单价为 0.025 元、3 元、6 元。旧模型名 deepseek-chat 与 deepseek-reasoner 标注"于日后弃用",过渡期内分别对应 V4-Flash 的非思考与思考模式,具体下线日期暂未给出。 DeepSeek API Docs | DeepSeek V4 发布公告 https://api-docs.deepseek.com/zh-cn/quick_start/pricing/ https://api-docs.deepseek.com/zh-cn/news/news260424/
  • 0 赞同
    1 帖子
    42 浏览
    R
    DeepSeek 于 4 月 24 日发布并同步开源 V4 预览版,分为 V4-Pro(1.6T 总参数、49B 激活)与 V4-Flash(284B 总参数、13B 激活)两档,均为 MoE 架构并原生支持 100 万(1M)token 上下文。官方称 V4-Pro 在 Agentic Coding 评测中达到当前开源模型最佳水平,已被 DeepSeek 内部用作日常 Agentic Coding 主力,反馈使用体验优于 Claude Sonnet 4.5、交付质量接近 Opus 4.6 非思考模式,仍落后于 Opus 4.6 思考模式;世界知识仅稍逊于 Gemini-Pro-3.1;数学、竞赛代码评测超越所有已公开评测的开源模型,Codeforces 评分 3206 高于 GPT-5.4。V4-Flash 推理能力接近 Pro 版但更快更经济,简单 Agent 任务与 Pro 版相当、复杂任务仍有差距。 技术上 V4 提出 token 维度压缩注意力机制并结合 DSA 稀疏注意力(DeepSeek Sparse Attention),官方称在 1M 上下文下 V4-Pro 单 token 推理 FLOPs 仅为 V3.2 的 27%、KV Cache 仅为 10%。API 层面 base_url 不变,model 改为 deepseek-v4-pro 或 deepseek-v4-flash 即可调用,同时支持 OpenAI ChatCompletions 与 Anthropic 双协议;定价上 V4-Pro 每百万 token 输出 24 元、V4-Flash 输出 2 元,远低于同档闭源模型。原有的 deepseek-chat 与 deepseek-reasoner 两个旧模型名将于 2026 年 7 月 24 日下线,当前分别指向 V4-Flash 的非思考与思考模式。本次发布与 OpenAI 的 GPT-5.5 选择同日上线,权重与技术报告均已在 HuggingFace、ModelScope 同步开源。 DeepSeek API Docs | IT之家 | 36氪 | 观察者网
  • 0 赞同
    1 帖子
    39 浏览
    R
    长期坚持不引入外部资金的中国AI新创企业DeepSeek,近日首次启动对外融资,目标估值已从最初100亿美元一路攀升至逾200亿美元。据《The Information》报道,腾讯与阿里巴巴正积极参与投资谈判。 此次融资转变背后,是DeepSeek面临的多重压力:核心研究人员相继被国内大厂高薪挖走,新一代旗艦模型V4屡遭推迟,算力成本持续攀升。外部资金将主要用于扩充算力资源与稳定技术团队。 对腾讯与阿里而言,入股DeepSeek兼具防御与进攻双重战略意义,既可对冲自研大模型风险,也能开辟深度技术合作通道。目前谈判仍在进行中,最终估值与融资规模尚未确定。