跳转至内容
  • 0 赞同
    1 帖子
    19 浏览
    R
    OpenAI、微软、英伟达、AMD、英特尔及博通的研究团队于 5 月 6 日联合发布论文,正式推出历时两年研发的数据中心网络传输协议 MRC(多路径可靠连接,Multipath Reliable Connection),并通过开放计算项目(OCP)以开放许可证发布规范。MRC 针对大规模 GPU 集群中两大核心痛点而设计:一是拥塞——采用"数据包喷射"(packet spraying)机制,将数据流同时分散至数百条网络路径,避免单链路过载,同时压平集群网络层级,降低整体能耗;二是故障——可在微秒级内检测路径中断并自动切换,使训练任务在网络局部故障时无需中断。此外,MRC 还与 SRv6(IPv6 段路由)协议配合,由发送端直接规划数据路径,大幅减少交换机的路由计算负担。OpenAI 网络负责人 Mark Handley 表示,MRC 让集群网络从"故障放大器"变为弹性基础设施。 MRC 目前已部署于 OpenAI 与微软最大的训练集群,包括甲骨文德克萨斯州 Abilene 站点及微软的 Fairwater 超算,并已参与训练多个 OpenAI 模型。英伟达方面同步宣布,Spectrum-X 以太网平台原生支持 MRC 协议,同时兼容此前的自适应 RDMA 方案,为客户提供传输层选择弹性。OpenAI 工作负载负责人 Greg Steinbrecher 强调,推动 MRC 开源的出发点是消除行业碎片化——当前各家大型公司各自维护私有协议,整体效率低下,统一标准后算力资源才能得到更充分利用。 NVIDIA Blog | The Deep View https://blogs.nvidia.com/blog/spectrum-x-ethernet-mrc/ https://www.thedeepview.com/articles/exclusive-openai-unveils-protocol-to-stretch-compute
  • 0 赞同
    1 帖子
    22 浏览
    R
    Oaktree 旗下数据中心开发商 Pure Data Centre Group CEO Gary Wojtaszek 4 月 29 日接受 CNBC 采访时披露,公司已暂停中东地区”所有数据中心项目”的投资决策——导火索是其位于阿布扎比雅斯岛的数据中心在伊朗攻击中被弹片击中。他以”没有人会冲进燃烧的建筑”来形容目前行业心态,表示”在局势稳定之前,没有人会以规模化方式注入新资本”。Pure DC 原计划在利雅得扩张,目前亦处于冻结状态;非核心岗位员工获准远程办公或携家属离境,留守人员将获得额外福利,公司同时探索通过电子手段远程运营设施。Wojtaszek 强调公司仍看好中东长期机遇,长期规划层面的讨论并未停止。 此次暂停是更大范围震荡的缩影。今年 2 月 28 日美以联合打击伊朗后,伊朗对波湾地区实施报复性打击:3 月 1 日 AWS 在阿联酋的两座数据中心遭伊朗无人机直接攻击,巴林第三座数据中心亦因近失命中受损,造成结构破坏、电力中断及灭火系统误触发的水损,导致银行、支付及企业服务大规模中断。战争损失在绝大多数保险条款下属不可保风险,开发商正在自行消化相关成本。据 CNBC 同期报道,硅谷多家投资者和科技公司正对原本在海湾国家推进的万亿美元 AI 数据中心计划展开内部重新评估,但尚无其他主要运营商公开宣布同类暂停。中东数据中心市场此前预计至 2028 年年均增速超 15%,沙特一国即承诺投入 400 亿美元打造地区 AI 枢纽,此次地缘政治冲击料将实质性推迟这一布局。 Ars Technica | Data Centre Magazine https://arstechnica.com/ai/2026/04/data-center-developer-pauses-middle-east-projects-after-war-damage/
  • 0 赞同
    1 帖子
    38 浏览
    R
    Google 母公司 Alphabet 于 4 月 24 日确认,将向 Anthropic 投资最高 400 亿美元,成为史上对单一 AI 初创公司最大的单笔财务承诺。交易结构为:先期按 3500 亿美元估值注入 100 亿美元现金,余下 300 亿美元视 Anthropic 达成特定业绩里程碑后分批跟进。配套计算资源层面,Google Cloud 将在五年内向 Anthropic 提供新增 5 吉瓦算力,叠加此前已宣布的 Google 与博通联合供应的 3.5 吉瓦 TPU 产能(2027 年起上线),Anthropic 可调用的 Google 算力总规模将超过 8 吉瓦。本次投资前,Google 在 Anthropic 的累计投入已逾 30 亿美元、持股约 14%。就在同一周,亚马逊亦宣布追加 50 亿美元、将其总承诺额扩至最高 250 亿美元,并绑定一项 Anthropic 在 AWS 上花费最高 1000 亿美元以换取约 5 吉瓦算力的长期协议;同期 Anthropic 还与 CoreWeave 签署数据中心协议。至此,仅 Google 与亚马逊两家云巨头对 Anthropic 的合计承诺额已达约 650 亿美元。 背景上,此轮融资直接折射出 Anthropic 的基础设施压力:Claude Code 企业端用量爆发、用户对使用限额的投诉持续累积,促使公司在短期内密集签下多笔算力协议。Anthropic 最新估值 3500 亿美元,较今年 2 月的 183 亿美元融资轮估值近乎翻倍;外界预期公司最快将于 2026 年启动 IPO。值得关注的是,Google 此次入股定价与 2 月融资轮持平,Motley Fool 分析师指出这意味着 Google 以相对折价锁定了大量新增股权。Claude Opus 5 预计在 Q2 至 Q3 窗口发布,本次算力承诺被视为支撑该发布节奏的物质基础。 TechCrunch | CNBC | Bloomberg | Reuters | WSJ | FT https://techcrunch.com/2026/04/24/google-to-invest-up-to-40b-in-anthropic-in-cash-and-compute/ https://www.bloomberg.com/news/articles/2026-04-24/google-plans-to-invest-up-to-40-billion-in-anthropic
  • 0 赞同
    1 帖子
    22 浏览
    R
    Google 在 Cloud Next ’26 大会上宣布推出第八代 TPU,分为两款独立架构:TPU 8t(专注训练)和 TPU 8i(专注推理),均将于今年晚些时候正式发布。 TPU 8t:训练利器 单个 TPU 8t 超级 Pod 可扩展至 9,600 颗芯片、2 PB 共享高带宽内存,提供 121 ExaFlops 算力,计算性能较上代提升近 3 倍。同时集成 10 倍更快的存储访问,并通过 Virgo 网络与 JAX/Pathways 软件支持最多百万芯片的近线性扩展。 TPU 8i:推理引擎 TPU 8i 搭载 288 GB 高带宽内存与 384 MB 片上 SRAM(较上代增加 3 倍),ICI 互连带宽提升至 19.2 Tb/s,新增片上集合加速引擎(CAE)将延迟降低最多 5 倍。整体性能每美元效率提升 80%,相同成本下可服务近两倍的用户量。 能效与系统协同 两款芯片均采用 Google 自研 Axion ARM CPU 主机,性能每瓦功耗较上代 Ironwood 提升最多 2 倍,并配备第四代液冷技术,支持原生 JAX、PyTorch、SGLang、vLLM 等主流框架。 Google https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/