<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[GitHub CTO 复盘两起事故并披露容量规划：原定 10× 扩容已升级为 30×，Agent 工作流驱动需求激增]]></title><description><![CDATA[<p dir="auto">GitHub CTO Vlad Fedorov 4 月 28 日发文，复盘近期两起可用性事故，并披露平台正面临的规模挑战。数据层面，自 2025 年 12 月下半月起 Agent 开发工作流加速扩散，拉取请求合并量峰值达 9000 万次、提交量峰值达 14 亿次、新建仓库数每月达 2000 万——三项指标均创历史新高。GitHub 2025 年 10 月启动 10 倍容量扩展计划，但至 2026 年 2 月已重新定目标为 30 倍。技术层面，Fedorov 描述了分布式系统的级联放大效应：一个 PR 可同时触碰 Git 存储、合并性检查、Actions、搜索、通知、权限、Webhook、API、后台任务、缓存与数据库，任一环节的瓶颈都会以队列堆积、缓存失效变数据库负载、重试放大流量的方式连锁扩散。应对措施包括将 Webhook 从 MySQL 迁出、重新设计 Session 缓存以大幅降低数据库负载、将 Git 与 Actions 从其他工作负载隔离、将性能敏感代码从 Ruby 单体迁入 Go，以及推进多云架构以实现更高韧性。</p>
<p dir="auto">两起事故分别为：4 月 23 日合并队列（Merge Queue）回归缺陷，当合并组包含两个以上 PR 时使用 Squash 合并会产生错误提交，反向撤销了此前 PR 的变更，共影响 658 个仓库与 2092 个 PR，无数据丢失但需人工修复（更多细节见单独的 RCA 公告）；4 月 27 日 Elasticsearch 集群因疑似僵尸网络攻击过载宕机，影响 PR、Issue、Projects 等依赖搜索的 UI，Git 操作与 API 不受影响但体验显著下降。Fedorov 坦承 Elasticsearch 是&quot;尚未完成隔离的单点故障&quot;，并已启动与其他高优先级系统相同的依赖分析与隔离工作。Ghostty 创始人 Mitchell Hashimoto 同日发文宣布将 Ghostty 项目迁出 GitHub，直接引用的就是 4 月份频繁的故障影响其正常工作。</p>
<p dir="auto"><a href="https://github.blog/news-insights/company-news/an-update-on-github-availability/" target="_blank" rel="noopener noreferrer nofollow ugc">GitHub Blog</a></p>
<p dir="auto"><div class="card col-md-9 col-lg-6 position-relative link-preview p-0">



<a href="https://github.blog/news-insights/company-news/an-update-on-github-availability/" title="An update on GitHub availability">
<img src="https://github.blog/wp-content/uploads/2025/07/wallpaper-generic-blue.png" class="card-img-top not-responsive" style="max-height: 15rem;" alt="Link Preview Image" onerror="this.parentElement.remove()" />
</a>



<div class="card-body">
<h5 class="card-title">
<a class="text-decoration-none" href="https://github.blog/news-insights/company-news/an-update-on-github-availability/">
An update on GitHub availability
</a>
</h5>
<p class="card-text line-clamp-3">Here’s what we’ve done—and what we’re still doing—to improve our availability and reliability.</p>
</div>
<a href="https://github.blog/news-insights/company-news/an-update-on-github-availability/" class="card-footer text-body-secondary small d-flex gap-2 align-items-center lh-2">



<img src="https://github.githubassets.com/favicon.ico" alt="favicon" class="not-responsive overflow-hiddden" style="max-width: 21px; max-height: 21px;" onerror="this.remove()"/>









<p class="d-inline-block text-truncate mb-0">The GitHub Blog <span class="text-secondary">(github.blog)</span></p>
</a>
</div></p>
]]></description><link>https://welinux.com//topic/185/github-cto-复盘两起事故并披露容量规划-原定-10-扩容已升级为-30-agent-工作流驱动需求激增</link><generator>RSS for Node</generator><lastBuildDate>Mon, 18 May 2026 20:46:14 GMT</lastBuildDate><atom:link href="https://welinux.com//topic/185.rss" rel="self" type="application/rss+xml"/><pubDate>Tue, 05 May 2026 13:25:30 GMT</pubDate><ttl>60</ttl></channel></rss>