7 月 13 日,GitHub 突然发生服务中断的情况,用户在登录 GitHub 时出现错误,无法打开网页,部分用户无法使用集成开发环境(IDE)。
据了解,GitHub 这次宕机持续时间约 4 个小时,有网友整理了相关的宕机时间线:
- 12:06:正在调查性能下降和错误率增加的报告(刚发现服务器崩了)
- 13:53:已确定提升错误的来源,并正在进行恢复(刚找到原因)
- 15:18:我们继续努力恢复我们的服务(没搞好)
- 16:08:服务恢复工作仍在继续(还没搞好)
- 16:31:事件已解决(终于搞好了)
这次宕机影响范围较广,涉及了多个 GitHub 功能,包括:API 请求 (包括网页 API)、Issue、Pull Requests、Projects、Github Actions、Github Packages、Github Pages。不过,Git 操作和 Webhooks 未受影响。
GitHub 在两周时间内接连出现两次服务中断,很多人都很好奇宕机的原因。随后有网友爆料,微软在回应某个客户咨询时,解释 GitHub 宕机的原因:“经过我们的不断排查,我们发现由于疫情的影响,我们各地服务器均有被盗走的现象,我们已经在全力追回被盗服务器,希望能够尽快找回服务器和数据。”
随后,这张截图以及 GitHub 被盗是因为服务器被盗的消息被广泛传播。但不久就被打脸,原来这张所谓的微软回复邮件竟然是 P 的。
翻车链接:
https://www.hostloc.com/thread-715545-1-1.html
服务器被盗虽然已被证实是假的,但是围绕 GitHub 两周宕机两次,网友仍然大开脑洞探索原因。
有人说:“GitHub 应该在忙着修改技术术语吧,例如 blacklist、master、slave 等,没有时间关心基础技术,忙中出错,也是可以理解的。”
有人说:“微软接手之前,GitHub 基础技术似乎没有引起很多问题,微软接手之后,宕机情况明显变得更频繁。”
有人说:“GitHub 底层技术使用的是 Ruby on Rails,之前 Twitter 使用 Ruby on Rails 就翻过车, GitHub 翻车也是意料之中。”
还有人调侃:“前段时间,GitHub 从我手下挖走了一个人,现在出现这种情况,我并不觉得意外。”
拓展阅读:
https://www.zhihu.com/question/406649145
https://www.reddit.com/r/programming/comments/hqayno/github_is_down/