Dropboxが2日以上ダウン。原因はメンテナンス用スクリプトのミス

2014年1月14日

オンラインストレージサービスのDropboxが、米国時間1月10日の午後から約2日間にわたって障害を引き起こしていました。直接の原因は、OSをバージョンアップするために実行したメンテナンス用スクリプトにバグがあったことです。

障害の状況を時系列で追いつつ、原因についての報告を見てみましょう。

Dropbox Tech Blog » Blog Archive » Dropbox Status Update

約48時間続いた復旧作業


Dropbox Tech BlogDropbox Status Update

64051Dropbox


1/10 at 6:40pm PT: We are aware that the Dropbox site is currently down. This was caused during routine internal maintenance, and was not caused by external factors. We are working to fix this as soon as possible. We apologize for the inconvenience.

110640Dropbox便


Dropbox


UPDATE 1/11 at 10:24am PT: Were still experiencing service issues related to the outage last night. We apologize and are working to get the service fully restored as soon as possible.

1111024


24


UPDATE 1/11 at 6:35pm PT: Dropbox is still experiencing lingering issues from last nights outage. Were working hard to get everything back up, and want to give you an update.

No files were lost in the outage, but some users continue to run into problems using various parts of dropbox.com and our mobile apps. Were rapidly reducing the number of users experiencing these problems, and are making good progress.

Were also working through some issues specific to photos. In the meantime, weve temporarily disabled photo sharing and turned off the Photos tab on dropbox.com for all users. Your photos are safely backed up and accessible from the desktop client and the Files tab on dropbox.com.

111635Dropbox

dropbox.com

Photosdropbox.comFiles


2


UPDATE 1/12 at 1:59pm PT: Hi everyone, we wanted to give an update on where things stand.

As of this morning at 4:10am PT, nearly all users (over 99%) can access their files on dropbox.com. The Photos tab is still turned off, but you can access your photos via the Files tab on dropbox.com or the desktop client. Were continuing to make a lot of progress restoring full service to all users, and are doing so in careful steps.

About 5% of our users are still experiencing problems syncing from the desktop client, and about 20% of users are having issues accessing Dropbox through our mobile apps. Within a few hours, well be rolling out a change that will further improve things for those users. Well give an update after that.

Your files have been safe this entire time. Thanks again for your patience.

112159

41099dropbox.comPhotosdropbox.comFiles

520Dropbox




7
Dropbox Tech Blog » Blog Archive » Outage post-mortem

原因はメンテナンススクリプトのバグ


Dropbox Tech BlogOutage post-mortem

OS


On Friday at 5:30 PM PT, we had a planned maintenance scheduled to upgrade the OS on some of our machines. During this process, the upgrade script checks to make sure there is no active data on the machine before installing the new OS.

A subtle bug in the script caused the command to reinstall a small number of active machines. Unfortunately, some master-slave pairs were impacted which resulted in the site going down.

530OSOS

OS/


OS


Dropbox2

1


Weve since added an additional layer of checks that require machines to locally verify their state before executing incoming commands. This enables machines that self-identify as running critical processes to refuse potentially destructive operations.




1


To speed up our recovery, we developed a tool that parallelizes the replay of binary logs. This enables much faster recovery from large MySQL backups. We plan to open source this tool so others can benefit from what weve learned.

MySQL


Dropbox2Dropbox

あわせて読みたい

ストレージ 運用・監視 Dropbox




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed


10


AWSAIAWS App Studio
ESLintJavaScriptJSONMarkdown
RustZedLinux
CloudflareAI
IT  2024
IT 2024  SI
IT 2024  
MySQL 9.0 JavaScript
AIAISudoLang
RustDartRust Core 1.0Rust便Dart使