無くならないことになっている

6/20に発生した大規模障害に関するお詫びとお知らせには驚いた。

障害発生以来、弊社ならびに外部専門業者を交え、データ復旧を試み続けて参りました。しかしながら、極めて遺憾ではございますが、データ復旧を行うことは不可能と判断いたしました。

不可能って・・・
私はファーストサーバ使ってないので被害はなかったですが、この障害がAWSだった日には・・・

ユーザだったらふざけるなぼけ!!!と言いたいけどエンジニアの端くれだから可能性はゼロではないのは知っているし・・・
ストレージは吹っ飛ばないことになっているというようなシステム多い気がします。

基本なんだけど「バックアップはちゃんと取る」に限るよね。

「ファイルサーバのバックアップをテープで取りましょう」なんて今はなかなかいえないよなぁ。
火事とか地震とかでのレイヤー0の障害ではテープだけではカバーしきれないしバックアップは地理的に分けておいておかないとダメ。かもしれない
重要なデータほど複数に置いておく必要があるということなのか・・・・

今使っているcronにs3syncを利用して複数のバケットに投げるように設定変更
単純にs3syncを2回投げているだけなんだけどね^^;;

S3_DIR=バケット名:アップロード先
S3_DIR2=バケット名2:アップロード先2
$RUBY $S3SYNC -rp $IMAGE_DIR $S3_DIR ;
$RUBY $S3SYNC -rp $IMAGE_DIR $S3_DIR2 ;

IMG 9556

シェルから実行した結果は2カ所に飛んでいることを確認
これでしばらくはいいかな。

S3が2つのリージョンで同時に障害が発生してすべてデータロストするとは考えにくいからこれでしばらく運用します。
同時にデータトスとする可能性は(100-99.999999999)^2%だよね。
もうゼロって言っていいんじゃない?とか思っていたら
[blackbirdpie url=”https://twitter.com/injurin/status/217422738900516864″]
だってさ・・・
そうだよなぁ。

対岸の火事だと思わずにバックアップ運用を真面目に考えよう