スポットインスタンスがAWS側の事情で落ちて復旧させるときの注意点

スポットインスタンスがAWS側の事情で落ちて復旧させるときの注意点

弊社、開発環境はEC2はスポットインスタンスで立ててます。スポットは安いんですがAWS側の事情で停止か終了されます。大抵は、スポット入札金額を超えてしまったとかですが、2021/05/13は東京AZ-cがなんらかの原因で使えなくなってしまったので(多分、AZ-cのt2microが枯渇したとか)、AZ-aに立て直しました。

まず、事前にバックアップとっておくか、止まった時を「停止」に設定しておいて、AMIが取れるようにしてください。「アクション」→「イメージとテンプレート」→「イメージを作成」で取れます。

次に左ペインのAMIからAMI IDなどを検索して、取ったイメージを選択、「アクション」→「起動」します。以前と同じ設定で、ただし、AZで撥ねられた場合、それは変える必要があります。

できたら、EIPをアタッチします。以前のEIP使っても良いし、新しいEIPを使っても良いです。その場合SSHの必要から覚えて置いた方がいいですね。

ALBを改めて作る必要はありませんが、TGは変更する必要があります。インスタンスが変わっているので修正。

TGがunhealhyの時、webサーバーが上がってないことを疑います。ターゲットのファイルはAMIでコピーされているので、webサーバーがデフォで上がってないです。私は焦ってsudoせずに結果を斜め読みしてしまいました。そりゃ、動かないわけだわ。

これで動かないとき、DBも死んでることが多いです。503とか。RDSだったら「再起動」してくだい。EC2に入れてるDBだとコマンドで起動(どちらを使ってるか分からない場合、コマンドで失敗したらDBがはいってないです)

これで動くはずです。使っているのが落ちた場合、Route53は触らなくていいです。触るのはEC2とEIP、TG、DBだけになります。

お問い合わせ

記事の内容についてもっと詳しく知りたい方や キャレットへのお問い合わせ・資料請求はこちらからお気軽にご連絡ください。

Uncategorizedカテゴリの最新記事