EC2で突然インスタンスが落ちた or 不調な場合に確認しておきたいこと

Overview

  • aws ec2 describe-instance-status --instance-ids で該当インスタンスInstanceStatusSystemStatus を確認する

内容

aws ec2 describe-instance-status --instance-ids を実行してaws側で問題がないのか確認する。

{
    "InstanceStatuses": [
        {
            "InstanceStatus": {
                "Status": "impaired",
                "Details": [
                    {
                        "Status": "failed",
                        "ImpairedSince": "2020-12-07T07:12:00.000Z",
                        "Name": "reachability"
                    }
                ]
            },
            "AvailabilityZone": "ap-northeast-1c",
            "InstanceId": "i-0b7c76cd65cdd67da",
            "InstanceState": {
                "Code": 16,
                "Name": "running"
            },
            "Events": [
                {
                    "Code": "instance-stop",
                    "InstanceEventId": "instance-event-057aea7218a39c050",
                    "Description": "The instance is running on degraded hardware",
                    "NotBefore": "2020-12-21T02:00:00.000Z"
                }
            ],
            "SystemStatus": {
                "Status": "impaired",
                "Details": [
                    {
                        "Status": "failed",
                        "ImpairedSince": "2020-12-07T07:12:00.000Z",
                        "Name": "reachability"
                    }
                ]
            }
        }
    ]
}

impaired なので障害発生中とわかる。

InstanceStatus

OS以上のインスタンスのステータスのこと。

instance-status.status - The status of the instance (ok | impaired | initializing | insufficient-data | not-applicable).

ref DescribeInstanceStatus - Amazon Elastic Compute Cloud

impaired が表示されていれば障害とわかる。

SystemStatus

物理層インスタンスのステータスのこと。