メンテナンス イベントとポリシー

Google Cloud Managed Lustre インスタンスを最新の状態に保つため、 Google Cloudは定期的にメンテナンスを実施します。メンテナンス イベントには、基盤となるソフトウェアまたはインフラストラクチャの更新が含まれる場合があります。これらのイベントにより、一時的なダウンタイムが発生し、インスタンスへの I/O オペレーションが応答を停止することがあります。影響を受ける I/O オペレーションは、メンテナンスが完了すると再開されます。ダウンタイムは通常 2 ~ 25 分です。

メンテナンスの進行中、インスタンスのステータスは UPGRADING になります。メンテナンスが完了すると、インスタンスは ACTIVE ステータスに戻ります。

メンテナンス ポリシーを使用すると、これらのメンテナンス イベントが発生するタイミングを制御できます。各インスタンスのメンテナンス ポリシーを構成して、メンテナンスの時間枠とメンテナンスを除外する期間を指定できます。インスタンスにメンテナンス ポリシーが構成されていない場合、メンテナンスはいつでも発生する可能性があります。

メンテナンス イベントのスケジュールを変更して、すぐに開始するか、次の使用可能な時間枠で開始するか、最大 28 日後の特定の時間に開始することもできます。

大規模インスタンス

極端なパフォーマンスとスケールを提供する特定の Managed Lustre 構成では、定期的なホスト メンテナンスのために最大 4 時間の計画的なダウンタイムが必要になる場合があります。Google は、これらのメンテナンス イベントを事前に調整します。

メンテナンス ポリシーについて

各 Managed Lustre インスタンスでメンテナンス ポリシーを構成できます。メンテナンス ポリシーには次のものが含まれます。

  • 毎週のメンテナンスの時間枠: Managed Lustre でメンテナンス イベントを開始してもよい、週に 1 回の 1 時間の時間枠。
  • メンテナンス除外期間: Managed Lustre でメンテナンス イベントの開始が許可されない期間。インスタンスごとに 1 つの除外期間を定義できます。期間は最長 2 週間です。開始日と終了日に年が指定されていない場合、除外期間は毎年繰り返されます。

除外期間は、通常のメンテナンスの時間枠よりも優先されます。スケジュールされたイベントがこの期間内にある場合、Managed Lustre はイベントを次に利用可能な時間枠に延期するか、完全にスキップします。更新は次のメンテナンス サイクルで適用されます。

メンテナンスに関する通知

今後のメンテナンス イベントに関するメール通知を購読して、発生する可能性のある中断に備えることができます。メンテナンス通知の購読は、 Google Cloud コンソールの [通信] ページで管理します。

[コミュニケーション] ページに移動

登録すると、次の通知が送信されます。

  • 事前通知: 予定されているメンテナンス イベントの 7 ~ 14 日前、またはメンテナンス イベントがお客様によって再スケジュールされた後に送信されます。
  • キャンセル: スケジュール設定済みのメンテナンス イベントが Google によってキャンセルされた場合、またはお客様によってスケジュール変更された場合に送信されます。
  • 進行中: メンテナンス イベントの開始時に送信されます。
  • 完了: メンテナンス イベントが完了したときに送信されます。

今後のメンテナンス スケジュールは、 Google Cloud コンソールのインスタンスの詳細ページで確認することもできます。また、Cloud Logging を使用してメンテナンス ログを表示することもできます。

メンテナンスの時間枠を構成する

メンテナンスの時間枠には、1 時間の時間枠の曜日と UTC 開始時刻が必要です。

Google Cloud コンソール

インスタンスの作成時にメンテナンスの時間枠を構成するには、インスタンスを作成するをご覧ください。

gcloud

--maintenance-policy-weekly-windows フラグを指定して、メンテナンスの時間枠を設定したインスタンスを作成します。

gcloud lustre instances create INSTANCE_ID \
  --per-unit-storage-throughput=PER_UNIT_STORAGE_THROUGHPUT \
  --capacity-gib=CAPACITY_GIB \
  --filesystem=FS_NAME \
  --location=LOCATION \
  --network=NETWORK_PATH \
  --maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'

次のように置き換えます。

  • INSTANCE_ID: Managed Lustre インスタンスの ID。
  • PER_UNIT_STORAGE_THROUGHPUT は、TiB あたりの MBps 単位のパフォーマンス階層です。有効な値は、01252505001000 です。[動的階層][dynamic-tier] を指定するには、これを 0 に設定し、--dynamic-tier-options-mode=DEFAULT_CACHE フラグを含めます。
  • CAPACITY: インスタンスの容量(GiB 単位)。
  • FS_NAME: ファイル システムの名前。
  • LOCATION: Managed Lustre インスタンスのロケーション。
  • NETWORK_PATH: インスタンスが属する VPC ネットワークのフルパス(projects/PROJECT_ID/global/networks/NETWORK 形式)。VPC ネットワークを構成するをご覧ください。
  • DAY: メンテナンスの時間枠の曜日(例: TUESDAY)。
  • START_TIME: メンテナンスの時間枠の UTC 開始時刻(辞書形式、例: {hours=1,minutes=0})。

インスタンスの作成の詳細については、Managed Lustre インスタンスを作成するをご覧ください。

REST API

インスタンスのメンテナンスの時間枠を指定するには、インスタンスの作成時に maintenancePolicy オブジェクトを含めます。

以下は、maintenancePolicy オブジェクトの例です。

"maintenancePolicy": {
  "weeklyMaintenanceWindows": [
    {
      "dayOfWeek": "DAY",
      "startTime": {
        "hours": HOURS,
        "minutes": MINUTES
      }
    }
  ]
}

次のように置き換えます。

  • DAY: メンテナンスの時間枠の曜日(例: TUESDAY)。
  • HOURS: メンテナンスの時間枠の開始時刻の時刻(例: 1)。
  • MINUTES: メンテナンスの時間枠の開始時刻の分(例: 0)。

除外時間枠を構成する

祝日やビジネス イベントなどの特定の期間にメンテナンスが行われないようにするには、メンテナンス ポリシーで 1 つのメンテナンス除外の時間枠を定義します。除外期間は最長で 2 週間です。毎年繰り返される除外期間を作成するには、開始日と終了日に年を指定しないでください。

同じポリシーで、毎週のメンテナンスの時間枠と除外時間枠を組み合わせることができます。

Google Cloud コンソール

インスタンスの作成時に除外時間枠を構成するには、インスタンスを作成するをご覧ください。

gcloud

--maintenance-policy-exclusion-window フラグを指定して、除外期間のあるインスタンスを作成します。

gcloud lustre instances create INSTANCE_ID \
  --per-unit-storage-throughput=PER_UNIT_STORAGE_THROUGHPUT \
  --capacity-gib=CAPACITY_GIB \
  --filesystem=FILESYSTEM \
  --location=LOCATION \
  --network=NETWORK_PATH \
  --maintenance-policy-exclusion-window='startDate={START_DATE},endDate={END_DATE},time={TIME}'

次のように置き換えます。

  • INSTANCE_ID: Managed Lustre インスタンスの ID。
  • PER_UNIT_STORAGE_THROUGHPUT は、TiB あたりの MBps 単位のパフォーマンス階層です。有効な値は、01252505001000 です。[動的階層][dynamic-tier] を指定するには、これを 0 に設定し、--dynamic-tier-options-mode=DEFAULT_CACHE フラグを含めます。
  • CAPACITY: インスタンスの容量(GiB 単位)。
  • FS_NAME: ファイル システムの名前。
  • LOCATION: Managed Lustre インスタンスのロケーション。
  • NETWORK_PATH: インスタンスが属する VPC ネットワークのフルパス(projects/PROJECT_ID/global/networks/NETWORK 形式)。VPC ネットワークを構成するをご覧ください。
  • START_DATE: メンテナンス除外期間の開始日(辞書形式、例: {day=08,month=06,year=2026})。毎年繰り返す場合は、year キーを省略します。
  • END_DATE: メンテナンス除外期間の終了日(辞書形式(例: {day=08,month=06,year=2026}))。毎年繰り返す場合は、year キーを省略します。
  • TIME: 除外ウィンドウの UTC 開始時刻と終了時刻(辞書形式、例: {hours=1,minutes=0})。

REST API

以下は、除外ウィンドウを含む maintenancePolicy オブジェクトの例です。

"maintenancePolicy": {
  "maintenanceExclusionWindow": [
    {
      "startDate": {
        "day": START_DAY,
        "month": START_MONTH,
        "year": START_YEAR
      },
      "endDate": {
        "day": END_DAY,
        "month": END_MONTH,
        "year": END_YEAR
      },
      "time": {
        "hours": HOURS,
        "minutes": MINUTES
      }
    }
  ]
}

次のように置き換えます。

  • START_YEAR: 除外期間の開始日の年(例: 2026)。このフィールドと END_YEAR を省略すると、毎年繰り返される期間が作成されます。
  • START_MONTH: 除外期間の開始日の月(例: 12)。
  • START_DAY: 除外期間の開始日の曜日(例: 24)。
  • END_YEAR: 除外ウィンドウの終了日の年(2027 など)。このフィールドと START_YEAR を省略すると、毎年繰り返されるウィンドウが作成されます。
  • END_MONTH: 除外期間の終了日の月(例: 1)。
  • END_DAY: 除外期間の終了日(例: 7)。
  • HOURS: 除外期間の時間帯(例: 0)。
  • MINUTES: 除外期間の時間の分(例: 0)。

メンテナンス ポリシーを更新する

既存のインスタンスのメンテナンス ポリシーを追加または変更するには:

Google Cloud コンソール

インスタンスのメンテナンス ポリシーを更新するには、インスタンスを管理するをご覧ください。

gcloud

次の gcloud の例では、インスタンスのメンテナンス ポリシーを更新します。

gcloud lustre instances update INSTANCE_ID \
--location=LOCATION \
--maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'

次のように置き換えます。

  • INSTANCE_ID: Managed Lustre インスタンスの ID。
  • LOCATION: Managed Lustre インスタンスのロケーション。
  • DAY: メンテナンスの時間枠の曜日(例: TUESDAY)。
  • START_TIME: メンテナンスの時間枠の UTC 開始時刻(辞書形式、例: {hours=1,minutes=0})。

REST API

インスタンスのメンテナンスの時間枠を指定するには、インスタンスの更新時に maintenancePolicy オブジェクトを含めます。updateMask クエリ パラメータで maintenancePolicy も指定する必要があります。

次の curl の例では、インスタンスのメンテナンス ポリシーを更新します。

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "maintenancePolicy": {
    "weeklyMaintenanceWindows": [
      {
        "dayOfWeek": "DAY",
        "startTime": {
          "hours": HOURS,
          "minutes": MINUTES
        }
      }
    ]
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"

次のように置き換えます。

  • PROJECT_ID: 実際の Google Cloud プロジェクト ID。
  • LOCATION Managed Lustre インスタンスのロケーション。
  • INSTANCE_ID: Managed Lustre インスタンスの ID。
  • DAY: メンテナンスの時間枠の曜日(例: TUESDAY)。
  • HOURS メンテナンスの時間枠の開始時刻(例: 3)。
  • MINUTES メンテナンスの時間枠の開始時間の分(例: 45)。

メンテナンス ポリシーを削除する

インスタンスからメンテナンス ポリシーを削除するには、ポリシーからすべての週次メンテナンスの時間枠と除外の時間枠をクリアします。

Google Cloud コンソール

インスタンスからメンテナンス ポリシーを削除するには、インスタンスを編集してメンテナンス ポリシー フィールドをクリアします。インスタンスを管理するをご覧ください。

gcloud

--clear-maintenance-policy-weekly-windows フラグと --clear-maintenance-policy-exclusion-window フラグを指定して、gcloud lustre instances update コマンドを使用します。

gcloud lustre instances update INSTANCE_ID \
--location=LOCATION \
--clear-maintenance-policy-weekly-windows \
--clear-maintenance-policy-exclusion-window

次のように置き換えます。

  • INSTANCE_ID: Managed Lustre インスタンスの ID。
  • LOCATION: Managed Lustre インスタンスのロケーション。

REST API

REST API を使用してメンテナンス ポリシーを削除するには、空の maintenancePolicy オブジェクトと updateMask クエリ パラメータが maintenancePolicy に設定された instances.patch メソッドを使用します。

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "maintenancePolicy": {}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"

次のように置き換えます。

  • PROJECT_ID: 実際の Google Cloud プロジェクト ID。
  • LOCATION: Managed Lustre インスタンスのロケーション。
  • INSTANCE_ID: Managed Lustre インスタンスの ID。

メンテナンス ログを表示する

Managed Lustre は、Cloud Logging を使用して、次のアクティビティ タイプを含むメンテナンス イベントをログに記録します。

  • LustreAdvancedNotification: インスタンスのメンテナンスがスケジュールされています。
  • LustreOngoingNotification: インスタンスでメンテナンスが開始されました。完了すると、別の LustreOngoingNotification イベントがログに記録されます。今回は is_completed=true が含まれます。
  • LustreCancelledNotification: メンテナンスがキャンセルされました。

メンテナンス ログを表示するには、ログ エクスプローラまたは Google Cloud CLI を使用します。

ログ エクスプローラ

ログ エクスプローラを使用して Managed Lustre のメンテナンス ログを表示する手順は次のとおりです。

  1. Google Cloud コンソールで、[Cloud Logging] > [ログ エクスプローラ] ページに移動します。

    [ログ エクスプローラ] に移動

  2. クエリエディタに次のフィルタを入力し、[クエリを実行] をクリックします。

    resource.type="lustre.googleapis.com/Instance"
    resource.labels.instance_id="INSTANCE_ID"
    resource.labels.location="LOCATION"
    logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"
    

gcloud CLI

Google Cloud CLI でメンテナンス ログを表示するには、gcloud logging read コマンドを実行します。

gcloud logging read 'resource.type="lustre.googleapis.com/Instance" resource.labels.instance_id="INSTANCE_ID" resource.labels.location="LOCATION" logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"' --project=PROJECT_ID

次のように置き換えます。

  • INSTANCE_ID: Managed Lustre インスタンスの ID。
  • LOCATION: インスタンスが配置されているゾーン。
  • PROJECT_ID: インスタンスが配置されているプロジェクトのプロジェクト ID。

メンテナンス スケジュールの再設定

定期メンテナンス イベントがニーズと競合する場合は、スケジュールを変更できます。スケジュールを変更する際は、次のオプションがあります。

  • すぐに: メンテナンス イベントのスケジュールを変更して、できるだけ早く開始します。このオプションでは、インスタンスに構成されているメンテナンスの時間枠と除外ウィンドウは無視されます。
  • 次に使用可能な時間枠: メンテナンス イベントのスケジュールを次に使用可能なメンテナンスの時間枠に変更します。通常、更新は 1 週間延期されます。
  • 日付別: メンテナンス イベントのスケジュールを特定の日時に変更します。メンテナンスは、元のスケジュール時刻から最大 28 日間延期できます。このオプションでは、インスタンスに構成されているメンテナンスの時間枠と除外の時間枠は無視されます。

メンテナンスのスケジュールを変更するには:

gcloud

メンテナンス イベントをできるだけ早く開始するには:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=immediately

メンテナンスのスケジュールを次に使用可能な時間枠に変更するには:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=next-available-window

メンテナンスのスケジュールを特定の時間に設定するには:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=by-time \
--reschedule-schedule-time=TIMESTAMP

次のように置き換えます。

  • INSTANCE_ID: Managed Lustre インスタンスの ID。
  • LOCATION: Managed Lustre インスタンスのロケーション。
  • TIMESTAMP: RFC 3339 形式の開始時間(例: 2026-04-30T10:00:00Z)。これは、元のスケジュールされた時間から 28 日以内である必要があります。

REST API

instances.rescheduleMaintenance メソッドを使用します。

次の curl の例では、メンテナンス イベントをできるだけ早く開始します。

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "IMMEDIATELY"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

次の curl の例では、メンテナンスのスケジュールを次に使用可能な時間枠に変更します。

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "NEXT_AVAILABLE_WINDOW"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

次の curl の例では、メンテナンスを特定の時間に再スケジュールします。

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "BY_TIME",
    "scheduleTime": "TIMESTAMP"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

次のように置き換えます。

  • PROJECT_ID: 実際の Google Cloud プロジェクト ID。
  • INSTANCE_ID: Managed Lustre インスタンスの ID。
  • LOCATION: Managed Lustre インスタンスのロケーション。
  • TIMESTAMP: RFC 3339 形式の開始時間(例: 2026-04-30T10:00:00Z)。これは、元のスケジュールされた時間から 28 日以内である必要があります。