Eventos e políticas de manutenção

Para manter suas instâncias do Google Cloud Managed Lustre atualizadas, Google Cloud realizamos manutenção periódica nelas. Os eventos de manutenção podem incluir atualizações no software ou na infraestrutura subjacente. Esses eventos podem causar uma inatividade temporária, durante a qual as operações de E/S na instância podem parar de responder. As operações de E/S afetadas são retomadas quando a manutenção é concluída. O tempo de inatividade geralmente é de 2 a 25 minutos.

Enquanto a manutenção está em andamento, o status de uma instância é UPGRADING. Quando a manutenção for concluída, a instância vai retornar ao status ACTIVE.

Com as políticas de manutenção, é possível controlar quando esses eventos ocorrem. Configure uma política para cada instância e especifique janelas de manutenção e períodos em que ela deve ser excluída. Se nenhuma política for configurada em uma instância, a manutenção poderá ocorrer a qualquer momento.

Também é possível reprogramar um evento de manutenção para que ele comece imediatamente, durante a próxima janela disponível ou em um horário específico até 28 dias depois.

Instâncias de escala extrema

Algumas configurações do Managed Lustre que oferecem desempenho e escalonamento extremos podem exigir um tempo de inatividade planejado de até quatro horas para manutenção periódica do host. O Google coordena esses eventos de manutenção com você com antecedência.

Sobre as políticas de manutenção

É possível configurar uma política de manutenção em cada instância do Managed Lustre. Uma política de manutenção inclui o seguinte:

  • Janela de manutenção semanal: uma janela recorrente de uma hora durante a semana em que é aceitável que o Managed Lustre inicie um evento de manutenção.
  • Janela de exclusão de manutenção: um período em que o Managed Lustre não pode iniciar um evento de manutenção. É possível definir uma janela de exclusão por instância, com duração máxima de duas semanas. Se nenhum ano for especificado nas datas de início e término, a janela de exclusão vai se repetir anualmente.

Uma janela de exclusão tem precedência sobre uma janela de manutenção regular. Se um evento programado ocorrer nesse período, o Managed Lustre vai adiar o evento para a próxima janela disponível ou ignorá-lo completamente. A atualização é aplicada durante o próximo ciclo de manutenção.

Notificações de manutenção

Você pode se inscrever para receber notificações por e-mail sobre os próximos eventos de manutenção e se planejar para possíveis interrupções. As inscrições para receber notificações de manutenção são gerenciadas na página de comunicação do console Google Cloud :

Acessar a página Comunicação

Depois da inscrição, as seguintes notificações são enviadas:

  • Notificação antecipada: enviada de 7 a 14 dias antes de um evento de manutenção programado ou depois que um evento de manutenção é reprogramado pelo cliente.
  • Cancelado: enviado se um evento de manutenção programado for cancelado pelo Google ou remarcado pelo cliente.
  • Em andamento: enviada quando um evento de manutenção começa.
  • Concluído: enviado quando um evento de manutenção é concluído.

Também é possível conferir os próximos cronogramas de manutenção na página de detalhes da instância no console do Google Cloud ou usar o Cloud Logging para ver os registros de manutenção.

Configurar uma janela de manutenção

Uma janela de manutenção exige um dia da semana e um horário de início em UTC para a janela de uma hora.

Console do Google Cloud

Para configurar uma janela de manutenção ao criar uma instância, consulte Criar uma instância.

gcloud

Crie uma instância com uma janela de manutenção especificando a flag --maintenance-policy-weekly-windows:

gcloud lustre instances create INSTANCE_ID \
  --per-unit-storage-throughput=PER_UNIT_STORAGE_THROUGHPUT \
  --capacity-gib=CAPACITY_GIB \
  --filesystem=FS_NAME \
  --location=LOCATION \
  --network=NETWORK_PATH \
  --maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'

Substitua:

  • INSTANCE_ID: o ID da sua instância do Managed Lustre.
  • PER_UNIT_STORAGE_THROUGHPUT é o nível de desempenho em MBps por TiB. Os valores válidos são 0, 125, 250, 500 e 1000. Para especificar o [nível dinâmico][dynamic-tier], defina como 0 e inclua a flag --dynamic-tier-options-mode=DEFAULT_CACHE.
  • CAPACITY: a capacidade da sua instância em GiB.
  • FS_NAME: o nome do sistema de arquivos.
  • LOCATION: o local da sua instância do Managed Lustre.
  • NETWORK_PATH: o caminho completo da rede VPC a que a instância pertence, no formato projects/PROJECT_ID/global/networks/NETWORK. Consulte Configurar uma rede VPC.
  • DAY: o dia da semana da janela de manutenção (por exemplo, TUESDAY).
  • START_TIME: o horário de início UTC da janela de manutenção no formato de dicionário (por exemplo, {hours=1,minutes=0}).

Para mais detalhes sobre como criar uma instância, consulte Criar uma instância do Managed Lustre.

API REST

Para especificar uma janela de manutenção para uma instância, inclua o objeto maintenancePolicy ao criar uma instância.

Confira um exemplo de objeto maintenancePolicy:

"maintenancePolicy": {
  "weeklyMaintenanceWindows": [
    {
      "dayOfWeek": "DAY",
      "startTime": {
        "hours": HOURS,
        "minutes": MINUTES
      }
    }
  ]
}

Substitua:

  • DAY: o dia da semana para a janela de manutenção (por exemplo, TUESDAY).
  • HOURS: a hora do dia para o horário de início da janela de manutenção (por exemplo, 1).
  • MINUTES: o minuto da hora para o horário de início da janela de manutenção (por exemplo, 0).

Configurar uma janela de exclusão

Para evitar que a manutenção ocorra durante determinados períodos, como feriados ou eventos comerciais, é possível definir uma janela de exclusão de manutenção na política de manutenção. As janelas de exclusão podem durar até duas semanas. Para criar uma janela de exclusão recorrente anual, não especifique um ano nas datas de início e término.

É possível combinar uma janela de manutenção semanal e uma janela de exclusão na mesma política.

Console do Google Cloud

Para configurar uma janela de exclusão ao criar uma instância, consulte Criar uma instância.

gcloud

Crie uma instância com uma janela de exclusão especificando a flag --maintenance-policy-exclusion-window:

gcloud lustre instances create INSTANCE_ID \
  --per-unit-storage-throughput=PER_UNIT_STORAGE_THROUGHPUT \
  --capacity-gib=CAPACITY_GIB \
  --filesystem=FILESYSTEM \
  --location=LOCATION \
  --network=NETWORK_PATH \
  --maintenance-policy-exclusion-window='startDate={START_DATE},endDate={END_DATE},time={TIME}'

Substitua:

  • INSTANCE_ID: o ID da sua instância do Managed Lustre.
  • PER_UNIT_STORAGE_THROUGHPUT é o nível de desempenho em MBps por TiB. Os valores válidos são 0, 125, 250, 500 e 1000. Para especificar o [nível dinâmico][dynamic-tier], defina como 0 e inclua a flag --dynamic-tier-options-mode=DEFAULT_CACHE.
  • CAPACITY: a capacidade da sua instância em GiB.
  • FS_NAME: o nome do sistema de arquivos.
  • LOCATION: o local da sua instância do Managed Lustre.
  • NETWORK_PATH: o caminho completo da rede VPC a que a instância pertence, no formato projects/PROJECT_ID/global/networks/NETWORK. Consulte Configurar uma rede VPC.
  • START_DATE: a data de início do período de exclusão de manutenção no formato de dicionário (por exemplo, {day=08,month=06,year=2026}). Para recorrência anual, omita a chave year.
  • END_DATE: a data de término da janela de exclusão de manutenção no formato de dicionário (por exemplo, {day=08,month=06,year=2026}). Para recorrência anual, omita a chave year.
  • TIME: o horário de início e término em UTC da janela de exclusão no formato de dicionário (por exemplo, {hours=1,minutes=0}).

API REST

Confira abaixo um exemplo de objeto maintenancePolicy com um período de exclusão:

"maintenancePolicy": {
  "maintenanceExclusionWindow": [
    {
      "startDate": {
        "day": START_DAY,
        "month": START_MONTH,
        "year": START_YEAR
      },
      "endDate": {
        "day": END_DAY,
        "month": END_MONTH,
        "year": END_YEAR
      },
      "time": {
        "hours": HOURS,
        "minutes": MINUTES
      }
    }
  ]
}

Substitua:

  • START_YEAR: o ano da data de início do período de exclusão (por exemplo, 2026). Omita esse campo e END_YEAR para criar um período anual recorrente.
  • START_MONTH: o mês da data de início do período de exclusão (por exemplo, 12).
  • START_DAY: o dia da data de início do período de exclusão (por exemplo, 24).
  • END_YEAR: o ano da data de término do período de exclusão (por exemplo, 2027). Omita este campo e START_YEAR para criar um período anual recorrente.
  • END_MONTH: o mês da data de término do período de exclusão (por exemplo, 1).
  • END_DAY: o dia da data de término do período de exclusão (por exemplo, 7).
  • HOURS: a hora do dia para o período de exclusão (por exemplo, 0).
  • MINUTES: o minuto da hora para o período de exclusão (por exemplo, 0).

Atualizar uma política de manutenção

Para adicionar ou modificar a política de manutenção de uma instância:

Console do Google Cloud

Para atualizar a política de manutenção de uma instância, consulte Gerenciar instâncias.

gcloud

O exemplo de gcloud a seguir atualiza a política de manutenção de uma instância:

gcloud lustre instances update INSTANCE_ID \
--location=LOCATION \
--maintenance-policy-weekly-windows='dayOfWeek=DAY,startTime={START_TIME}'

Substitua:

  • INSTANCE_ID: o ID da sua instância do Managed Lustre.
  • LOCATION: o local da sua instância do Managed Lustre.
  • DAY: o dia da semana da janela de manutenção (por exemplo, TUESDAY).
  • START_TIME: o horário de início UTC da janela de manutenção no formato de dicionário (por exemplo, {hours=1,minutes=0}).

API REST

Para especificar uma janela de manutenção para uma instância, inclua o objeto maintenancePolicy ao atualizar uma instância. Você também precisa especificar o maintenancePolicy no parâmetro de consulta updateMask.

O exemplo de curl a seguir atualiza a política de manutenção de uma instância:

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "maintenancePolicy": {
    "weeklyMaintenanceWindows": [
      {
        "dayOfWeek": "DAY",
        "startTime": {
          "hours": HOURS,
          "minutes": MINUTES
        }
      }
    ]
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"

Substitua:

  • PROJECT_ID: o ID do seu projeto do Google Cloud .
  • LOCATION O local da instância do Managed Lustre.
  • INSTANCE_ID: o ID da instância do Managed Lustre.
  • DAY: o dia da semana da janela de manutenção (por exemplo, TUESDAY).
  • HOURS A hora do dia para o horário de início da janela de manutenção (por exemplo, 3).
  • MINUTES O minuto da hora para o horário de início da janela de manutenção (por exemplo, 45).

Remover uma política de manutenção

Para remover uma política de manutenção de uma instância, limpe todas as janelas de manutenção semanais e de exclusão da política.

Console do Google Cloud

Para remover uma política de manutenção de uma instância, edite a instância e limpe os campos da política de manutenção. Consulte Gerenciar instâncias.

gcloud

Use o comando gcloud lustre instances update com as flags --clear-maintenance-policy-weekly-windows e --clear-maintenance-policy-exclusion-window:

gcloud lustre instances update INSTANCE_ID \
--location=LOCATION \
--clear-maintenance-policy-weekly-windows \
--clear-maintenance-policy-exclusion-window

Substitua:

  • INSTANCE_ID: o ID da sua instância do Managed Lustre.
  • LOCATION: o local da sua instância do Managed Lustre.

API REST

Para remover uma política de manutenção usando a API REST, use o método instances.patch com um objeto maintenancePolicy vazio e o parâmetro de consulta updateMask definido como maintenancePolicy:

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "maintenancePolicy": {}
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=maintenancePolicy"

Substitua:

  • PROJECT_ID: o ID do seu projeto do Google Cloud .
  • LOCATION: o local da instância do Managed Lustre.
  • INSTANCE_ID: o ID da instância do Managed Lustre.

Conferir registros de manutenção

O Managed Lustre usa o Cloud Logging para registrar eventos de manutenção, incluindo os seguintes tipos de atividade:

  • LustreAdvancedNotification: a manutenção foi programada para a instância.
  • LustreOngoingNotification: a manutenção foi iniciada na instância. Depois de concluído, outro evento LustreOngoingNotification é registrado, desta vez com is_completed=true.
  • LustreCancelledNotification: a manutenção foi cancelada.

É possível conferir os registros de manutenção usando a Análise de registros ou a Google Cloud CLI.

Análise de registros

Para conferir os registros de manutenção do Managed Lustre usando a Análise de registros, faça o seguinte:

  1. No console do Google Cloud , acesse a página Cloud Logging > Análise de registros:

    Acessar a Análise de registros

  2. Insira o filtro a seguir no editor de consultas e clique em Executar consulta:

    resource.type="lustre.googleapis.com/Instance"
    resource.labels.instance_id="INSTANCE_ID"
    resource.labels.location="LOCATION"
    logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"
    

CLI da gcloud

Para ver os registros de manutenção com a Google Cloud CLI, execute o comando gcloud logging read:

gcloud logging read 'resource.type="lustre.googleapis.com/Instance" resource.labels.instance_id="INSTANCE_ID" resource.labels.location="LOCATION" logName="projects/PROJECT_ID/logs/lustre.googleapis.com%2Fmaintenance"' --project=PROJECT_ID

Substitua:

  • INSTANCE_ID: o ID da instância do Managed Lustre.
  • LOCATION: a zona em que a instância está localizada.
  • PROJECT_ID: o ID do projeto em que a instância está localizada.

Reprogramar manutenção

Se um evento de manutenção programada entrar em conflito com suas necessidades, você poderá reprogramá-lo. Ao reagendar, você tem as seguintes opções:

  • Imediatamente: reprograme o evento de manutenção para começar assim que possível. Essa opção ignora todas as janelas de manutenção e exclusão configuradas na instância.
  • Próxima janela disponível: reprograma o evento de manutenção para a próxima janela de manutenção disponível. Isso geralmente muda a atualização em uma semana.
  • Por data: reprograma o evento de manutenção para uma data e hora específicas. É possível adiar a manutenção por no máximo 28 dias a partir do horário programado originalmente. Essa opção ignora todas as janelas de manutenção e exclusão configuradas na instância.

Para reprogramar a manutenção:

gcloud

Para iniciar o evento de manutenção o mais rápido possível:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=immediately

Para reagendar a manutenção para a próxima janela disponível:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=next-available-window

Para reagendar a manutenção para um horário específico:

gcloud lustre instances reschedule-maintenance INSTANCE_ID \
--location=LOCATION \
--reschedule-type=by-time \
--reschedule-schedule-time=TIMESTAMP

Substitua:

  • INSTANCE_ID: o ID da sua instância do Managed Lustre.
  • LOCATION: o local da sua instância do Managed Lustre.
  • TIMESTAMP: o horário de início no formato RFC 3339 (por exemplo, 2026-04-30T10:00:00Z). Ele não pode ser posterior a 28 dias do horário originalmente programado.

API REST

Use o método instances.rescheduleMaintenance.

O exemplo de curl a seguir inicia o evento de manutenção assim que possível:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "IMMEDIATELY"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

O exemplo de curl a seguir reprograma a manutenção para a próxima janela disponível:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "NEXT_AVAILABLE_WINDOW"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

O exemplo de curl a seguir remarca a manutenção para um horário específico:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d '{
  "reschedule": {
    "rescheduleType": "BY_TIME",
    "scheduleTime": "TIMESTAMP"
  }
}' "https://lustre.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID:rescheduleMaintenance"

Substitua:

  • PROJECT_ID: o ID do seu projeto do Google Cloud .
  • INSTANCE_ID: o ID da sua instância do Managed Lustre.
  • LOCATION: o local da sua instância do Managed Lustre.
  • TIMESTAMP: o horário de início no formato RFC 3339 (por exemplo, 2026-04-30T10:00:00Z). Ele não pode ser posterior a 28 dias do horário originalmente programado.