Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Accede a instancias de Managed Lustre en GKE con el controlador de CSI de Managed Lustre

En esta guía, se describe cómo puedes crear un nuevo volumen de Kubernetes respaldado por el controlador de CSI de Managed Lustre en GKE con aprovisionamiento dinámico. El controlador CSI de Managed Lustre te permite crear almacenamiento respaldado por instancias de Managed Lustre a pedido y acceder a ellas como volúmenes para tus cargas de trabajo con estado.

Compatibilidad con múltiples NIC para redes de alto rendimiento

En los clústeres de GKE que ejecutan la versión 1.35.2-gke.1842000 o posterior, el controlador de CSI de Managed Lustre está habilitado de forma predeterminada para usar todas las tarjetas de interfaz de red (NIC) disponibles y aumentar la capacidad de procesamiento. Esta compatibilidad agrega ancho de banda distribuyendo el tráfico de almacenamiento de TCP en tus interfaces de red.

Para usar la compatibilidad con varias NIC, tus nodos deben cumplir con los siguientes requisitos:

NICs estándar para TCP: Tus nodos deben usar NICs estándar, como la NIC virtual de Google (gVNIC) o VirtIO-Net, para controlar el tráfico de almacenamiento de TCP.
Misma VPC: Todas las NIC estándar deben residir en la misma red de VPC.
Consideraciones sobre RDMA: Tus nodos también pueden tener NIC de RDMA conectadas. Sin embargo, el controlador CSI de Managed Lustre solo usa las NIC estándar para el tráfico de almacenamiento TCP.

Si deseas inhabilitar la compatibilidad con varias NIC, consulta Inhabilita varias NIC para Lustre.

Puertos de comunicación de Lustre

El controlador de CSI de Managed Lustre administrado por GKE usa diferentes puertos para comunicarse con las instancias de Managed Lustre, según la versión del clúster de GKE y las configuraciones existentes de Managed Lustre.

Puerto predeterminado (recomendado): Para los clústeres de GKE nuevos que ejecutan la versión 1.33.2-gke.4780000 o posterior, el controlador usa el puerto 988 para la comunicación de Lustre de forma predeterminada.
Puerto heredado (obsoleto): Usa el puerto 6988 agregando la marca --enable-legacy-lustre-port a tus comandos gcloud en las siguientes situaciones:
- Versiones anteriores de GKE: Si tu clúster de GKE ejecuta una versión anterior a 1.33.2-gke.4780000, la marca --enable-legacy-lustre-port soluciona un conflicto de puertos con gke-metadata-server en los nodos de GKE.
- Instancias de Lustre existentes: Si te conectas a una instancia de Managed Lustre existente que se creó con la marca gke-support-enabled, debes incluir --enable-legacy-lustre-port en tus comandos gcloud, independientemente de la versión del clúster. Sin esta marca, tu clúster de GKE no podrá activar la instancia de Lustre existente.

Puedes configurar los clústeres nuevos y existentes para que usen el puerto predeterminado 988 o el puerto heredado 6988.

Antes de comenzar

Antes de comenzar, asegúrate de haber realizado las siguientes tareas:

Habilita la API de Google Cloud Managed Lustre y la API de Google Kubernetes Engine.

Habilita las APIs

Si deseas usar Google Cloud CLI para esta tarea, instala y, luego, inicializa gcloud CLI. Si ya instalaste la gcloud CLI, ejecuta el comando gcloud components update para obtener la versión más reciente. Es posible que las versiones anteriores de la gcloud CLI no admitan la ejecución de los comandos que se describen en este documento.
Nota: Para las instalaciones de gcloud CLI existentes, asegúrate de configurar la propiedad compute/region. Si usas principalmente clústeres zonales, configura compute/zone en su lugar. Cuando configuras una ubicación predeterminada, puedes evitar errores en gcloud CLI como el siguiente: One of [--zone, --region] must be supplied: Please specify location. Es posible que debas especificar la ubicación en ciertos comandos si la ubicación de tu clúster difiere de la predeterminada que estableciste.

Para conocer las limitaciones y los requisitos, consulta la descripción general del controlador de CSI.
Asegúrate de habilitar el controlador Managed Lustre CSI. Está inhabilitado de forma predeterminada en los clústeres de Standard y Autopilot.

Configura variables de entorno

Configura las siguientes variables de entorno:

export CLUSTER_NAME=CLUSTER_NAME
export PROJECT_ID=PROJECT_ID
export NETWORK_NAME=LUSTRE_NETWORK
export IP_RANGE_NAME=LUSTRE_IP_RANGE
export FIREWALL_RULE_NAME=LUSTRE_FIREWALL_RULE
export LOCATION=ZONE
export CLUSTER_VERSION=CLUSTER_VERSION

Reemplaza lo siguiente:

CLUSTER_NAME: el nombre del clúster
PROJECT_ID: Es el Google Cloud ID del proyecto.
LUSTRE_NETWORK: Es la red de nube privada virtual (VPC) compartida en la que residen tanto el clúster de GKE como la instancia de Managed Lustre.
LUSTRE_IP_RANGE: Es el nombre del rango de direcciones IP creado para el peering de redes de VPC con Managed Lustre.
LUSTRE_FIREWALL_RULE: Es el nombre de la regla de firewall para permitir el tráfico TCP desde el rango de direcciones IP.
ZONE: La zona geográfica de tu clúster de GKE, por ejemplo, us-central1-a.
CLUSTER_VERSION: Es la versión del clúster de GKE.

Configura una red de VPC

Debes especificar la misma red de VPC cuando crees la instancia de Managed Lustre y tus clústeres de GKE, o bien conectarte a través de Network Connectivity Center si usas una red de VPC con intercambio de tráfico.

Para habilitar las redes de servicio, ejecuta el siguiente comando:

gcloud services enable servicenetworking.googleapis.com \
    --project=${PROJECT_ID}

Crear una red de VPC. Si estableces la marca --mtu en 8896, se obtiene un aumento del rendimiento del 10%.

gcloud compute networks create ${NETWORK_NAME} \
    --subnet-mode=auto --project=${PROJECT_ID} \
    --mtu=8896

Crea un rango de direcciones IP.

gcloud compute addresses create ${IP_RANGE_NAME} \
    --global \
    --purpose=VPC_PEERING \
    --prefix-length=20 \
    --description="Managed Lustre VPC Peering" \
    --network=${NETWORK_NAME} \
    --project=${PROJECT_ID}

Obtén el rango de CIDR asociado al rango que creaste en el paso anterior.

CIDR_RANGE=$(
  gcloud compute addresses describe ${IP_RANGE_NAME} \
      --global  \
      --format="value[separator=/](address, prefixLength)" \
      --project=${PROJECT_ID}
)

Crea una regla de firewall para permitir el tráfico de TCP desde el rango de direcciones IP que creaste.

gcloud compute firewall-rules create ${FIREWALL_RULE_NAME} \
    --allow=tcp:988,tcp:6988 \
    --network=${NETWORK_NAME} \
    --source-ranges=${CIDR_RANGE} \
    --project=${PROJECT_ID}

Para configurar el intercambio de tráfico entre redes de tu proyecto, verifica que tengas los permisos de IAM necesarios, específicamente el rol compute.networkAdmin o servicenetworking.networksAdmin.
1. Ve a Google Cloud console > IAM y administración y, luego, busca la principal del propietario del proyecto.
2. Haz clic en el ícono de lápiz y, luego, en + AGREGAR OTRO ROL.
3. Selecciona Administrador de red de Compute o Administrador de redes de servicio.
4. Haz clic en Guardar.

Conecta el intercambio de tráfico.

gcloud services vpc-peerings connect \
    --network=${NETWORK_NAME} \
    --project=${PROJECT_ID} \
    --ranges=${IP_RANGE_NAME} \
    --service=servicenetworking.googleapis.com

Configura el controlador Managed Lustre CSI

En esta sección, se explica cómo habilitar e inhabilitar el controlador CSI de Managed Lustre.

Habilita el controlador de CSI de Managed Lustre en un clúster de GKE nuevo

En las siguientes secciones, se describe cómo habilitar el controlador de CSI de Managed Lustre en un clúster de GKE nuevo.

Usa el puerto predeterminado `988`

Para habilitar el controlador de CSI de Managed Lustre cuando crees un clúster de GKE nuevo que ejecute la versión 1.33.2-gke.4780000 o posterior, ejecuta el siguiente comando:

Autopilot

gcloud container clusters create-auto "${CLUSTER_NAME}" \
    --location=${LOCATION} \
    --network="${NETWORK_NAME}" \
    --cluster-version=${CLUSTER_VERSION} \
    --enable-lustre-csi-driver

Estándar

gcloud container clusters create "${CLUSTER_NAME}" \
    --location=${LOCATION} \
    --network="${NETWORK_NAME}" \
    --cluster-version=${CLUSTER_VERSION} \
    --addons=LustreCsiDriver

Usa el puerto heredado `6988`

Para habilitar el controlador de CSI de Managed Lustre cuando creas un clúster de GKE nuevo que ejecuta una versión anterior a 1.33.2-gke.4780000, ejecuta el siguiente comando:

Autopilot

gcloud container clusters create-auto "${CLUSTER_NAME}" \
    --location=${LOCATION} \
    --network="${NETWORK_NAME}" \
    --cluster-version=${CLUSTER_VERSION} \
    --enable-lustre-csi-driver \
    --enable-legacy-lustre-port

Estándar

gcloud container clusters create "${CLUSTER_NAME}" \
    --location=${LOCATION} \
    --network="${NETWORK_NAME}" \
    --cluster-version=${CLUSTER_VERSION} \
    --addons=LustreCsiDriver \
    --enable-legacy-lustre-port

Habilita el controlador de CSI de Managed Lustre en clústeres de GKE existentes

En las siguientes secciones, se describe cómo habilitar el controlador de CSI de Managed Lustre en clústeres de GKE existentes.

Usa el puerto predeterminado `988`

Para habilitar el controlador de CSI de Managed Lustre en un clúster de GKE existente que ejecute la versión 1.33.2-gke.4780000 o posterior, ejecuta el siguiente comando:

  gcloud container clusters update ${CLUSTER_NAME} \
      --location=${LOCATION} \
      --update-addons=LustreCsiDriver=ENABLED

Usa el puerto heredado `6988`

Para habilitar el controlador de CSI de Managed Lustre en un clúster de GKE existente, es posible que debas usar el puerto heredado 6988 agregando la marca --enable-legacy-lustre-port. Esta marca es obligatoria en los siguientes casos:

Si tu clúster de GKE se ejecuta en una versión anterior a 1.33.2-gke.4780000

Si planeas conectar este clúster a una instancia de Managed Lustre existente que se creó con la marca gke-support-enabled

gcloud container clusters update ${CLUSTER_NAME} \
    --location=${LOCATION} \
    --enable-legacy-lustre-port

Se requiere la actualización de nodos en clústeres existentes

Habilitar el controlador de CSI de Managed Lustre en clústeres existentes puede activar la recreación de nodos para actualizar los módulos del kernel necesarios para el cliente de Managed Lustre. Para que estén disponibles de inmediato, te recomendamos que actualices manualmente tus grupos de nodos.

Los clústeres de GKE en un canal de versiones se actualizan según el lanzamiento programado, que puede tardar varias semanas según tu período de mantenimiento. Si usas una versión estática de GKE, debes actualizar de forma manual tus grupos de nodos.

Hasta que se complete la actualización del nodo, es posible que el Pod del controlador CSI se reinicie en bucle en los nodos pendientes de actualización. Si ves un error Operation not permitted en los registros del Pod del controlador de CSI, esto indica que se requiere la actualización o la recreación del nodo.

Después de la actualización del grupo de nodos, es posible que los nodos de CPU parezcan usar una imagen de GPU en la consola de Google Cloud o en el resultado de la CLI. Se espera que esto suceda. La imagen de GPU se reutiliza en los nodos de CPU para instalar de forma segura los módulos del kernel de Managed Lustre. No se te cobrará por el uso de la GPU.

Crea un grupo de nodos con varias NIC (opcional)

Para usar redes de alto rendimiento, debes crear un grupo de nodos con un tipo de instancia que admita varias interfaces de red. La compatibilidad con varias NIC está habilitada de forma predeterminada en los clústeres de GKE que ejecutan la versión 1.35.2-gke.1842000 o posterior. Asegúrate de que tus interfaces de red secundarias residan en la misma red de VPC que tu interfaz principal.

Ejecuta el comando siguiente:

gcloud container node-pools create NODE_POOL_NAME \
    --cluster=CLUSTER_NAME \
    --location=LOCATION \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic \
    --additional-node-network network=NETWORK_NAME,subnetwork=SECONDARY_SUBNET

Reemplaza lo siguiente:

NODE_POOL_NAME: es el nombre de tu grupo de nodos.
CLUSTER_NAME: El nombre de tu clúster.
LOCATION: Es la región o zona de tu clúster.
MACHINE_TYPE: Es el tipo de máquina del grupo de nodos, como a3-megagpu-8g, que se suele usar con varias NIC para obtener un alto rendimiento. Se admiten varias NIC en cualquier tipo de máquina.
NETWORK_NAME: Es el nombre de la red de VPC.
SECONDARY_SUBNET: Es el nombre de la subred secundaria.

Inhabilita varias NIC en Lustre

Si bien se recomienda la compatibilidad con varias NIC para las cargas de trabajo de alto rendimiento, es posible que desees inhabilitarla en situaciones específicas. Por ejemplo, es posible que no desees propagar el tráfico de Lustre en todas las interfaces de hardware disponibles o que necesites aislar los problemas de conectividad en una sola ruta de red para solucionar problemas.

Nota: Si inhabilitas la compatibilidad con varias NIC en los nodos en ejecución, es posible que debas volver a crear o actualizar manualmente tus grupos de nodos para que este cambio surta efecto.

Para un clúster

Para inhabilitar las redes de alto rendimiento en todo el clúster, usa la marca --disable-multi-nic-lustre cuando crees o actualices el clúster. Por ejemplo:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --disable-multi-nic-lustre

Reemplaza lo siguiente:

CLUSTER_NAME: El nombre de tu clúster.
LOCATION: Es la región o zona de tu clúster.

Para un grupo de nodos

Para inhabilitar las redes de alto rendimiento en un grupo de nodos específico, actualiza el grupo de nodos para establecer la etiqueta lustre.csi.storage.gke.io/multi-nic en false:

gcloud container node-pools update NODE_POOL_NAME \
--cluster=CLUSTER_NAME \
--zone=LOCATION \
--node-labels=lustre.csi.storage.gke.io/multi-nic=false

Reemplaza lo siguiente:

NODE_POOL_NAME: es el nombre de tu grupo de nodos.
CLUSTER_NAME: El nombre de tu clúster.
LOCATION: Es la zona del clúster.

Inhabilita el controlador de CSI de Managed Lustre

Puedes inhabilitar el controlador de CSI de Managed Lustre en un clúster de GKE existente con Google Cloud CLI.

gcloud container clusters update ${CLUSTER_NAME} \
    --location=${LOCATION} \
    --update-addons=LustreCsiDriver=DISABLED

Después de inhabilitar el controlador de CSI, GKE vuelve a crear automáticamente tus nodos y desinstala los módulos del kernel de Managed Lustre.

Crea un volumen nuevo con el controlador CSI de Managed Lustre

En las siguientes secciones, se describe el proceso típico para crear un volumen de Kubernetes respaldado por una instancia de Managed Lustre en GKE:

Crea un StorageClass.
Usa un objeto PersistentVolumeClaim para acceder al volumen
Crea una carga de trabajo que consuma el volumen

Crea un StorageClass

Cuando se habilita el controlador CSI de Managed Lustre, GKE crea automáticamente una StorageClass para aprovisionar instancias de Managed Lustre. La StorageClass depende del nivel de rendimiento de Managed Lustre y es una de las siguientes:

lustre-rwx-125mbps-per-tib
lustre-rwx-250mbps-per-tib
lustre-rwx-500mbps-per-tib
lustre-rwx-1000mbps-per-tib

GKE proporciona un StorageClass predeterminado para cada nivel de rendimiento de Managed Lustre compatible. Esto simplifica el aprovisionamiento dinámico de instancias de Managed Lustre, ya que puedes usar las StorageClasses integradas sin tener que definir las tuyas.

En el caso de los clústeres zonales, el controlador de CSI aprovisiona instancias de Managed Lustre en la misma zona que el clúster. En el caso de los clústeres regionales, aprovisiona la instancia en una de las zonas de la región.

En el siguiente ejemplo, se muestra cómo crear una StorageClass personalizada con requisitos de topología específicos:

Guarda el siguiente manifiesto como un archivo llamado lustre-class.yaml:

apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: lustre-class
provisioner: lustre.csi.storage.gke.io
volumeBindingMode: Immediate
reclaimPolicy: Delete
parameters:
  perUnitStorageThroughput: "1000"
  network: LUSTRE_NETWORK
allowedTopologies:
- matchLabelExpressions:
  - key: topology.gke.io/zone
    values:
    - us-central1-a

Para obtener la lista completa de los campos admitidos en StorageClass, consulta la documentación de referencia del controlador de CSI de Managed Lustre.

Para crear una StorageClass, ejecuta este comando:
```
kubectl apply -f lustre-class.yaml
```

Usa un objeto PersistentVolumeClaim para acceder al volumen

En esta sección, se muestra cómo crear un recurso de PersistentVolumeClaim que haga referencia a la StorageClass del controlador de CSI de Lustre administrado.

Guarda el siguiente manifiesto como un archivo llamado lustre-pvc.yaml:
```
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: lustre-pvc
spec:
  accessModes:
  - ReadWriteMany
  resources:
    requests:
      storage: 9000Gi
  storageClassName: lustre-class
```
Advertencia: En el caso de los clústeres de GKE que ejecutan versiones anteriores a 1.35.0-gke.2331000, no se admite el cambio de tamaño de almacenamiento de la PVC, por lo que debes volver a crear la PVC con el nuevo tamaño. Para obtener más información, consulta Limitaciones. Para aumentar la capacidad de almacenamiento de los clústeres que ejecutan la versión 1.35.0-gke.2331000 o posterior, consulta Cómo escalar tu almacenamiento de Managed Lustre en GKE.

Para obtener la lista completa de los campos admitidos en PersistentVolumeClaim, consulta la documentación de referencia del controlador de CSI de Managed Lustre.
Ejecuta el siguiente comando para crear la PersistentVolumeClaim:
```
kubectl apply -f lustre-pvc.yaml
```

Crea una carga de trabajo para consumir el volumen

En esta sección, se muestra un ejemplo de cómo crear un Pod que consuma el recurso de PersistentVolumeClaim que creaste antes.

Varios Pods pueden compartir el mismo recurso PersistentVolumeClaim.

Guarda el siguiente manifiesto como un archivo llamado my-pod.yaml.

apiVersion: v1
kind: Pod
metadata:
  name: my-pod
spec:
  containers:
  - name: nginx
    image: nginx
    volumeMounts:
      - name: lustre-volume
        mountPath: /data
  volumes:
  - name: lustre-volume
    persistentVolumeClaim:
      claimName: lustre-pvc

Aplica el manifiesto al clúster.
```
kubectl apply -f my-pod.yaml
```
Verificar que el pod se esté ejecutando. El Pod se ejecuta después de que se aprovisiona el PersistentVolumeClaim. Esta operación puede tardar unos minutos en completarse.
```
kubectl get pods
```
El resultado es similar a lo siguiente:
```
NAME           READY   STATUS    RESTARTS   AGE
my-pod         1/1     Running   0          11s
```

Usa fsGroup con volúmenes de Managed Lustre

Puedes cambiar la propiedad del grupo del directorio de nivel raíz del sistema de archivos montado para que coincida con un fsGroup solicitado por el usuario y especificado en el SecurityContext del Pod. fsGroup no cambiará de forma recursiva la propiedad de todo el sistema de archivos Managed Lustre montado; solo se verá afectado el directorio raíz del punto de montaje.

Soluciona problemas

Para obtener orientación sobre la solución de problemas, consulta la página de solución de problemas en la documentación de Managed Lustre.

Realiza una limpieza

Para evitar que se apliquen cargos a tu cuenta de Google Cloud , borra los recursos de almacenamiento que creaste en esta guía.

Borra el Pod y el PersistentVolumeClaim.

Nota: Si creas el PersistentVolume con un persistentVolumeReclaimPolicy "Delete", borrar el PersistentVolumeClaim también borrará el PersistentVolume y la instancia de Managed Lustre subyacente.
```
kubectl delete pod my-pod
kubectl delete pvc lustre-pvc
```
Verifica el estado de PersistentVolume.
```
kubectl get pv
```
El resultado es similar a lo siguiente:
```
No resources found
```
Es posible que la instancia subyacente de Lustre administrado tarde unos minutos en borrarse por completo.

¿Qué sigue?

Explora la documentación de Managed Lustre.

Accede a instancias de Managed Lustre en GKE con el controlador de CSI de Managed Lustre Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Compatibilidad con múltiples NIC para redes de alto rendimiento

Puertos de comunicación de Lustre

Antes de comenzar

Configura variables de entorno

Configura una red de VPC

Configura el controlador Managed Lustre CSI

Habilita el controlador de CSI de Managed Lustre en un clúster de GKE nuevo

Usa el puerto predeterminado 988

Autopilot

Estándar

Usa el puerto heredado 6988

Autopilot

Estándar

Habilita el controlador de CSI de Managed Lustre en clústeres de GKE existentes

Usa el puerto predeterminado 988

Usa el puerto heredado 6988

Se requiere la actualización de nodos en clústeres existentes

Crea un grupo de nodos con varias NIC (opcional)

Inhabilita varias NIC en Lustre

Para un clúster

Para un grupo de nodos

Inhabilita el controlador de CSI de Managed Lustre

Crea un volumen nuevo con el controlador CSI de Managed Lustre

Crea un StorageClass

Usa un objeto PersistentVolumeClaim para acceder al volumen

Crea una carga de trabajo para consumir el volumen

Usa fsGroup con volúmenes de Managed Lustre

Soluciona problemas

Realiza una limpieza

¿Qué sigue?

Accede a instancias de Managed Lustre en GKE con el controlador de CSI de Managed Lustre

Usa el puerto predeterminado `988`

Usa el puerto heredado `6988`

Usa el puerto predeterminado `988`

Usa el puerto heredado `6988`