Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Memahami keputusan autoscaler

Penskalaan otomatis akan otomatis menambahkan VM (menskalakan) atau menghapus VM (menurunkan skala) dari grup instance terkelola (MIG). Dokumen ini menjelaskan cara autoscaler menentukan waktu untuk menskalakan MIG Anda.

Cara autoscaler menghitung ukuran yang direkomendasikan dan memengaruhi ukuran target

Saat Anda mengonfigurasi autoscaler untuk MIG, autoscaler akan terus memantau grup dan menghitung ukuran yang direkomendasikan—jumlah VM yang diperlukan untuk melayani beban yang diamati. MIG kemudian menggunakan rekomendasi ini untuk menetapkan ukuran target grup.

Penghitungan ukuran yang direkomendasikan

Autoscaler menghitung ulang ukuran yang direkomendasikan secara konstan berdasarkan hal berikut:

Secara default, autoscaler menetapkan ukuran yang direkomendasikan untuk menangani beban puncak yang diamati selama periode stabilisasi.
Jika penskalaan otomatis prediktif diaktifkan, autoscaler akan memperkirakan beban mendatang berdasarkan penggunaan CPU historis dan menetapkan ukuran yang direkomendasikan berdasarkan prediksi.

Anda dapat memeriksa ukuran yang direkomendasikan dengan melihat diagram Ukuran grup di konsol Google Cloud . Jika Anda menggunakan Google Cloud CLI atau Compute Engine API, dapatkan informasi autoscaler dan cari kolom recommendedSize dalam output.

Batasan pada ukuran yang direkomendasikan

Ukuran akhir yang direkomendasikan tunduk pada batasan berikut:

Instance minimum dan maksimum: Ukuran harus berada dalam batas yang ditetapkan dalam kebijakan penskalaan otomatis Anda.
Kontrol penurunan skala: Jika Anda telah mengonfigurasi kontrol penurunan skala dalam kebijakan penskalaan otomatis, autoscaler akan membatasi seberapa besar ukuran yang direkomendasikan dapat berkurang sekaligus untuk mencegah penurunan kapasitas yang tiba-tiba.

Pengaruh pada ukuran target

Respons MIG terhadap ukuran yang direkomendasikan bergantung pada mode autoscaler:

ON: MIG menetapkan ukuran targetnya ke ukuran yang direkomendasikan dan menskalakan grup dengan tepat.
ONLY_SCALE_OUT: Ukuran target hanya bertambah jika ukuran yang direkomendasikan bertambah. Ukuran ini tidak berkurang meskipun ukuran yang direkomendasikan menurun.
OFF: Ukuran target tetap tidak berubah. Autoscaler masih menghitung ukuran yang direkomendasikan di latar belakang, tetapi tidak menerapkannya ke ukuran target.

Jika Anda menghapus konfigurasi autoscaler, autoscaler akan berhenti menghitung ukuran yang direkomendasikan.

Kesenjangan antara metrik pemakaian target dan pemakaian aktual

Saat menggunakan kebijakan penskalaan otomatis dengan sinyal berbasis metrik, Anda mungkin melihat bahwa, untuk grup instance yang lebih kecil, pemakaian aktual dari grup instance dan pemakaian target mungkin tampak berselisih jauh. Hal ini karena autoscaler selalu bertindak secara konservatif dengan membulatkan ke atas atau ke bawah saat menafsirkan data pemakaian dan menentukan jumlah instance yang akan ditambahkan atau dihapus. Hal ini mencegah autoscaler menambahkan jumlah resource yang tidak memadai atau menghapus terlalu banyak resource.

Misalnya, jika Anda menetapkan target pemakaian sebesar 0,7 dan aplikasi melebihi target pemakaian, autoscaler mungkin menentukan bahwa menambahkan 1,5 instance virtual machine (VM) akan mengurangi pemakaian hingga mendekati 0,7. Karena Anda tidak dapat menambahkan 1,5 instance VM, autoscaler akan membulatkan ke atas dan menambahkan dua instance. Hal ini dapat mengurangi rata-rata pemakaian CPU ke nilai di bawah 0,7, tetapi memastikan bahwa aplikasi Anda memiliki cukup resource untuk mendukungnya.

Demikian pula, jika autoscaler menentukan bahwa penghapusan 1,5 instance VM akan meningkatkan pemakaian Anda hingga terlalu mendekati 0,7, sehingga hanya akan menghapus satu instance.

Untuk grup yang lebih besar dengan lebih banyak instance VM, pemakaiannya dibagi berdasarkan jumlah instance yang lebih besar, dan penambahan atau penghapusan instance VM akan mengurangi kesenjangan antara pemakaian aktual dan pemakaian target.

Jika Anda menggunakan penskalaan otomatis berbasis jadwal dengan sinyal penskalaan otomatis lain, jadwal aktif mungkin memerlukan lebih banyak VM daripada kebutuhan pemakaian Anda. Dalam situasi ini, pemakaian aktual Anda lebih rendah daripada pemakaian target karena jadwal penskalaan otomatis menentukan ukuran grup instance yang direkomendasikan.

Penundaan dalam penyebaran skala

Saat mengonfigurasi penskalaan otomatis, Anda menentukan periode inisialisasi yang mencerminkan durasi waktu yang diperlukan VM untuk melakukan inisialisasi. Autoscaler hanya merekomendasikan penyebaran skala jika pemakaian rata-rata dari instance yang tidak melakukan inisialisasi lebih besar dari pemakaian target.

Jika Anda menetapkan nilai periode inisialisasi yang secara signifikan lebih lama daripada waktu yang diperlukan suatu instance untuk diinisialisasi, autoscaler mungkin akan mengabaikan data pemakaian yang sah, dan mungkin meremehkan ukuran grup yang diperlukan.

Penundaan dalam penurunan skala

Untuk tujuan penurunan skala, autoscaler akan menghitung ukuran target grup yang direkomendasikan berdasarkan beban puncak selama periode stabilisasi.

Mengamati pemakaian selama periode stabilisasi akan membantu autoscaler:

Pastikan informasi pemakaian yang dikumpulkan dari grup instance stabil.
Cegah perilaku saat autoscaler terus menambahkan atau menghapus instance dengan kecepatan yang berlebihan.
Hapus instance secara aman dengan menentukan bahwa ukuran grup yang lebih kecil sudah cukup untuk mendukung beban puncak dari periode stabilisasi.

Periode stabilisasi mungkin muncul sebagai penundaan dalam penurunan skala, tetapi sebenarnya ini adalah fitur bawaan dari penskalaan otomatis. Periode stabilisasi juga memastikan bahwa jika instance baru ditambahkan ke grup instance terkelola, instance akan berjalan selama periode stabilisasi sebelum memenuhi syarat untuk dihapus.

Periode inisialisasi untuk instance baru akan diabaikan saat memutuskan apakah akan melakukan penurunan skala dalam grup atau tidak.

Pengosongan koneksi yang menyebabkan penundaan

Jika grup adalah bagian dari layanan backend yang telah mengaktifkan pengosongan koneksi, diperlukan waktu tambahan hingga 60 detik setelah durasi pengosongan koneksi berlalu sebelum instance VM dihapus.

Kontrol penurunan skala

Saat mengonfigurasi kontrol penurunan skala autoscaler, Anda mengontrol kecepatan penurunan skala. Autoscaler tidak pernah menurunkan skala lebih cepat daripada laju yang Anda konfigurasi:

Autoscaler dengan dan tanpa kontrol penurunan skala.

Saat beban menurun, autoscaler mempertahankan ukuran untuk grup pada tingkat yang diperlukan untuk menyalurkan beban puncak yang diamati dalam (periode stabilisasi). Ini berfungsi sama dengan dan tanpa kontrol penurunan skala.
Autoscaler tanpa kontrol penurunan skala hanya mempertahankan cukup instance yang diperlukan untuk menangani beban yang baru diamati. Setelah periode stabilisasi, autoscaler akan menghapus semua instance yang tidak diperlukan dalam satu langkah. Dengan penurunan beban yang tiba-tiba, hal ini dapat menyebabkan penurunan ukuran grup instance secara drastis.
Autoscaler dengan kontrol penurunan skala membatasi jumlah instance VM yang dapat dihapus dalam jangka waktu yang telah dikonfigurasi (di sini, 10 VM dalam waktu 20 menit). Tindakan ini memperlambat laju pengurangan instance.
Dengan lonjakan beban baru, autoscaler menambahkan instance baru untuk menangani beban. Namun, karena waktu inisialisasi yang lama, VM baru belum siap menyalurkan beban. Dengan kontrol penurunan skala, kapasitas sebelumnya dipertahankan, sehingga VM yang ada dapat menyalurkan lonjakan.

Anda mengontrol laju penurunan skala dengan mengonfigurasi pengurangan maksimum yang diizinkan untuk Autoscaler selama periode waktu tambahan, khususnya:

Pengurangan maksimum yang diizinkan (maxScaledInReplicas: jumlah atau % instance VM). Jumlah instance yang dapat hilang dari workload Anda (dari ukuran puncak grup) dalam periode waktu tambahan yang ditentukan. Gunakan parameter ini untuk membatasi seberapa banyak grup yang dapat diskalakan turun agar Anda masih dapat menyalurkan kemungkinan lonjakan beban sampai lebih banyak instance mulai menyalurkan. Makin rendah pengurangan maksimum yang diizinkan, makin lambat laju penurunan skala.
Periode waktu tambahan (timeWindowSec: detik). Waktu saat lonjakan beban cenderung mengikuti penurunan sementara dan saat Anda tidak ingin ukuran grup diskalakan turun melebihi pengurangan maksimum yang diizinkan. Gunakan parameter ini untuk menentukan jangka waktu saat autoscaler akan mencari ukuran puncak yang cukup untuk menyalurkan beban historis. Autoscaler tidak akan mengubah ukuran di bawah pengurangan maksimum yang diizinkan yang dikurangi dari ukuran puncak yang diamati pada periode waktu tambahan. Dengan periode waktu tambahan yang lebih lama, autoscaler akan mempertimbangkan lebih banyak beban puncak historis, sehingga penurunan skala menjadi lebih konservatif dan stabil.

Saat Anda menetapkan kontrol penurunan skala, autoscaler akan membatasi operasi penurunan skala hingga ke pengurangan maksimum yang diizinkan dari ukuran puncak yang diamati pada periode waktu tambahan. Autoscaler menggunakan langkah-langkah berikut:

Terus memantau ukuran puncak historis yang teramati pada periode waktu tambahan.
Menggunakan pengurangan maksimum yang diizinkan untuk menghitung ukuran penurunan skala yang dibatasi (ukuran puncak: maxScaledInReplicas)
Menetapkan ukuran yang direkomendasikan grup ke ukuran penurunan skala yang dibatasi. Misalnya, jika autoscaler akan mengubah ukuran grup instance menjadi 20 VM tetapi batasan penurunan skala hanya mengizinkan penurunan skala hingga 40 VM, ukuran yang direkomendasikan akan ditetapkan ke 40 VM.

Dengan kontrol penurunan skala, autoscaler terus memantau ukuran puncak grup instance dalam jangka waktu tambahan yang dikonfigurasi untuk mengidentifikasi ukuran yang memadai untuk menyalurkan beban historis. Autoscaler tidak menurunkan skala melebihi pengurangan maksimum yang diizinkan yang diukur dari ukuran puncak yang diamati:

Autoscaler dengan kontrol penurunan skala.

Misalnya, pada diagram sebelumnya, kontrol penurunan skala dikonfigurasi untuk pengurangan maksimum yang diizinkan sebesar 20 VM dalam periode waktu tambahan 30 menit:

Saat beban turun, autoscaler akan menghapus 20 VM, yang merupakan pengurangan maksimum yang diizinkan yang dikonfigurasi dalam kontrol penurunan skala.
Seiring kenaikan dan penurunan beban, autoscaler terus-menerus memantau periode waktu tambahan 30 menit terakhir agar ukuran puncak yang cukup dapat menyalurkan beban historis. Ukuran puncak ini digunakan sebagai dasar bagi kontrol penurunan skala untuk membatasi laju penurunan skala. Jika, dalam 30 menit terakhir, ukuran puncak adalah 70 VM dan pengurangan maksimum yang diizinkan ditetapkan di angka 20 VM, autoscaler dapat menurunkan skala menjadi 50 VM. Jika ukurannya saat ini adalah 65 VM, autoscaler hanya dapat menghapus 15 VM.
Saat beban berkurang, autoscaler akan terus menghapus instance VM, tetapi membatasi lajunya hingga maksimal 20 VM dari ukuran grup instance puncak yang diukur dalam 30 menit terakhir.

Pengurangan ukuran grup maksimum yang diizinkan dapat terjadi sekaligus, sehingga Anda harus mengonfigurasi pengurangan maksimum yang diizinkan agar aplikasi dapat kehilangan instance sebanyak itu sekaligus. Gunakan parameter pengurangan maksimum yang diizinkan untuk menunjukkan seberapa besar pengurangan kapasitas penyaluran yang dapat ditoleransi oleh aplikasi Anda.

Dengan membatasi jumlah instance VM yang dapat dihapus oleh penskalaan otomatis dan dengan menambah periode waktu tambahan yang diamati, aplikasi dengan lonjakan beban dan waktu inisialisasi yang panjang akan mengalami peningkatan ketersediaan. Secara khusus, ukuran grup instance tidak turun secara tiba-tiba sebagai respons terhadap penurunan beban yang signifikan, melainkan menurun secara bertahap dari waktu ke waktu. Jika lonjakan beban terjadi segera setelah penskalaan turun, jumlah VM yang tersisa masih dapat menyerap lonjakan tersebut dalam toleransi Anda. Selain itu, VM yang lebih sedikit harus dimulai agar dapat melayani lonjakan secara memadai.

Anda dapat mengonfigurasi kontrol penskalaan turun untuk penskalaan otomatis MIG zona maupun regional. Konfigurasi tersebut sama untuk kedua kasus. Kontrol penskalaan turun berfungsi untuk semua ukuran grup.

Kontrol penurunan skala versus stabilisasi autoscaler

Mengonfigurasi kontrol penurunan skala tidak berarti menonaktifkan mekanisme stabilisasi autoscaler. Autoscaler selalu mempertahankan ukuran grup instance pada tingkat yang diperlukan untuk menyalurkan beban puncak, yang diamati selama periode stabilisasi. Kontrol penskalaan turun memberi Anda mekanisme tambahan untuk mengontrol laju saat ukuran grup instance diubah.

	Periode stabilisasi	Kontrol penskalaan turun: Periode waktu tambahan
Dapat dikonfigurasi?	Ya, dapat dikonfigurasi	Ya, dapat dikonfigurasi
Apa yang dipantau?	Memantau beban puncak selama durasi sebelumnya yang ditetapkan oleh periode stabilisasi.	Memantau ukuran puncak grup instance dalam periode sebelumnya yang ditetapkan oleh periode waktu tambahan.
Bagaimana cara ini membantu?	Memastikan bahwa ukuran grup instance tetap memadai untuk menyalurkan beban puncak yang diamati selama periode stabilisasi.	Memastikan bahwa ukuran grup instance tidak dikurangi oleh lebih banyak instance VM daripada yang dapat ditoleransi oleh workload Anda saat menangani lonjakan beban selama jangka waktu yang ditentukan.

Kontrol penurunan skala dengan mode autoscaler

Ada dua skenario serupa yang sedikit berbeda saat MIG Anda tidak diskalakan otomatis dan Anda ingin mengaktifkan penskalaan otomatis. Hal ini bergantung pada apakah Anda mengonfigurasi penskalaan otomatis untuk pertama kalinya atau apakah penskalaan otomatis dikonfigurasi tetapi dibatasi atau dinonaktifkan sementara.

Mengonfigurasi autoscaler untuk pertama kalinya

Jika Anda memiliki MIG yang tidak diskalakan otomatis dan mengonfigurasi penskalaan otomatis dari awal, autoscaler akan menggunakan ukuran MIG saat ini sebagai titik awal. Sebelum melakukan penurunan skala, autoscaler menggunakan periode stabilisasi, lalu menggunakan kontrol penurunan skala untuk membatasi laju penurunan skala:

Mengonfigurasi autoscaler untuk pertama kalinya.

Mengubah mode autoscaler

Dengan mode penskalaan otomatis, Anda dapat menonaktifkan atau membatasi aktivitas penskalaan otomatis untuk sementara. Konfigurasi autoscaler tetap dipertahankan dan autoscaler akan terus melakukan penghitungan latar belakang saat autoscaler nonaktif atau dibatasi. Autoscaler memperhitungkan kontrol penurunan skala dalam penghitungan latar belakangnya saat berada dalam mode nonaktif atau dibatasi. Semua aktivitas penskalaan otomatis dilanjutkan menggunakan penghitungan terbaru saat Anda mengaktifkan kembali penskalaan otomatis atau saat Anda mencabut pembatasan:

Melanjutkan kembali autoscaler termasuk kontrol penurunan skala.

Autoscaler yang di-AKTIF-kan akan berperilaku seperti biasa (dalam kasus ini dengan kontrol penurunan skala).
Saat Anda MENONAKTIFKAN autoscaler, autoscaler akan tetap menghitung ukuran grup instance yang direkomendasikan berdasarkan beban. Perhitungan autoscaler masih mempertimbangkan kontrol penurunan skala. Namun, autoscaler tidak menerapkan penghitungan ukuran saat autoscaler NONAKTIF. Ukuran grup instance tetap konstan hingga autoscaler kembali AKTIF.
Saat Anda MENGAKTIFKAN lagi autoscaler, ukuran yang dihitung sebelumnya akan langsung diterapkan. Hal ini memungkinkan penskalaan yang lebih cepat ke ukuran yang tepat. Mengaktifkan kembali autoscaler dapat menyebabkan penurunan skala yang tiba-tiba (di sini dari 80 menjadi 40 instance VM). Cara ini aman karena penghitungan latar belakang sudah mempertimbangkan kontrol penurunan skala.

Menskalakan otomatis MIG ke nol instance

Autoscaler dapat menurunkan skala MIG Anda menjadi nol instance, bergantung pada kolom minNumReplicas, sinyal penskalaan otomatis, dan jadwal yang Anda konfigurasi dalam kebijakan penskalaan otomatis.

Kondisi agar autoscaler menurunkan skala MIG hingga nol

Autoscaler dapat menurunkan skala MIG ke nol instance jika semua kondisi berikut terpenuhi:

Jumlah minimum instance (autoscalingPolicy.minNumReplicas) ditetapkan ke 0.
Tidak ada jadwal aktif yang memerlukan lebih dari nol instance.
Kebijakan penskalaan otomatis tidak boleh menggunakan metrik berikut yang bergantung pada instance yang sedang berjalan. Jika kebijakan mencakup metrik ini, autoscaler memerlukan setidaknya satu instance dalam grup untuk mendapatkan sinyal, dan grup tidak akan diskalakan ke nol instance.
- Pemakaian CPU rata-rata
- Kapasitas penyajian load balancing HTTP
- Metrik Cloud Monitoring yang dikumpulkan dari setiap instance di MIG

Anda juga dapat mengubah ukuran MIG secara manual menjadi nol instance, meskipun kebijakan penskalaan otomatis mencakup metrik yang dikumpulkan dari setiap instance di MIG. Untuk mengubah ukuran MIG secara manual, lihat Menetapkan ukuran MIG secara manual

Kondisi agar autoscaler menskalakan MIG dari nol

Jika ukuran target MIG adalah nol, baik yang ditetapkan oleh autoscaler atau diubah ukurannya secara manual, autoscaler hanya dapat menskalakan MIG saat sinyal penskalaan atau jadwal aktif memerlukan lebih dari nol instance.

Jika satu-satunya sinyal penskalaan dalam kebijakan didasarkan pada metrik yang dikumpulkan dari setiap instance, MIG tidak dapat melakukan penyebaran skala dari nol karena tidak ada instance dalam grup untuk menghasilkan metrik. Dalam kasus seperti itu, untuk meningkatkan ukuran target MIG, Anda harus menetapkan ukuran MIG secara manual.

Penskalaan otomatis prediktif

Untuk mempelajari penskalaan otomatis prediktif, termasuk cara kerjanya, lihat Penskalaan berdasarkan prediksi.

Autoscaler bersiap untuk menghentikan instance

Saat autoscaler menurunkan skala MIG, MIG akan menentukan instance VM yang akan dihapus. MIG memprioritaskan instance VM yang akan dihapus berdasarkan beberapa faktor. Untuk mengetahui informasi selengkapnya tentang faktor-faktor ini, lihat Faktor yang memengaruhi penghapusan instance VM.

Sebelum instance dihentikan, sebaiknya pastikan instance tersebut melakukan tugas tertentu, seperti menutup koneksi apa pun yang ada, menonaktifkan aplikasi atau server aplikasi dengan baik, mengupload log. Anda dapat memerintahkan instance untuk melakukan tugas-tugas tersebut menggunakan skrip shutdown. Skrip shutdown berjalan berdasarkan upaya terbaik, dalam periode singkat antara saat permintaan penghentian dibuat hingga instance benar-benar dihentikan. Selama periode ini, Compute Engine akan mencoba menjalankan skrip shutdown Anda untuk melakukan tugas apa pun yang Anda berikan dalam skrip.

Hal ini sangat berguna jika Anda menggunakan load balancing dengan grup instance terkelola. Jika instance Anda tidak responsif, mungkin perlu waktu beberapa saat agar load balancer mengenali bahwa instance tersebut tidak responsif, yang menyebabkan load balancer terus mengirim permintaan baru ke instance. Dengan skrip shutdown, instance dapat melaporkan bahwa instance tidak responsif saat sedang dimatikan sehingga load balancer dapat berhenti mengirimkan traffic ke instance. Untuk mengetahui informasi selengkapnya tentang health check load balancing, lihat ringkasan health check.

Untuk mengetahui informasi selengkapnya tentang skrip shutdown, lihat Skrip shutdown.

Untuk mengetahui informasi selengkapnya tentang penonaktifan instance, baca dokumentasi tentang menghentikan atau menghapus instance.

Memantau diagram dan log penskalaan otomatis

Compute Engine menyediakan beberapa diagram dan log yang dapat Anda gunakan untuk memantau perilaku grup instance terkelola kapan saja.

Anda dapat mengakses diagram dan log di konsol Google Cloud .

Di konsol Google Cloud , buka halaman Instance groups.

Buka Instance groups
Klik nama grup instance terkelola yang ingin Anda lihat.
Pada halaman grup instance terkelola, pilih tab Monitoring.

Tab Monitoring menampilkan diagram dan log sebagai berikut:
- Diagram menampilkan perkembangan metrik berikut:
  - Ukuran grup
  - Pemakaian autoscaler
  - Pemakaian CPU
  - I/O Disk (byte)
  - I/O Disk (operasi)
  - Byte jaringan
  - Paket jaringan
  Untuk mengetahui detail kontekstual tambahan tentang metrik yang ditampilkan dalam diagram, tahan kursor di atas ikon bantuan di samping judul diagram tersebut.
- Panel Logs yang tersedia di bagian bawah halaman menampilkan daftar log peristiwa untuk grup instance terkelola Anda. Untuk melihat log, di panel ini, klik ikon keyboard_capslock Beralih panel "Log".
Semua diagram dan log terikat pada satu jangka waktu. Anda dapat menganalisis diagram dan log untuk peristiwa tertentu atau rentang waktu tertentu sebagai berikut:
- Untuk memperbesar peristiwa tertentu, tarik diagram. Panel log juga diperbarui untuk menampilkan log dari rentang waktu yang dipilih pada diagram.
- Untuk melihat diagram dan log dalam rentang waktu tertentu, gunakan pemilih rentang waktu.

Memantau ukuran grup

Diagram Ukuran grup memungkinkan Anda memantau jumlah instance yang berjalan dalam MIG. Dalam diagram ini, garis Instance menunjukkan jumlah instance yang sedang berjalan.

Jika Anda telah mengonfigurasi penskalaan otomatis, diagram juga akan menampilkan ukuran berikut:

Ukuran minimum yang dikonfigurasi: jumlah minimum instance (minNumReplicas) yang Anda tetapkan dalam kebijakan penskalaan otomatis.
Ukuran maks yang dikonfigurasi: jumlah maksimum instance (maxNumReplicas) yang Anda tetapkan dalam kebijakan penskalaan otomatis.
Ukuran yang direkomendasikan: ukuran target yang direkomendasikan yang dihitung oleh autoscaler.

Untuk mengetahui informasi selengkapnya tentang kebijakan penskalaan otomatis, lihat Penskalaan otomatis grup instance.

Memantau peristiwa penskalaan otomatis

Diagram Ukuran grup mencakup linimasa Peristiwa ukuran grup. Linimasa ini menampilkan peristiwa seperti penskalaan grup masuk atau keluar oleh autoscaler. Mengarahkan kursor ke blok peristiwa dalam linimasa akan menampilkan kartu dengan detail peristiwa yang sesuai, yang mencakup hal berikut:

Stempel waktu: stempel waktu peristiwa.
Jenis dan ukuran peristiwa: penurunan skala atau penyebaran skala. Di samping jenis acara terdapat ukuran lama dan ukuran baru setelah acara—misalnya, 6 VMs arrow_forward 1 VM.
Sinyal penskalaan: sinyal yang memicu peristiwa—misalnya, penggunaan CPU.
Nilai sinyal: nilai sebenarnya dari sinyal penskalaan.
Target sinyal: nilai target sinyal penskalaan.
Ukuran yang dihitung: jumlah instance yang dihitung oleh autoscaler untuk mencapai target sinyal.
Dibatasi oleh: konfigurasi penskalaan otomatis yang membatasi ukuran baru—misalnya, jumlah minimum atau maksimum instance MIG. Jika autoscaler tidak menerapkan batasan apa pun pada ukuran baru, kartu tidak akan menampilkan detail ini.

Gambar berikut menunjukkan contoh linimasa peristiwa penskala otomatis. Dalam contoh ini, kartu menampilkan peristiwa penurunan skala yang mengurangi ukuran grup dari 4 VM menjadi 1 VM.

Linimasa peristiwa penskalaan otomatis.

Gambar 1. Diagram ukuran grup yang menampilkan linimasa peristiwa.

Bergantung pada rentang waktu yang Anda lihat, linimasa dapat mengelompokkan peristiwa yang berdekatan. Dalam hal ini, diagram menampilkan jumlah peristiwa yang dikelompokkan. Misalnya, jika kartu menampilkan 5 peristiwa, berarti lima peristiwa penskalaan otomatis terjadi dalam rentang waktu tersebut. Untuk melihat peristiwa tersebut sebagai blok terpisah di linimasa, perbesar grafik. Anda juga dapat melihat detail peristiwa yang dikelompokkan dengan mengklik Lihat peristiwa di kartu.

Memantau penskalaan otomatis prediktif

Compute Engine menyediakan diagram untuk memantau prediksi autoscaler. Untuk melihat diagram ini, klik judul Group size pada diagram pertama, lalu pilih Predictive autoscaling.

Jika penskalaan otomatis diaktifkan, Anda dapat melihat cara prediksi autoscaler menentukan ukuran grup instance Anda. Jika penskalaan otomatis tidak diaktifkan, Anda tetap dapat melihat prediksi autoscaler dan menggunakannya untuk membuat keputusan terkait ukuran grup.

Gunakan informasi berikut untuk memahami diagram ini.

Garis biru menunjukkan jumlah instance dalam grup instance terkelola.
Garis hijau menunjukkan jumlah instance yang diprediksi oleh autoscaler.
- Jika garis hijau berada di bawah garis biru, berarti ada sejumlah besar kapasitas yang tersedia dan tingkat pemakaian instance VM Anda kemungkinan rendah.
- Jika garis hijau berada di atas garis biru, berarti hanya ada sedikit, atau mungkin tidak ada, kapasitas yang tersisa. Anda harus menambahkan lebih banyak instance ke grup instance.
Garis merah horizontal putus-putus menunjukkan jumlah instance minimum dan maksimum yang diizinkan dalam grup instance Anda.

Melihat pesan status

Saat autoscaler mengalami masalah dalam melakukan penskalaan, autoscaler akan menampilkan pesan peringatan atau pesan error. Anda dapat meninjau pesan status ini dengan salah satu dari dua cara berikut.

Melihat pesan status di halaman Instance groups

Anda dapat melihat pesan status secara langsung di halaman Instance groups di Google Cloud console.

Di konsol Google Cloud , buka halaman Instance groups.
Buka Instance groups
Cari grup instance yang memiliki ikon peringatan sebelum namanya.

Contoh:
Tahan kursor di ikon status untuk mendapatkan detail pesan status.

Melihat pesan status di halaman ringkasan Instance groups

Anda dapat langsung membuka halaman ringkasan grup instance tertentu untuk melihat pesan status yang relevan.

Di konsol Google Cloud , buka halaman Instance groups.
Buka Instance groups
Klik grup instance tempat Anda ingin melihat pesan statusnya.
Di halaman grup instance tersebut, lihat pesan status di bawah nama grup instance.

Pesan status yang biasa ditampilkan

Saat autoscaler mengalami masalah dalam melakukan penskalaan, autoscaler akan menampilkan pesan peringatan atau pesan error. Berikut beberapa pesan yang umumnya ditampilkan serta artinya.

All instances in the instance group are unhealthy (not in RUNNING state). If this is an error, check the instances.

Semua instance dalam grup instance memiliki status selain RUNNING. Jika ini disengaja, Anda dapat mengabaikan pesan ini. Jika hal ini tidak disengaja, pecahkan masalah grup instance.

The number of instances has reached the maxNumReplicas. The autoscaler cannot add more instances.

Saat membuat autoscaler, Anda menyatakan jumlah instance maksimum yang dapat dimiliki grup instance. Autoscaler mencoba melakukan penyebaran skala pada grup instance untuk memenuhi permintaan, tetapi telah mencapai maxNumReplicas. Untuk informasi tentang cara mengupdate maxNumReplicas ke jumlah yang lebih besar, lihat Mengupdate autoscaler.

The monitoring metric that was specified does not exist or does not have the required labels. Check the metric.

Anda melakukan penskalaan otomatis menggunakan metrik Cloud Monitoring, tetapi metrik yang Anda berikan tidak ada, tidak memiliki label yang diperlukan, atau tidak dapat diakses oleh Agen Layanan Compute Engine.

Bergantung pada apakah metrik tersebut merupakan metrik standar atau kustom, label yang berbeda diperlukan. Baca dokumentasi untuk Penskalaan berdasarkan metrik Monitoring untuk mengetahui informasi selengkapnya.

Verifikasi bahwa Agen Layanan Compute Engine memiliki peran IAM compute.serviceAgent. Untuk menambahkannya, lihat Prasyarat autoscaler.

Quota for some resources is exceeded. Increase the quota or delete resources to free up more quota.

Anda bisa mendapatkan informasi tentang kuota yang tersedia di halaman Quota di konsol Google Cloud .

Autoscaling does not work with an HTTP/S load balancer configured for maxRate.

Grup instance sedang menjalani load balancing menggunakan konfigurasi maxRate tetapi autoscaler tidak mendukung mode ini. Ubah konfigurasi atau nonaktifkan penskalaan otomatis. Untuk mempelajari maxRate lebih lanjut, baca Pembatasan dan panduan dalam dokumentasi load balancing.

The autoscaler is configured to scale based on a load balancing signal but the instance group has not received any queries from the load balancer. Check that the load balancing configuration is working.

Grup instance sedang menjalani load balancing tetapi grup tidak memiliki kueri yang masuk. Layanan mungkin mengalami periode tidak ada aktivitas, sehingga tidak ada yang perlu dikhawatirkan. Namun, pesan ini juga dapat disebabkan oleh kesalahan konfigurasi; misalnya, grup instance dengan penskalaan otomatis mungkin menjadi target lebih dari satu load balancer, yang tidak didukung. Untuk mengetahui daftar lengkap panduan, lihat Pembatasan dan panduan dalam dokumentasi load balancing.