Risposte dinamiche

Questa pagina presenta il metodo di risposta in streaming.

Il metodo di risposta in streaming ha molte delle stesse funzionalità del metodo di risposta, oltre a una funzionalità aggiuntiva: streaming. Quando trasmetti una risposta in streaming, la risposta generata viene suddivisa in più parti che vengono inviate in sequenza.

Le risposte in streaming sono particolarmente utili se le risposte generate sono lunghe, in modo che l'invio dell'intera risposta contemporaneamente causi un ritardo. Le risposte in streaming riducono l'aspetto della latenza.

Limitazioni

Il metodo di risposta in streaming ha le stesse funzionalità del metodo di risposta, con le seguenti eccezioni:

  • Il numero di passaggi di riformulazione è uno. Non puoi disattivare la riformulazione né modificare il numero massimo di passaggi.

  • Solo i modelli Gemini possono essere utilizzati con il metodo di risposta in streaming. Per un elenco dei modelli, consulta Modelli disponibili.

Trasmettere una risposta in streaming

Il seguente comando mostra come chiamare il metodo di risposta in streaming answer e restituire una risposta generata sotto forma di una serie di risposte JSON. In genere, ogni risposta contiene una frase della risposta.

Questo comando di base mostra solo l'input richiesto. Le opzioni vengono lasciate ai valori predefiniti.

Per esempi di altre opzioni, consulta Ottenere risposte e follow-up. Alcune opzioni di risposta non sono disponibili per lo streaming delle risposte; consulta le limitazioni in questa pagina.

REST

Per cercare e ottenere risultati con una risposta generata in streaming, procedi nel seguente modo:

  1. Esegui il seguente comando curl:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del tuo Google Cloud progetto.
    • APP_ID: l'ID dell'app Ricerca agente su cui vuoi eseguire query.
    • QUERY: una stringa di testo libero che contiene la domanda o la query di ricerca. Ad esempio, "Quale database è più veloce, BigQuery o Spanner?".

Altri esempi

Il comando di base mostrato in Trasmettere una risposta in streaming è il comando più semplice senza opzioni specificate. Tuttavia, puoi applicare le stesse opzioni disponibili con il metodo di risposta, ad eccezione delle limitazioni elencate in questa pagina.

Le risposte in streaming possono essere utilizzate anche con le sessioni di follow-up.