Mostrar composição das respostas

Esta página apresenta o método de resposta de streaming.

O método de resposta de streaming tem muitos dos mesmos recursos do método de resposta, além de um recurso extra: streaming. Ao transmitir uma resposta, a resposta gerada é dividida em várias partes que são enviadas em sequência.

As respostas de streaming são particularmente úteis se as respostas geradas forem longas, de modo que o envio de toda a resposta de uma só vez cause um atraso. As respostas de streaming reduzem a aparência de latência.

Limitações

O método de resposta de streaming tem os mesmos recursos do método de resposta, com as seguintes exceções:

  • O número de etapas de reformulação é um. Não é possível desativar a reformulação nem mudar o número máximo de etapas.

  • Somente os modelos do Gemini podem ser usados com o método de resposta de streaming. Para uma lista de modelos, consulte Modelos disponíveis.

Transmitir uma resposta

O comando a seguir mostra como chamar o método de resposta de streaming answer e retornar uma resposta gerada na forma de uma série de respostas JSON. Normalmente, cada resposta contém uma frase da resposta.

Esse comando básico mostra apenas a entrada necessária. As opções são deixadas nos padrões.

Para exemplos de outras opções, consulte Receber respostas e acompanhamentos. Algumas opções de resposta não estão disponíveis para streaming de respostas. Consulte as limitações nesta página.

REST

Para pesquisar e receber resultados com uma resposta gerada transmitida, faça o seguinte:

  1. Execute o seguinte comando curl:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Substitua:

    • PROJECT_ID: o ID do Google Cloud projeto.
    • APP_ID: o ID do app Pesquisa de agentes que você quer consultar.
    • QUERY: uma string de texto livre que contém a pergunta ou consulta de pesquisa. Por exemplo, "Qual banco de dados é mais rápido, bigquery ou spanner?".

Outros exemplos

O comando básico mostrado em Transmitir uma resposta é o comando mais simples, sem opções especificadas. No entanto, é possível aplicar as mesmas opções disponíveis com o método de resposta, com exceção das limitações listadas nesta página.

As respostas de streaming também podem ser usadas com sessões de acompanhamento.