Solicitação para o modelo GPT#

Este bloco permite enviar solicitações para os modelos generativos clássicos da Open AI antes do ChatGPT. Com ele, você pode criar novos textos sob demanda, realizar diversas tarefas:

  • classificação,
  • sumarização,
  • tradução e reescrita de textos,
  • escrita de protótipos de código em diferentes linguagens de programação,
  • parsear dados semiestruturados e não estruturados,
  • extrair e processar fatos,
  • manter diálogos sobre diversos temas, e muito mais.

O pagamento pelo uso dessa funcionalidade é debitado da conta do cliente na plataforma. Para fins de teste, cada novo Usuário tem a oportunidade de testar essa funcionalidade sem custo. Após a conclusão do desenvolvimento do Robô, o uso dessa funcionalidade requer pagamento.

Solicitação[Texto] Insira a solicitação em linguagem natural.
ModeloSelecione o modelo para geração de texto. O modelo "text-davinci-003" oferece a melhor qualidade de geração, no entanto, seu uso é o mais caro e lento. Outros modelos podem oferecer resultados mais baratos e rápidos, com alguma perda de qualidade na geração. Por meio de tentativa e erro, escolha o modelo que melhor se adapta às suas necessidades.
Seu nome de modelo[Texto] Indique seu nome de modelo, que é suportado pelo Sherpa AI Server.
Palavras de parada[Texto/Lista] Uma string ou lista contendo não mais que 4 strings que interromperão a geração adicional. O texto retornado não conterá essas palavras.
Temperatura

[Número] Um número decimal entre 0 e 1, que indica o grau de "aleatoriedade" ou "criatividade" do resultado, onde:

  • 0 - resultado menos criativo,
  • 1 - resultado mais aleatório.

Para a maioria das tarefas criativas, o valor 0.7 é mais adequado, e se você deseja receber a mesma resposta para a mesma solicitação toda vez - defina o valor como 0.

Comprimento máximo

[Número] Comprimento máximo do resultado, expresso em tokens condicionais.

Para o inglês, 1 token é 4 caracteres, para a maioria das outras línguas, 1 token é 1 caractere.

Reduza esse número se você quiser receber solicitações mais curtas em média, aumente para obter solicitações mais longas. Lembre-se de que esse número limita o comprimento da resposta, no entanto, a resposta obtida pode não ter o comprimento que você especificou - dependendo do conteúdo da solicitação, ela pode ser mais curta.

Auto-limitação de comprimento

Quando ativado, o comprimento máximo especificado será ajustado automaticamente.

Para isso, é calculado o número de tokens na solicitação e considerado o número máximo possível de tokens para o modelo selecionado.

Timeout

[Número] O tempo máximo de espera pela resposta em segundos. O tempo real de espera depende do modelo selecionado, do comprimento da sua solicitação e do comprimento previsto da resposta, bem como da carga atual dos servidores.

Se o limite de espera for excedido, ocorrerá um erro.

Número de tentativas[Número] O número de tentativas em caso de erro de conexão com o servidor.
Resposta[Texto] A resposta do modelo generativo à solicitação.
Comprimento total[Número] O comprimento total da solicitação e do resultado (juntos), expresso em tokens condicionais.
Nível de tratamento

Seleção do nível de tratamento de erros. Valores possíveis:

  • "Default" - padrão;
  • "Ignore" - erros são ignorados;
  • "Handle" - erros são tratados.

Se o valor "Default" for selecionado, será utilizado o valor do bloco "Início" deste diagrama.

Nível de mensagens

Seleção do nível de mensagens que os blocos exibirão durante a operação. Valores possíveis:

  • "Default" - padrão;
  • "Release" - saída desativada;
  • "Debug" - saída de informações principais;
  • "Detailed" - saída de informações detalhadas.

Se o valor "Default" for selecionado, será utilizado o valor do bloco "Início" deste diagrama.

Texto do erro[Texto] Retorna informações detalhadas sobre o erro em caso de execução incorreta do bloco.