Solicitud al modelo GPT#

Este bloque permite enviar solicitudes a los modelos generativos clásicos de Open AI antes de ChatGPT. Con él, puede crear nuevos textos a pedido, realizar diversas tareas:

  • clasificación,
  • resumir,
  • traducción y reescritura de textos,
  • escribir prototipos de código en diferentes lenguajes de programación,
  • analizar datos semiestructurados y no estructurados,
  • extraer y procesar hechos,
  • mantener un diálogo sobre diversos temas, y mucho más.

El pago por el uso de esta funcionalidad se deduce de la cuenta del cliente en la plataforma. Para fines de prueba, a cada nuevo Usuario se le da la oportunidad de probar esta funcionalidad sin costo. Al utilizar esta funcionalidad después de finalizar el desarrollo del Robot, se requiere pago.

Solicitud[Texto] Ingrese la solicitud en lenguaje natural.
ModeloSeleccione el modelo para la generación de texto. El modelo "text-davinci-003" ofrece la mejor calidad de generación, sin embargo, su uso es el más costoso y lento. Otros modelos pueden ofrecer resultados más baratos y rápidos, a costa de una cierta pérdida de calidad en la generación. A través de prueba y error, elija el modelo que mejor se adapte a sus necesidades.
Su nombre de modelo[Texto] Indique su nombre de modelo, que es compatible con Sherpa AI Server.
Palabras clave[Texto/Lista] Cadena o lista que contiene no más de 4 cadenas que detendrán la generación adicional. El texto devuelto no contendrá estas palabras.
Temperatura

[Número] Número decimal entre 0 y 1, que indica el grado de "aleatoriedad" o "creatividad" del resultado, donde:

  • 0 - resultado menos creativo,
  • 1 - máximo aleatorio.

Para la mayoría de las tareas creativas, un valor de 0.7 es más adecuado, y si desea obtener la misma respuesta para la misma solicitud cada vez, establezca el valor en 0.

Longitud máxima

[Número] Longitud máxima del resultado, expresada en tokens condicionales.

Para el idioma inglés, 1 token son 4 caracteres, para la mayoría de los otros idiomas, 1 token es 1 carácter.

Reduzca este número si desea recibir solicitudes más cortas en promedio, aumente para obtener solicitudes más largas. Tenga en cuenta que este número limita la longitud de la respuesta, sin embargo, no necesariamente la respuesta obtenida será de la longitud que usted indicó; dependiendo del contenido de la solicitud, puede ser más corta.

Auto-limitación de longitud

Cuando se activa, la longitud máxima especificada se ajustará automáticamente.

Para ello, se calcula el número de tokens en la solicitud y se tiene en cuenta el número máximo posible de tokens para el modelo seleccionado.

Tiempo de espera

[Número] Tiempo máximo de espera para la respuesta en segundos. El tiempo real de espera depende del modelo seleccionado, la longitud de su solicitud y la longitud de respuesta prevista, así como de la carga actual de los servidores.

Si se supera el límite de espera establecido, se produce un error.

Número de intentos[Número] Número de intentos en caso de error de conexión con el servidor.
Respuesta[Texto] Respuesta del modelo generativo a la solicitud.
Longitud total[Número] Longitud total de la solicitud y el resultado (combinados), expresada en tokens condicionales.
Nivel de procesamiento

Selección del nivel de manejo de errores. Valores posibles:

  • "Default" - por defecto;
  • "Ignore" - se ignoran los errores;
  • "Handle" - se manejan los errores.

Si se selecciona "Default", se utilizará el valor del bloque "Inicio" de este diagrama.

Nivel de mensajes

Selección del nivel de mensajes que mostrarán los bloques durante su funcionamiento. Valores posibles:

  • "Default" - por defecto;
  • "Release" - salida desactivada;
  • "Debug" - salida de información básica;
  • "Detailed" - salida de información detallada.

Si se selecciona "Default", se utilizará el valor del bloque "Inicio" de este diagrama.

Texto de error[Texto] Devuelve información detallada sobre el error en caso de que la ejecución del bloque no sea correcta.