Reconocer voz Whisper#

Reconoce la voz de un archivo de audio a texto. Formato soportado: mp3. Tamaño máximo del archivo - 25 MB.

Archivo de audio[Texto] Nombre y ruta del archivo de audio de entrada. Formato soportado: mp3. Tamaño máximo del archivo - 25 MB.
ModeloSelección del modelo para el reconocimiento de voz.
Idioma del audio

[Texto] Idioma del audio. Si es necesario, se puede especificar el valor del idioma en formato ISO 639-1. Esto aumentará la precisión del reconocimiento y mejorará la velocidad de funcionamiento.

Por ejemplo:

  • "en" - Inglés;
  • "ru" - Ruso.
Sugerencia[Texto] Si es necesario, se puede especificar una sugerencia para el modelo de lenguaje. El idioma de la sugerencia debe coincidir con el idioma del archivo de audio.
Temperatura

[Número] Temperatura de muestreo de 0 a 1. Valores más altos, como 0.8, harán que la salida sea más aleatoria, mientras que valores más bajos (por ejemplo, 0.2) la harán más dirigida y determinista.

Si se establece el valor 0, el modelo utilizará la probabilidad logarítmica para aumentar automáticamente la temperatura hasta alcanzar ciertos umbrales.

Tiempo de espera[Número] Tiempo máximo de espera para la respuesta en segundos.
Resultado[Texto] Cadena reconocida.
Nivel de procesamiento

Selección del nivel de manejo de errores. Valores posibles:

  • "Default" - por defecto;
  • "Ignore" - errores ignorados;
  • "Handle" - errores manejados.

Si se elige el valor "Default", se utilizará el valor del bloque "Inicio" de este diagrama.

Nivel de mensajes

Selección del nivel de mensajes que los bloques mostrarán durante la ejecución. Valores posibles:

  • "Default" - por defecto;
  • "Release" - salida desactivada;
  • "Debug" - salida de información básica;
  • "Detailed" - salida de información detallada.

Si se elige el valor "Default", se utilizará el valor del bloque "Inicio" de este diagrama.

Texto de error[Texto] Devuelve información detallada sobre el error en caso de que la ejecución del bloque no sea correcta.