Reconhecer fala Whisper#

Reconhece fala de um arquivo de áudio em texto. Formato suportado: mp3. Tamanho máximo do arquivo - 25 MB.

Arquivo de áudio[Texto] Nome e caminho do arquivo de áudio de entrada. Formato suportado: mp3. Tamanho máximo do arquivo - 25 MB.
ModeloSeleção do modelo para reconhecimento de fala.
Idioma do áudio

[Texto] Idioma do áudio. Se necessário, pode-se especificar o valor do idioma no formato ISO 639-1. Isso aumentará a precisão do reconhecimento e melhorará a velocidade de operação.

Por exemplo:

  • "en" - Inglês;
  • "ru" - Russo.
Dica[Texto] Se necessário, pode-se fornecer uma dica para o modelo de linguagem. O idioma da dica deve corresponder ao idioma do arquivo de áudio.
Temperatura

[Número] Temperatura de amostragem de 0 a 1. Valores mais altos, como 0,8, tornarão a saída mais aleatória, enquanto valores mais baixos, (como 0,2) a tornarão mais direcionada e determinística.

Se o valor 0 for definido, o modelo usará a probabilidade logarítmica para aumentar automaticamente a temperatura até atingir certos limiares.

Timeout[Número] Tempo máximo de espera pela resposta em segundos.
Resultado[Texto] String reconhecida.
Nível de tratamento

Seleção do nível de tratamento de erros. Valores possíveis:

  • "Default" - padrão;
  • "Ignore" - erros são ignorados;
  • "Handle" - erros são tratados.

Se o valor "Default" for selecionado, será utilizado o valor do bloco "Início" deste diagrama.

Nível de mensagens

Seleção do nível de mensagens que os blocos exibirão durante a operação. Valores possíveis:

  • "Default" - padrão;
  • "Release" - saída desativada;
  • "Debug" - saída de informações principais;
  • "Detailed" - saída de informações detalhadas.

Se o valor "Default" for selecionado, será utilizado o valor do bloco "Início" deste diagrama.

Texto do erro[Texto] Retorna informações detalhadas sobre o erro em caso de execução incorreta do bloco.