Obter texto da página OCR#

Ler texto da página especificada do documento PDF usando reconhecimento.

Nome do arquivo[Texto] Nome do arquivo pdf de onde o texto será extraído. Pode-se inserir o nome completo do arquivo incluindo o caminho.
Número da página[Número] Número da página da qual o texto será extraído. A numeração começa em 1.
Idioma do textoSeleção do idioma do texto.
MóduloSeleção do módulo OCR a ser aplicado ao reconhecer a imagem em texto.
Método de separação

[Texto] O texto reconhecido pode ser automaticamente dividido em partes, por vírgula.

Método de separação:

  • 0 - Usar o delimitador de blocos especificado;
  • 1 - Separação automática (apenas para Yandex);
  • 2 - Separar por espaços vazios maiores que o número de caracteres especificado.
Delimitador de blocos

[Número] Código hexadecimal do caractere que será considerado delimitador de blocos. Por exemplo, o espaço tem o código 20, a tabulação - código 9.

Usado ao escolher o método de separação 0.

Número de caracteres[Número] Comprimento do espaço vazio no texto reconhecido, medido em número de caracteres, que é usado ao escolher o método de separação de texto em blocos 2.
Aumento

[Número] Valor que indica quantas vezes a imagem deve ser aumentada antes do reconhecimento.

Dependendo do motor utilizado, aumentar a imagem em 2 ou 3 vezes ajuda a melhorar a qualidade do reconhecimento.

Rotação automática da páginaAo reconhecer, girar automaticamente a página.
Processar anotaçõesAo selecionar anotações, elas também serão processadas.
Resultado[Texto] Retorna o texto extraído da página.
Nível de processamento

Seleção do nível de tratamento de erros. Valores possíveis:

  • "Default" - padrão;
  • "Ignore" - erros são ignorados;
  • "Handle" - erros são tratados.

Se o valor "Default" for escolhido, o valor do bloco "Início" deste diagrama será utilizado.

Nível de mensagens

Seleção do nível de mensagens que os blocos exibirão durante a operação. Valores possíveis:

  • "Default" - padrão;
  • "Release" - saída desativada;
  • "Debug" - saída de informações principais;
  • "Detailed" - saída de informações detalhadas.

Se o valor "Default" for escolhido, o valor do bloco "Início" deste diagrama será utilizado.

Texto do erro[Texto] Retorna informações detalhadas sobre o erro em caso de execução incorreta do bloco.