Obter texto da página OCR#
Ler texto da página especificada do documento PDF usando reconhecimento.
| Nome do arquivo | [Texto] Nome do arquivo pdf de onde o texto será extraído. Pode-se inserir o nome completo do arquivo incluindo o caminho. |
| Número da página | [Número] Número da página da qual o texto será extraído. A numeração começa em 1. |
| Idioma do texto | Seleção do idioma do texto. |
| Módulo | Seleção do módulo OCR a ser aplicado ao reconhecer a imagem em texto. |
| Método de separação | [Texto] O texto reconhecido pode ser automaticamente dividido em partes, por vírgula. Método de separação:
|
| Delimitador de blocos | [Número] Código hexadecimal do caractere que será considerado delimitador de blocos. Por exemplo, o espaço tem o código 20, a tabulação - código 9. Usado ao escolher o método de separação 0. |
| Número de caracteres | [Número] Comprimento do espaço vazio no texto reconhecido, medido em número de caracteres, que é usado ao escolher o método de separação de texto em blocos 2. |
| Aumento | [Número] Valor que indica quantas vezes a imagem deve ser aumentada antes do reconhecimento. Dependendo do motor utilizado, aumentar a imagem em 2 ou 3 vezes ajuda a melhorar a qualidade do reconhecimento. |
| Rotação automática da página | Ao reconhecer, girar automaticamente a página. |
| Processar anotações | Ao selecionar anotações, elas também serão processadas. |
| Resultado | [Texto] Retorna o texto extraído da página. |
| Nível de processamento | Seleção do nível de tratamento de erros. Valores possíveis:
Se o valor "Default" for escolhido, o valor do bloco "Início" deste diagrama será utilizado. |
| Nível de mensagens | Seleção do nível de mensagens que os blocos exibirão durante a operação. Valores possíveis:
Se o valor "Default" for escolhido, o valor do bloco "Início" deste diagrama será utilizado. |
| Texto do erro | [Texto] Retorna informações detalhadas sobre o erro em caso de execução incorreta do bloco. |