Obtener texto de la página OCR#

Leer texto de la página especificada del documento PDF utilizando reconocimiento.

Nombre del archivo[Texto] Nombre del archivo pdf del cual se extraerá el texto. Se puede ingresar el nombre completo del archivo incluyendo la ruta.
Número de página[Número] Número de la página de la cual se extraerá el texto. La numeración comienza desde 1.
Idioma del textoSelección del idioma del texto.
MóduloSelección del módulo OCR que se aplicará al reconocer la imagen en texto.
Método de separación

[Texto] El texto reconocido puede ser automáticamente separado en segmentos, separados por comas.

Método de separación:

  • 0 - Usar el separador de bloques especificado;
  • 1 - Separación automática (solo para Yandex);
  • 2 - Separar por espacios vacíos más largos que el número de caracteres especificado.
Separador de bloques

[Número] Código hexadecimal del carácter que se considerará como separador de bloques. Por ejemplo, el espacio tiene el código 20, el tabulador - código 9.

Se utiliza al seleccionar el método de separación 0.

Cantidad de caracteres[Número] Longitud del espacio vacío en el texto reconocido, medida en número de caracteres, que se utiliza al seleccionar el método de separación de texto en bloques 2.
Aumento

[Número] Valor que indica cuántas veces se debe aumentar la imagen antes del reconocimiento.

Dependiendo del motor utilizado, aumentar la imagen 2 o 3 veces ayuda a mejorar la calidad del reconocimiento.

Auto-rotación de páginaAl reconocer, rotar automáticamente la página.
Procesar anotacionesAl seleccionar anotaciones, estas también serán procesadas.
Resultado[Texto] Se devuelve el texto extraído de la página.
Nivel de procesamiento

Selección del nivel de manejo de errores. Valores posibles:

  • "Default" - por defecto;
  • "Ignore" - se ignoran los errores;
  • "Handle" - se manejan los errores.

Si se selecciona el valor "Default", se utilizará el valor del bloque "Inicio" de este diagrama.

Nivel de mensajes

Selección del nivel de mensajes que los bloques mostrarán durante la operación. Valores posibles:

  • "Default" - por defecto;
  • "Release" - salida desactivada;
  • "Debug" - salida de información básica;
  • "Detailed" - salida de información detallada.

Si se selecciona el valor "Default", se utilizará el valor del bloque "Inicio" de este diagrama.

Texto de error[Texto] Devuelve información detallada sobre el error en caso de que la operación del bloque no se ejecute correctamente.