Qué hace la extracción de texto PDF
Lee la información de texto incrustada dentro de un PDF y la convierte en texto copiable. Funciona mejor con PDF que ya contienen una capa de texto.
Esta herramienta usa PDF.js para leer la capa de texto en tu navegador. Los PDF compuestos solo por imágenes no son compatibles.
En este flujo de extracción, el PDF seleccionado y el texto extraído permanecen en tu navegador y no se suben a PDFresh.
Herramientas PDF en el navegador y privacidad
Selecciona un archivo PDF.
Lee la información de texto incrustada dentro de un PDF y la convierte en texto copiable. Funciona mejor con PDF que ya contienen una capa de texto.
Los documentos escaneados y los PDF formados solo por imágenes pueden verse legibles en pantalla, pero no contienen datos de texto copiables para que esta herramienta los extraiga.
Mantener el procesamiento dentro del navegador ayuda a evitar enviar documentos sensibles a servidores externos y mantiene bajos los costes de operación.
Los caracteres rotos o el texto faltante dependen de cómo se creó el PDF. Los PDF de imagen y los PDF restringidos pueden no extraerse como esperas.
Usa esta página cuando necesites la capa de texto de un PDF para citar, redactar, buscar o mover texto a otro documento. Es mejor para PDF generados digitalmente que ya contienen texto seleccionable.
Los PDF escaneados, los PDF solo de imagen, los PDF protegidos con contraseña, las codificaciones de fuente poco habituales y las restricciones de copia pueden reducir la calidad de la extracción. Si el resultado está casi vacío, revisa las guías de abajo antes de asumir que el archivo está roto.
Extrae una cláusula de un borrador de contrato, reutiliza texto de un folleto, copia un párrafo de apuntes, busca en un informe largo, guarda texto de facturas como TXT o mueve texto seleccionado del PDF a un correo, hoja de cálculo o editor de documentos.
Si el resultado está casi vacío, puede que el PDF sea solo de imagen y necesite OCR. Si los caracteres aparecen rotos, el archivo original puede usar una codificación poco habitual. Si la extracción está bloqueada por restricciones de copia o por contraseña, usa otro PDF de origen permitido.
Esta herramienta procesa PDF en tu navegador. El PDF que seleccionas y el texto extraído no se suben a PDFresh en este flujo. La velocidad y la estabilidad siguen dependiendo de tu dispositivo y tu navegador.
Esta herramienta lee una capa de texto existente. Una página escaneada suele contener solo una imagen, así que puede no haber texto incrustado para extraer.
No se usa subida de archivos en el flujo principal de extracción de esta página. El PDF se lee en tu navegador.
Puedes, pero los documentos importantes deben seguir comprobándose con el PDF original porque el diseño, la codificación y las restricciones pueden afectar al resultado.