Skip to content
files.co

OCR

OCR (Optical Character Recognition, reconocimiento óptico de caracteres) es la tecnología que convierte la imagen de un texto en texto de verdad. Cuando escaneas un papel o haces una foto a un documento, lo que obtienes es una imagen: el ordenador ve píxeles, no palabras. El OCR analiza esa imagen, reconoce las letras y genera texto que puedes seleccionar, copiar y buscar.

El cambio es enorme en la práctica. Un PDF escaneado sin OCR es como una fotografía: no puedes buscar una palabra dentro ni copiar un párrafo. Tras pasar OCR, el documento gana una capa de texto invisible encima de la imagen, así que sigue viéndose igual pero ya responde a las búsquedas y deja extraer su contenido.

Lo usas siempre que partes de algo escaneado: contratos antiguos, facturas en papel, libros, formularios rellenados a mano. Es también el paso previo casi obligado si luego quieres archivar en PDF/A o sacar el texto para reutilizarlo.