Capa de texto
La capa de texto es el texto real y seleccionable que vive dentro de un PDF, por encima o por debajo de lo que ves. Gracias a ella puedes pasar el ratón y marcar un párrafo, copiarlo, buscar una palabra o dejar que un buscador indexe el contenido.
No todos los PDF la tienen. Un documento creado desde un procesador de textos nace con su capa de texto intacta. En cambio, un PDF escaneado es solo una imagen de la página: por mucho que veas letras, el ordenador no las reconoce como texto y no puedes seleccionar nada. Ahí entra el OCR, que analiza la imagen y le añade una capa de texto invisible encajada sobre cada palabra.
Te importa siempre que necesites buscar, copiar o reutilizar el contenido de un documento. Si un PDF no te deja seleccionar texto, es la señal de que le falta esta capa y de que conviene pasarle OCR.
Herramientas relacionadas