Debian – Instalando e Configurando PDFSandwich & Tesseract
O recurso que estamos nos referindo e o OCR, um acrónimo para o inglês Optical Character Recognition ou Reconhecimento Óptico de Caracteres. Após transformar nosso arquivo em PDF ou imagem (.jpg, .png, .bmp …) pelo OCR os campos em texto será destacáveis, perceptível e, em alguns casos, manipulável. Mais o melhor proveito para se tirar desse recursos é podermos fazer regras para organizar os arquivo de forma automatizada, podendo classifica-los, por Cliente, Fornecedor, vencimento e outras possibilidades que a pesquisa de texto nos possa oferecer em nosso Alfresco.