Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Last update: Oct 11, 2021

Related tags

Overview

Este programa tem o intuito de ser um modificador de arquivos PDF. Os arquivos PDFs podem ser 3: PDFs verdadeiros - em que podem ser selecionados o tipo de texto, PDFs-de-imagem - arquivos feitos de imagens e que o conteúdo é "aprisionado" e não pode ser acessado. Como terceiro tipo temos o PDFs-buscáveis: estes são os PDFs que resultam de aplicação OCR (Optical Character Recognition - Reconhecimento óptico de caracter), em que o documento é analizado e estruturado com uma nova camada de texto por detrás da camada de imagem do PDF-de-Imagem.

A criação do terceiro tipo de PDF a partir do segundo tipo é o intuito deste programa. Para isto é necessário a aplicação de alguns programas externos ao python.

Abaixo listarei o processo que utilizei para instalar estes programas externos:

Além de ter o python instalado e um ambiente virtual iniciado, é necessário utilizar o comando pip: pip install ocrmypdf. Esta biblioteca é um conjunto de pacotes que atuará sobre o PDF.

Primeiro de tudo, caso seja usuário de windows, é necessário ter um administrador de pacotes chamado Chocolotey . Após ter instalado ele, é necessário escrever os seguintes comandos:

choco install --pre tesseract
choco install ghostscript

Para mais informações sobre esse processo, caso utilizar MacOS ou Linux, acesse aqui.

Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Related tags

Overview

Owner

Daniel Soares Saldanha

A facial recognition device is a device that takes an image or a video of a human face and compares it to another image faces in a database.

Some bits of javascript to transcribe scanned pages using PageXML

Character Segmentation using TensorFlow

Corner-based Region Proposal Network

ocroseg - This is a deep learning model for page layout analysis / segmentation.

Awesome Spectral Indices in Python.

Convolutional Recurrent Neural Network (CRNN) for image-based sequence recognition.

Indonesian ID Card OCR using tesseract OCR

PianoVisuals - Create background videos synced with piano music using opencv

This is a GUI program which consist of 4 OpenCV projects

a Deep Learning Framework for Text

A pure pytorch implemented ocr project including text detection and recognition

Some Boring Research About Products Recognition 、Duplicate Img Detection、Img Stitch、OCR

Convolutional Recurrent Neural Networks(CRNN) for Scene Text Recognition

Ddddocr - 通用验证码识别OCR pypi版

A semi-automatic open-source tool for Layout Analysis and Region EXtraction on early printed books.

Code for generating synthetic text images as described in "Synthetic Data for Text Localisation in Natural Images", Ankush Gupta, Andrea Vedaldi, Andrew Zisserman, CVPR 2016.

TensorFlow Implementation of FOTS, Fast Oriented Text Spotting with a Unified Network.

An application of high resolution GANs to dewarp images of perturbed documents

Python tool that takes the OCR.space JSON output as input and draws a text overlay on top of the image.