Este projeto tem como objetivo automatizar o processo de inserção de dados em uma planilha, coletando as informações diretamente a partir de imagens. Utilizando técnicas de visão computacional, o projeto extrai textos das imagens disponibilizadas na pasta anexos e organiza os dados em uma planilha de maneira eficiente e precisa.
Para executar este projeto, as seguintes bibliotecas Python são necessárias:
glob: Para manipulação de padrões de nomes de arquivos.PIL (Pillow): Para processamento de imagens.pandas: Para manipulação de dados e planilhas.pytesseract: Para reconhecimento óptico de caracteres (OCR).numpy: Para operações matemáticas e manipulação de arrays.timeit: Para medir o tempo de execução de pequenos trechos de código.cv2 (OpenCV): Para processamento de imagens.re: Para operações com expressões regulares.
Você pode instalar todas as dependências executando:
pip install -r requirements.txt
-
Baixe o instalador do Tesseract aqui
-
Siga as seguintes instruções de instalação.
- clique em
ok - clique em
next - clique em
I Agree. - Fica a sua escolha se quer instalar apenas para seu usuário ou todos os seus usuários do computador.
- Abra o nó
Additional language data (download)e procure pela opçãoPortuguesee marque ela.
- Copie o caminho que aparece na tela e clique em
next
- clique em
Install - espere o download e clique em
next - clique em
finish
- clique em
-
Adicione o diretório de instalação do Tesseract ao
PATHdo sistema.- pesquise por
variaveis de ambienteno seu computador.
- Nas variáveis de usuario adicione ao PATH o caminho do tesseract.exe que está na presente na pasta que você copiou o caminho.
- pesquise por
python main.pyO resultado deve ser a criação de uma planilha excel nomeada como tickets de pesagem.xlsx
Contribuições são bem-vindas! Sinta-se à vontade para abrir issues e pull requests.



