Mineração de Texto para extrair informações de certidões federais e estaduais solicitadas em processos licitatórios
Résumé
Na era digital grande parte das informações encontram-se nos formatos não estruturados e semiestruturados, como os arquivos no formato PDF e páginas web. Pode-se citar, por exemplo, as certidões federais e estaduais que são solicitadas em processos licitatórios e disponibilizadas nos ambientes digitais, a maioria delas em formato PDF. Para habilitar as empresas para uma licitação é preciso analisar esses documentos de forma manual. Neste sentido, o objetivo deste estudo é apresentar a aplicação de técnicas de mineração de texto para extrair informações em certidões federais e estaduais do estado do Rio Grande do Norte – RN. No desenvolvimento deste trabalho foram realizadas pesquisa bibliográfica, estudo documental, análise das certidões, desenvolvimento do script de mineração de texto e exibição das informações. Como resultado possui um código capaz de minerar no total 12 certidões, 9 federais e 3 do estado do Rio Grande do Norte - RN, no entanto vale salientar que só foi possível extrair informações de 8 certidões federais e 2 do estado do RN. Assim sendo, percebe-se que a aplicação de Mineração de Texto nesses documentos, possibilita a estruturação, armazenamento e exibição dessas informações como data de validade, situação e