O objetivo é coletar todos os dados presentes no site: https://servicos.receita.fazenda.gov.br/publico/EstatisticaIRPF/totaisDIRPF_UF.HTML no qual podem ser utilizados para diversas análises, tais como quantidade de declarações por ano, UF, Cidade, meio de declaração, tipo de tributação, resultados e restituições.
Com essas informações consolidadas em apenas um único local, todo o processo de análise torna-se mais rápido e menos burocrático.
O repositório segue estruturado conforme abaixo
.
├── data
│ ├── dados_consolidados
│ │ └── dados_imposto_de_renda.xlsx
│ └── dados_historicos
│ └── UF_ANO.txt
├── imgs
├── report
├── requirements
├── coleta_imposto_de_renda.ipynb
└── README.MD
O site divulga as informações em telas separadas, no qual podem ser utilizadas lógicas de programação bem como a investigação do comportamento dessas telas para então realizar a consolidação de todos os dados.
Para isso, foram capturadas e utilizadas as variáveis de controle Ano e UF.
Todos os detalhes podem ser visto no código: https://github.com/AfonsoFeliciano/Python-Web-Scrapping-Declaracoes-Imposto-de-Renda/blob/main/coleta_imposto_de_renda.ipynb
Após realizar todas as coletas, realizou-se a criação de um Dashboard utilizando conceitos de modelagem dimensional no software Power BI.
Com esse Dashboard, torna-se possível aumentar o nível de detalhamento e riqueza nas análises facilitando a tomada de decisão.