Este projeto tem como objetivo realizar uma análise de dados de diversos datasets. Coloco em prática a exploração, limpeza, visualização e modelagem de dados para extrair informações e gerar insights. O código está estruturado em notebooks, facilitando a execução e a colaboração em tempo real.
Neste repositório, você encontrará notebooks que implementam análises de dados usando bibliotecas como Pandas, Matplotlib, Seaborn e outras ferramentas para realizar as seguintes etapas:
- Leitura e Exploração dos Dados: Carregamento e visualização dos dados iniciais.
- Limpeza de Dados: Tratamento de valores ausentes, dados duplicados e outras questões relacionadas.
- Análise Exploratória de Dados (EDA): Geração de gráficos e estatísticas descritivas.
- Modelagem e Predição: Aplicação de algoritmos de machine learning para prever resultados ou classificar dados.
Este projeto é flexível e pode utilizar diversos conjuntos de dados públicos, desde que devidamente licenciados. Ao utilizar um novo conjunto de dados, a licença correspondente será especificada nos arquivos LICENSE
de licença específicos.
Atualmente, este projeto inclui análise do conjunto de dados, licenciado sob a Open Data Commons Open Database License (ODbL). Para mais detalhes sobre a licença e atribuição, consulte o arquivo LICENSE-DATA
.
Contribuições são bem-vindas! Sinta-se à vontade para abrir issues ou pull requests.
Jan M.