Este repositório reúne projetos e experimentos relacionados à detecção de fraudes usando técnicas de análise de dados, aprendizado de máquina e estatística. O foco principal é desenvolver soluções que consigam identificar padrões anômalos em cenários desbalanceados — comuns em fraudes financeiras, golpes online e detecção de comportamentos suspeitos.
- Explorar abordagens supervisionadas e não supervisionadas para detecção de fraudes
- Avaliar diferentes estratégias de tratamento de dados desbalanceados
- Construir e comparar modelos com métricas apropriadas (AUC, F1, Recall)
- Aplicar técnicas de visualização e engenharia de atributos para melhorar a interpretabilidade
- Python 3.x
- Pandas, NumPy
- Scikit-learn
- Imbalanced-learn
- Matplotlib / Seaborn / Plotly
- Recall (Sensibilidade) — para minimizar falsos negativos
- F1-score — equilíbrio entre precisão e recall
- AUC-ROC / PR-AUC — avaliação global da separabilidade do modelo
- Matriz de Confusão — análise dos tipos de erro
- Kaggle Datasets: https://www.kaggle.com/