Modelo com Machine Learning desenvolvido para analisar registros clínicos e prever a probabilidade de mortalidade em pacientes com possibilidade de alguma insuficiência cardíaca.
A insuficiência cardíaca é um evento clínico complexo, e a identificação precoce de pacientes em risco é fundamental para o direcionamento médico assertivo. Este projeto utiliza um conjunto de dados clínicos com 12 variáveis (como fração de ejeção, creatinina sérica, idade e pressão arterial) para treinar e avaliar modelos preditivos de classificação.
O objetivo principal é demonstrar a aplicação de técnicas de ciência de dados na extração de padrões de saúde e no suporte à decisão baseada em evidências, focando em métricas críticas para o contexto hospitalar.
Diferente de abordagens genéricas, este projeto prioriza a identificação correta de pacientes em risco (sensibilidade), visando minimizar falsos negativos em um cenário clínico.
- Análise Exploratória de Dados (EDA): Mapeamento de distribuições, análise de covariância e identificação da correlação entre marcadores biológicos e o desfecho de sobrevivência.
- Engenharia de Atributos: Limpeza de dados, tratamento de outliers e normalização de variáveis contínuas (ex: níveis de plaquetas e creatinina).
- Modelagem Preditiva: Implementação e comparação de performance entre múltiplos algoritmos:
- Regressão Logística (Baseline)
- Support Vector Machines (SVM)
- K-Nearest Neighbors (KNN)
- Avaliação de Desempenho: Foco em métricas de triagem clínica, utilizando Recall (Sensibilidade), Precision e F1-score, além da análise detalhada via matriz de confusão.
| Ferramenta | Aplicação no Projeto |
|---|---|
| Python | Linguagem base do pipeline de desenvolvimento |
| Pandas / NumPy | Estruturação, limpeza e cálculos vetoriais |
| Scikit-learn | Construção, treinamento e validação dos modelos ML |
| Matplotlib / Seaborn | Geração de gráficos estatísticos e heatmaps de correlação |
Projeto baseado no repositório do usuário tkarim45.