Aprendizado de máquina na saúde
Índice
Logística
- Disciplina:
- Tópicos Avançados em Ciência da Computação IV (Aprendizado de Máquina na Saúde)
- TCC00367 – Introdução ao Aprendizado de Máquina para Saúde
- Período: 2025.2
- Data: sextas-feiras, 14h-18h
- Sala: 217
- Google Classroom: --
Objetivo
Discutir e compreender os conceitos, métodos e aplicações do aprendizado de máquina na saúde, e os desafios da análise de dados clínicos, considerando a sua heterogeneidade e os aspectos legais e éticos da saúde, e de proteção à privacidade dos pacientes. Dentre os tópicos na disciplina, incluem:
- Desafios da heterogeneidade dos dados clínicos;
- Aplicações do aprendizado de máquina para:
- Estratificação de risco;
- Auxílio aos processos de triagem e raciocínio diagnóstico;
- Modelagem da progressão da doença (prognóstico);
- Avaliação do tratamento;
- Auxílio aos processos de reabilitação do paciente.
Ementa
A disciplina trata dos conceitos, métodos e aplicações do aprendizado de máquina na saúde, incluindo o uso de modelos supervisionados, não supervisionados, por reforço e de aprendizado profundo em aplicações voltadas a triagem, diagnóstico, tratamento, reabilitação e bem-estar dos pacientes. Inclui tópicos sobre a estratificação de risco, modelagem do progresso de doenças e aplicações para o auxílio ao diagnóstico baseado em imagens e ao prognóstico de doenças, considerando os aspectos legais e éticos da saúde, e a proteção à privacidade dos dados dos pacientes.
Tópicos abordados
- Redes Bayesianas;
- Causalidade;
- Séries temporais e sinais fisiológicos;
- Imagens médicas;
- Processamento em linguagem natural (PNL);
- Aprendizado profundo;
- Interpretabilidade;
- Interoperabilidade;
- Automatização de diretrizes clínicas;
- Aprendizado por transferência;
- Fairness;
- Ética.
Avaliação
- Apresentação de artigos científicos. Peso: 2. Entrega: apresentação + slides + resumo de até 2 páginas.
- Atividades Práticas. Peso: 2. Entrega: arquivo Jupyter Notebook ou R Markdown documentado.
- Hackathon Interdisciplinar. Peso: 2. Entrega: pitch final de 5 minutos + notebook.
- Projeto de Aplicação. Peso: 4. Entrega: relatório final (máx. 12 páginas) no formato de artigo científico;
- Código e/ou notebook comentado;
- Apresentação oral (15 minutos + 5 de perguntas).
Implementação
- Python.
- R.
- Matlab®.
- Lista de bases de dados públicas da saúde.
Cronograma
Data | Aula / Atividade | Conteúdo | Formato | Observações / Entregas |
---|---|---|---|---|
22/08/2025 | Aula 1 | O que torna os sistemas de saúde únicos? | Aula expositiva + discussão de caso | Estudo de caso: impacto de modelos de risco na triagem de pacientes |
29/08/2025 | Nivelamento – Parte 1 | Introdução a Python e Jupyter Notebook; Estatística básica; Fundamentos de ML | Aula prática + Colab | Notebooks compartilhados |
05/09/2025 | Nivelamento – Parte 2 | Conceitos básicos de dados clínicos; LGPD na saúde; Exemplos de datasets públicos | Aula prática | Uso do MIMIC-III, PhysioNet e OpenEHR para demonstração |
12/09/2025 | Aula 2 + Atividade 1 | Análise exploratória de dados clínicos; Regressão logística aplicada | Aula interativa | Atividade: prever risco de internação usando dataset simplificado |
19/09/2025 | Aula 3 | Características da área clínica e fluxos de trabalho Definição do tema do projeto de aplicação (proposta inicial) |
Aula interativa | Formação das equipes e definição do tema do Projeto de Aplicação |
26/09/2025 | Aula 4 + Atividade 2 | Aprendizado supervisionado e não supervisionado; Clusterização | Aula prática | Clusterização de perfis de pacientes crônicos |
03/10/2025 | Revisão + Estudo de Caso | Revisão de ML + caso clínico de estratificação de risco Apresentação de artigo científico |
Aula prática | Preparação para hackathon |
10/10/2025 | Hackathon Interdisciplinar – Dia 1 | Montagem de equipes, definição do problema, análise exploratória | Prototipagem rápida de soluções | Problemas sugeridos pelos alunos |
17/10/2025 | Hackathon Interdisciplinar – Dia 2 | Desenvolvimento de modelos, avaliação inicial e discussão | Prototipagem rápida de soluções | Entrega parcial do protótipo |
24/10/2025 | Aula 5 + Atividade 3 | Modelos de sobrevivência e prognóstico Apresentação de artigo científico |
Aula prática | Uso de dados de acompanhamento para prever tempo até evento |
31/10/2025 | Aula 6 | Séries temporais e sinais fisiológicos | Aula prática | Previsão de eventos cardíacos com ECG |
07/11/2025 | Aula 7 | Processamento de Linguagem Natural (PNL) aplicado à saúde | Aula prática | Extração de informações de laudos médicos |
14/11/2025 | Aula 8 + Atividade 4 | Inferência causal na saúde | Aula prática | Uso de DAGs para analisar impacto de tratamentos |
21/11/2025 | Aula 9 + Atividade 5 | Aprendizado por reforço aplicado à saúde | Aula prática | Política ótima de tratamento em UTI (simulação) |
28/11/2025 | Aula 10 | Interpretabilidade, fairness e explicabilidade de modelos clínicos | Aula prática | SHAP e Grad-CAM em imagens médicas |
05/12/2025 | Apresentações – Parte 1 | Apresentação dos Projetos de Aplicação – Equipes 1 a 4 | Seminário | Discussão coletiva de resultados preliminares |
12/12/2025 | Apresentações – Parte 2 | Apresentação dos Projetos de Aplicação – Equipes 5 a 8 | Seminário | Discussão coletiva de resultados preliminares |
Referências
Tema | Referência |
---|---|
Dados clínicos |
|
Estratificação de riscos |
|
Séries temporais |
|
Processamento de Linguagem Natural (PLN) |
|
Diagnóstico Diferencial |
|
Inferência Causal |
|
Aprendizado por Reforço |
|
Progressão de Doenças |
|
Automatização de workflows clínicos |
|
Medicina de Precisão |
|
Redes Bayesianas |
|
Revistas e conferências relacionadas
Revistas e conferências relacionadas à computação aplicada à saúde
Bibliografia
- AGRESTI, Alan, An Introduction to Categorical Data Analysis, Wiley Series in Probability and Statistics, 3rd edition, 2019.
- BENSON, T.; GRIEVE, G. Principles of Health Interoperability. 4o ed. Springer, 2016.
- BERNER, Eta S., Clinical Decision Support System: Theory and Practice, Springer-Verlag New York, Second Edition, 2007.
- BRAUNSTEIN, Mark L., Health Informatics on FHIR: How HL7's New API is Transforming Healthcare, 2018
- GEISS, Linda S. et al. Prevalence and incidence trends for diagnosed diabetes among adults aged 20 to 79 years, United States, 1980-2012. Jama, v. 312, n. 12, p. 1218-1226, 2014.
- KORB, K. B.; NICHOLSON, A. E. Bayesian artificial intelligence. Clayton, Victoria, Australia: Chapman & Hall/CRC, 2004.
- PANESAR, Arjun, Machine Learning and AI for Healthcare: Big Data for Improved Health Outcomes, Apress, 2019.
- PEARL, Judea. Causal inference in statistics: An overview. Statistics surveys, v. 3, p. 96-146, 2009.
- SHORTLIFFE, E. H., CIMINO, J. E., Biomedical Informatics: Computer Applications in Health Care and Biomedicine, Forth Edition, Springer, 2014.
- WANG, Ping; LI, Yan; REDDY, Chandan K. Machine learning for survival analysis: A survey. ACM Computing Surveys (CSUR), v. 51, n. 6, p. 1-36, 2019.
Programação:
- CRAWLEY, Michael J. The R book. John Wiley & Sons, 2012.
- NAGARAJAN, Radhakrishnan; SCUTARI, Marco; LÈBRE, Sophie. Bayesian networks in R. Springer, v. 122, p. 125-127, 2013.