Técnicas de Data Mining

Mestrado em Informática na Saúde (pós-laboral)
6 ECTS; 1º Ano, 2º Semestre, 24,0 T + 8,0 TP

Docente(s)

Pré-requisitos

Objetivos
Os principais objectivos desta unidade curricular são:
1 - Transmitir os conceitos, vantagens e constrangimentos da implementação e utilização de bancos de dados e de ferramentas de prospeção de dados;
2 - Dar a conhecer os métodos, técnicas e algoritmos de DM utilizados em medicina;
3 - Implementar aplicações específicas na área da saúde com recurso ferramentas computacionais de data mining.
Competências a adquirir:
? Reconhecer a necessidade e mais valia de aplicações de data mining para a construção de conhecimento no sector da saúde;
? Conhecer e ter capacidade para ultrapassar as dificuldades de implementação de aplicações de data mining;
? Dominar as técnicas, métodos e algoritmos de data mining utilizados no pré-processamento e processamento de dados de saúde;
? Capacidade de implementar aplicações de prospeção de dados.

Programa
Data Warehouses;
Data Mining (DM)
? Introdução ao data mining em medicina
? Técnicas de pré-processamento de dados
? Classificação de dados
? Árvores de decisão
? Regras de associação
? Aglomeração
? Software open source: Weka, R
? Casos práticos

Metodologia de avaliação
O método de avaliação consiste na realização de uma prova escrita, com um peso de 40% da classificação final, e no design e implementação de uma ferramenta de prospeção de dados, com um peso de 60% da classificação final. Para obter aprovação à unidade curricular o aluno devá atingir uma classificação final, resultante da média das duas componentes de avaliação, igual ou superior a 9,5 valores.

Bibliografia
- Witten, I. e Frank, E. (2005). Data Mining: Practical Machine Learning Tools and Techniques. (Vol. 1). (pp. 1--). Germany: Morgan Kaufmann
- Chen, H. e Fuller, S. e Friedman, C. e Hersh, W. (2005). Medical Informatics: Knowledge Management and Data Mining in Biomedicine. (Vol. 8). (pp. 1--). USA: Springer

Método de interação
Atendendo aos objectivos da unidade curricular de Técnicas de Data Mining o método de ensino a praticar consiste na exposição oral dos conteúdos programáticos previstos (aulas teóricas), na apresentação e discussão de temas com eles relacionados (aulas teórico-práticas) e ainda no manuseamento de ferramentas de data mining (aulas práticas laboratoriais). Estão também previstas sessões de orientação tutorial, e a utilização da plataforma de e-learning como ferramenta para divulgação de informação, esclarecimento de dúvidas, envio de textos de apoio, fichas de exercícios etc.

Software utilizado nas aulas
SAS - Business Analytics and Business Intelligence Software