Técnicas Avançadas de Programação

Tecnologias de Informação e Comunicação
5 ECTS; 2º Ano, 2º Semestre, 30,0 PL + 30,0 TP

Docente(s)
- Ricardo Nuno Taborda Campos

Pré-requisitos
Conhecimentos de C#
UC de Programação e Algoritmia; Linguagens de Programação (Desejável).

Objetivos
O aluno deverá ser capaz de desenhar a arquitetura de um motor de busca, explorar ferramentas de crawling, compreender as diferentes fases de processamento da linguagem natural, saber implementar um índice invertido, modelos de pesquisa de informação assim como a metodologia de avaliação Cranfield.

Programa
1. Introdução à pesquisa de informação e motores de busca
1.1. Definição e objetivos
1.2. Motores de busca
1.3. Aplicações
1.4. Dificuldades e desafios
1.5. Arquitetura de um sistema de pesquisa de informação

2. Crawling
2.1. Definição
2.2. Performance
2.3. Implementação

3. Processamento de texto
3.1. Sentence splitting
3.2. Tokenização
3.3. Part-of-speech
3.4. Reconhecimento de entidades
3.5. Stopwords
3.6. Stemming

4. Representação de texto
4.1. Tipos de evidência
4.2. Bag-of-words

5. Indexação
5.1. Inverted Files
5.2. Posting Lists

6. Modelos de pesquisa de informação
6.1. Booleano
6.2. Espaço vetorial
6.3. Outros modelos

7. Avaliação de sistemas de pesquisa de informação
7.1. Noção de relevância
7.2. Métodos de avaliação (laboratório, centrada no utilizador, online)
7.3. Paradigma Cranfield
7.4. Métricas de avaliação
7.5. Testes de significância

Metodologia de avaliação
- Avaliação Periódica: Frequência (40%) + Projeto I (60%)
- Avaliação Final: Exame (40%) + Projeto I (60%)

Bibliografia
- Liu, B. (2007). Web Data Mining. Ams: Springer
- Croft, B. e Metzler, D. e Strohman, T. (0). Search Engines: Information Retrieval in Practice.Acedido em24 de novembro de 2015 em http://ciir.cs.umass.edu/irbook/
- Manning, C. e Raghavan, P. e Schütze, H. (0). An Introduction to Information Retrieval.Acedido em24 de novembro de 2015 em http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf
- Van Rijsbergen, C. (0). Information Retrieval.Acedido em24 de novembro de 2015 em Information Retrieval

Método de interação
Aulas Teórico-Práticas: Exposição dos conteúdos programáticos aos alunos com recurso ao método expositivo e demonstrativo Aulas Práticas: Análise e resolução de casos práticos

Software utilizado nas aulas
Microsoft Visual Studio