Données et algorithmes du Web, INF344 (2013–2014)
Cette page contient le matériel du cours Données et algorithmes du Web (INF344), session 2013–2014.
Cours
- Mining Massive Datasets
- MapReduce
- Les quatre « v » de la datamasse du Web
- Web Crawling
- Information Retrieval
- Web Ranking, Computational Advertising
- Link Analysis Algorithms, PageRank
- The Theory behind PageRank
- Clustering
- Frequent Itemsets
- Opinion mining
- Knowledge representation
- Distributed storage (matériel co-réalisé avec Wolf-Tilo Balke, compléments disponibles ici)
- Named Entity recognition
- Evaluation, Disambiguation, and Instance-Extraction
- Fact Extraction
- Fact Extraction by Reasoning
- Semantic Web
Travaux pratiques
Les travaux pratiquent utilisent ce site de soumission et évaluation automatique.
- Exemple pour tester le site de soumission: calcul de factoriel (squelette). Date limite de soumission : 23 mai à 8:30 (pénalités de -4 points jusque le 23 mai à 11:45).
- Inverted Index with MapReduce (énoncé, squelette). Date limite de soumission : 25 mai à 23:59 (pénalités de -4 points jusque le 26 mai à 8:30).
- Matrix Vector Multiplication with MapReduce (énoncé, squelette). Date limite de soumission : 3 juin à 13:00.
- PageRank (énoncé, squelette). Date limite de soumission: 6 juin à 17:00.
- HBase (énoncé, squelette). Date limite de soumission : 25 juin à 23:59 (pénalités de -4 points jusque le 26 juin à 8:30).
- Named Entity Recognition (énoncé, squelette). Date limite de soumission : 1er juillet à 17:00.
- Instance Extraction (énoncé, squelette). Date limite de soumission : 1er juillet à 17:00.
- Analyse des opinions sous Twitter (énoncé)
Références
Web Data Management
S. Abiteboul, I. Manolescu, M.-C. Rousset, P. Rigaux et P. Senellart, Web Data Management. Cambridge University Press, New York, USA, janvier 2012. Disponible en téléchargement et à l'achat