Web Mining e Retrieval (a.a. 2020/21) Secondo Semestre |
Elenco dei File nel deposito |
Sommario Contenuti
2.Programma del Corso
3.Testi di Riferimento
4.Link Utili
5.Diapositive delle lezioni 
6.Progetti ed Esercizi Proposti
AVVISO - L'APPELLO STRAORDINARIO per la PROVA FINALE d'ESAME RISERVATA ai SOLI STUDENTI ISCRITTI in CAUTELATIVA si terra' il giorno 16/5/2022 alle ore 12:00 in AULA 13 - Macroa Area di Scienze. L'esame si svolgera' in presenza e ad esso si potra' accedere anche in remoto (tramite piattaforma Teams) ma esclusivamente a fronte di problemi logistici o sanitari ben documentati al docente via mail. Si utilizzera' inoltre l'elenco degli studenti prenotato attraverso la Pagina di Iscrizione Corso ed agli Esami (Delphi). Si ricorda che gli studenti non iscritti in cautelativa saranno automaticamente esclusi dalla Prova.
A causa del numero esiguo di studenti e delle loro richieste, la prova del 20 Settembre 2021 si terra' su piattaforma MS Teams, come riunione immediata nel Team del Corso "BASILI-8066922-WEB_MINING_AND_RETRIEVAL". Gli studenti potranno connettersi alla riunione a partire dalle 10:30.
Le prove di Settembre 2021 si terranno in presenza, in aule che verranno comunicate su queste pagine nei prossimi giorni, nei seguenti giorni e orari:
- 8 Settembre 2021, ore 15:00
- 20 Settembre 2021, ore 10:30
Gli studenti sono pregati di iscriversi alla prova su Piattaforma Delphi.
AVVISO: La seduta del secondo appello della Sessone estiva (Seconda Prova Finale) si terrà domani 19 Luglio alle ore 10:30. L'appello del 19 Luglio sarà tenuto in presenza presso la Macroarea di Ingegneria ed anche in modalità on-line, sulla piattaforma MS Teams.
Gli studenti iscritti che vogliono sostenere la prova in presenza sono pregati di recarsi presso l'ufficio del docente, stanza D1-11 presso l'ala nuova dell'Edificio di Ingegneria dell'Informazione, presso la macroarea di Ingegneria alle pre 10:00. Di lì si recheranno all'aula con il docente. Subito dopo dall'Aula sarà fatta partire la sessione on-line su MS Teams per gli studenti non presenti.
Risultati della seconda prova d'esonero e della prima prova finale dell'esame, tenutesi il 19 Giugno.
Gli studenti che intendono accettare la valutazione debbono confermarla discutendo la prova (domanda "Homework") in un meeting telematico sulla piattaforma MS Teams, che si terrà nelle seguenti date:
- Martedì 13 Luglio dalle 9:30 alle 11:00
- Giovedi' 15 Luglio dalle 10:00 alle 11:00
- Venerd' 16 Luglio dalle 9:30 alle 11:00
Si comunichi al docente (via mail) la data scelta.
AVVISO: La data del primo appello della Sessone estiva (Seconda Prova d'esonero, e Prima Prova Finale) è spostato al giorno 19 Giugno alle ore 10:30. L'appello del 14 Giugno è da considerarsi cancellato.
Si ricorda la prova sarà condotta in modalità on-line, sulla piattaforma MS Teams.
Gli studenti sono pregati di iscriversi alle due prove su Piattaforma Delphi, esprimendo la richiesta sulla modalità della prova.
Le Slide del mini corso sulle Reti Neurali sono in sezione Diapositive delle lezioni.
Il Calendario delle PROVE FINALI d'esame della Sessione Estiva, è il seguente:
- Lunedi' 14 Giugno 2021, ore 14:30 (Seconda Prova d'esonero, e Prima Prova Finale)
- Lunedi' 19 Luglio 2021, ore 10:00 (Seconda Prova Finale)
La prova sarà condotta in modalità on-line, sulla piattaforma MS Teams.
Gli studenti sono pregati di iscriversi alle due prove su Piattaforma Delphi, esprimendo la richiesta sulla modalità della prova.
Le Slide del mini corso sulle Reti Neurali sono in sezione Diapositive delle lezioni.
!!! ATTENZIONE !!! Secondo le modalità didattiche comuni a tutti i corsi della Laurea Magistrale di Informatica, le lezioni e le esercitazioni del Corso di WM&R verranno tenute on-line sulla piattaforma MS Teams d'ateneo.
Le lezioni avranno inizio a partire dall'8 Marzo 2021, prossimo.
Alcuni incontri con gli studenti nell'aula prevista dall'orario sarano tenuti durate il Corso, dedicato ad esercitazioni collettive ed alla preparazione agli esami. Essi verranno annunciati per tempo durate lo svolgimento delle lezioni. .
!!! WARNING !!! According to teaching modalities adopted for all courses of the Computer Science curriculum, all the lessons for the WM&R course will be hed on-line on the MS Teams platforms made avaiable by the University.
The course will start on Monday March 8, 2021.
Some lessons or pre-tests before exams will be hed in presence, in the rooms made available for the course, but these will be timely announced during the on-line lessons and published on this site.
!!! REQUEST !!! - All students interested to attending the Course for this semester are invited to register to the Course at the Delphi platform. If, for any reason, you cannot proceed to the registration, e.g. the Course does not appear among those ones that are part of your standard academic curriculum, do not worry: you have to contact the course responsible by e-mail, and comunicate the intention to attend: he will then upload your registration to Delphi, manually.
In the next days, on-line videoconferences will be run at the time the weekly lessons are scheduled, through the Microsoft Teams platform that the Tor Vergata University is making available to teachers and students.
Notice that all invitations will be sent only to Delphi registered students.
The teams of the course under MS Teams is: "BASILI-8066922-WEB_MINING_AND_RETRIEVAL". Please check your membership on MS Teams.
- LUNEDI', h. 14:00-16:00
- MERCOLEDI', h. 9:30-11:30
- GIOVEDI'', h. 11:30-13:30
Le lezioni del Corso inizieranno regolarmente Lunedi' 8 Marzo 2021, alle ore 14:00 su MS Teams.
Gli studenti che intendono seguire il Corso sono pregati di registrarsi ad esso, accedendo al sito Delphi.
Le diapositive delle lezioni saranno pubblicate durante il ciclo delle lezioni su queste pagine.
Il Corso insiste sulle ricerche ed i progetti innovativi del Semantics Analytics Group (SAG), che si occupa di Machine Learning e Natural Language Processing nella progettazione ed ingegnerizzazione di Sistemi Software Avanzati di Intelligenza Artificiale, e nelle loro applicazioni predittive nella interpretazione e ricerca di documenti, nella sicurezza in rete, nella analisi dei Social Network e nei processi di Digital Transformation.
Sono attive alcune sperimentazioni e progetti presso il SAG Laboratory for Semantics Analytics, da cui sono emanate annualmente alcune Borse di Studio e Premi di Laurea.
Sara' possibile discutere in dettaglio le diverse Tesi con il coordinatore di SAG, prof. Roberto BASILI, o con il responsabile tecnico del Laboratorio, prof. Danilo CROCE.
L'orario di ricevimento, diverso da quello dei Corsi, e' da concordare con i docenti via e-mail.
Segue il programma preliminare del Corso che sara' messo a punto ed finalizzato al termine delle lezioni del Corso.
Section I: Machine Learning and Kernel-based Learning.
Machine Learning and Artificial Intelligence. Supervised methods. Probabilistic and Generative Methods. Unsupervised Learning. Clustering. Semantic Similarity metrics. Agglomerative clustering methods. K-mean. Hidden Markov Models. Statistical Learning Theory: PAC learnability. Kernel-based Learning. Polynomial and Radial Basis Function Kernels. String and Tree kernels. Semantic kernels. Neural Modeling: Perceptron, Multilayer Percetrons, Deep Neural Networks. Language Models and Recurrent Networks. Introduction to the main platforms for the development of ML software: TensorFlow, Weka, SciKit, KeLP.
Section II: Statistical Language Processing.
Supervised Language Processing tools. HMM-based POS tagging. Named Entity Recognition. Statistical parsing. PCFGs: Charniak parser. Lexicalized Parsing Methods. Shallow Semantic Parsing: kernel based semantic role labelling. Information Extraction. Introduction to IBM's Watson.
Section III: Web Mining & Retrieval.
Ranking Models for the Web. Introduction to Social Network Analysis: rank, centrality. Random walk models: Page Rank. Web Search Engines. SEO. Google. Preference Learning for IR. Question Answering Systems. Wikipedia-based knowledge Acquisition. Social Web. Graph-based algorithms for community detection. Opinion Mining and Sentiment Analysis.
Testi di Riferimento
IR - Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze, Cambridge University Press. 2008. Find the book Home page HERE.
ML - Pattern Recognition and Machine learning, C. Bishop. Springer. 2006.
ML ed IR - Automatic Text Categorization: from Information Retrieval to Support Vector Learning, Roberto Basili, Alessandro Moschitti, ARACNE Editore, 2005.
Web IR - Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. 2nd Edition, July 2011, Springer.
- Dispense fornite dal docente
Lezioni (Lessons Slide)
Lezione 12 Distributional Semantic Methods and introduction to Wordspaces.
Lesson 13: Introduction to Neural Networks and Deep Learning Architectures: a mini Course.
- Lesson 13.1 An Introduction to Neural Learning. The MultiLayer Perceptron: defining and training MLPs.
Lesson 13.2 Deep Learning: Architectures and Tasks
- References and resources:
- Gradient Descent and Perceptron training, "A Tutorial on Deep Learning, Part 1: Nonlinear Classifiers and The Backpropagation Algorithm", Quoc V. Le (Google), (fino a sezione 6 compresa)
- Backpropagation on NNs, "Sparse autoencoder", from the lessons of Andrew Ng (Stanford University, USA), (fino a pagina 12)
- Advanced Architectures, "A Tutorial on Deep Learning, Part 2: Autoencoders, Convolutional Neural Networks and Recurrent Neural Networks", by Quoc V. Le (Google Brain)
- Deep Learning, "Learning Deep Architectures for AI", Yoshua Bengio Dept. IRO, Universite' de Montreal, CA.
Lesson 13.3 Deep Learning and Natural Language Processing: Recurrent Neural Networks, Encoder and Decoder Networks
Lesson 13.4 Deep Learning, Language Modeling and Embeddings
Software packages for Deep Learning:
Link Utili
LABORATORI: Progetti ed Esercizi
- Saranno QUI resi disponibili Esercizi e Soluzioni di preparazione alla Prove d'Esame.