Esci dai Frame

  Web Mining e Retrieval (a.a. 2021/22)
Secondo Semestre
Docente: Roberto Basili Email: basili@info.uniroma2.it
    Elenco dei File nel deposito

Sommario Contenuti

1.Novita'

2.Programma del Corso

3.Testi di Riferimento

4.Link Utili

5.Diapositive delle lezioni

6.Progetti ed Esercizi Proposti


Novita'

  • Date d'esame degli Appelli della Sessione Straordinaria di Settembre .
    • Appello III: Giovedi' 8 Settembre 2022, h. 15:00, Aula da definire.
    • Appello IV: Mercoledi' 21 Settembre 2022, h. 15:00, Aula da definire.

    Gli studenti sono pregati di procedere alla registrazione all'esame tramite DELPHI.


  • Risultati Finali Seconda Prova Finale del 15 Luglio 2022. Gli studenti potranno discutere il compito anche su piattaforma Teams, a partire dal giorno Martedì 26 Luglio alle ore 14:00, inviando una mail al docente per la prenotazione. E' possibile, nella mail: (1) confermare la accettazione del voto, o (2) richiedere un orale di approfondimento per il miglioramento dello stesso.

  • REMIND: Il Secondo Test Finale previsto il giorno Venerdi' 15 Luglio 2022 si terra' in Aula 13 a partire dalle ore 10:00.

  • Risultati Finali Prove di Esonero (Secondo Esonero del 16 Giugno 2022)

  • Risultati Finali Prima Prova Finale (Appello del 22 Giugno 2022)

    Gli studenti partecipanti alle due prove d'esame sono invitati, attraverso il canale MS Teams del Team del Corso dedicato alla propria prova, a comunicare la accettazione esplicita del voto proposto. Solo coloro che avranno proceduto a tale conferma potranno contare sulla verbalizzazione dell'esame.
    Si invitano gli studenti che vogliono vedere l'esito del Test o richiedere una prova orale per l'arrotondamento del voto a contattare il docente via email.
    Verranno pubblicati a breve i progetti proposti per gli studenti che derivano dal Corso 9 CFU.



  • Date d'esame Appelli della Sessione Estiva.
    • Test Finale 1: Mercoledi' 22 Giugno 2022, h. 11:30, Aula 13.
    • Test Finale 2: Venerdi' 15 Luglio 2022, h. 9:30, Aula 13


  • Risultati del Primo Esonero del Giovedi' 28 Aprile 2022: nuova versione completata di uno studente in più.

  • La LEZIONE di oggi 30 Maggio 2022 si terra' regolarmente alle 14:00 ma in forma esclusivamente Telematica sul canale MS Teams del Corso.


  • A CAUSA di un problema di salute, la lezione di Mercoledi' 25 Magio 2022 prevista per le 9:30 si terra' in forma esclusivamente Telematica sul canale MS Teams del Corso.


  • A CAUSA di un CONCOMITANTE CONSIGLIO di DIPARTIMENTO, la lezione prevista per le 11:30 di Giovedi' 21 Aprile 2022, e' ANNULLATA e non SI TERRA'. Il Corso continuera' le sue lezioni regolarmente MERCOLEDI' 27 Aprile.
  • Il Test in Itinere si terra' all'interno del normale orario delle lezioni, quindi in Aula 13 alle ore 11:30, Giovedi' 28 Aprile 2022. Si prega di comunicare eventuali problemi CRITICI che impediscano la partecipazione in presenza al docente tramite email. La prova richiedera' l'uso di MS Teams, i presenza, quindi gli studenti sono invitati a portare con se telfonino, tablet o PC, utile per l'accesso e le risposte ai FORM della prima parte dell'esame. La domanda aperta sarà invece scritta (a mano) in aula. Gli studenti sono pregati di procedere alla registrazione all'esame tramite DELPHI.

    The first Mid Term Test will be held in Room 13, on Thursday April 28, 2022, at 11:30.. The written test will require presence in Room 13: potential critical problems to fit this requirement should be communicated as soon as possible to the COurse responsible by mail. As MS Teams will be used, students are invited to join the test with mobile phone, PC or tablet available: they are needed to fill the MS forms required by the first part of the test, involving a set of closed answer questions. The second part of the test only involve a hand written answer to an open question. Students should register to the test using the DELPHI portal.

  • ESECIZI di preparazione al Test in Itinere PROPOSTI: Decision Trees and Rocchio


  • ANNUNCIO: Il Corso avra' inizio a partire dal 7 Marzo 2022, secondo il seguente orario:
    • LUNEDI', h. 14:00-16:00 (Aula 19 Edifici Aule Macroarea di Scienze)
    • MERCOLEDI', h. 9:30-11:30 (Aula 13 Edifici Aule Macroarea di Scienze)
    • GIOVEDI'', h. 11:30-13:30 (Aula 13 Edifici Aule Macroarea di Scienze)



  • The teams of the course under MS Teams is: "BASILI-8066922-WEB_MINING_AND_RETRIEVAL_1". Please check your membership on MS Teams. The course will start on March 7 according to the following:
    Course TIMETABLE:
    • LUNEDI', h. 14:00-16:00 (Aula 19 Edifici Aule Macroarea di Scienze)
    • MERCOLEDI', h. 9:30-11:30 (Aula 13 Edifici Aule Macroarea di Scienze)
    • GIOVEDI'', h. 11:30-13:30 (Aula 13 Edifici Aule Macroarea di Scienze)
  • Gli studenti che intendono seguire il Corso sono pregati di registrarsi ad esso, accedendo al sito Delphi.
  • Le diapositive delle lezioni saranno pubblicate durante il ciclo delle lezioni su queste pagine.
  • Il Corso insiste sulle ricerche ed i progetti innovativi del Semantics Analytics Group (SAG), che si occupa di Machine Learning e Natural Language Processing nella progettazione ed ingegnerizzazione di Sistemi Software Avanzati di Intelligenza Artificiale, e nelle loro applicazioni predittive nella interpretazione e ricerca di documenti, nella sicurezza in rete, nella analisi dei Social Network e nei processi di Digital Transformation.
    Sono attive alcune sperimentazioni e progetti presso il SAG Laboratory for Semantics Analytics, da cui sono emanate annualmente alcune Borse di Studio e Premi di Laurea.
    Sara' possibile discutere in dettaglio le diverse Tesi con il coordinatore di SAG, prof. Roberto BASILI, o con il responsabile tecnico del Laboratorio, prof. Danilo CROCE.
    L'orario di ricevimento, diverso da quello dei Corsi, e' da concordare con i docenti via e-mail.


    RECENTI PROPOSTE di TESI di LAUREA.

  • Programma


    Segue il programma preliminare del Corso che sara' messo a punto ed finalizzato al termine delle lezioni del Corso.

    Section I: Machine Learning and Deep Learning.
    Deep Learning and Artificial Intelligence. Supervised methods. Probabilistic and Generative Methods. Unsupervised Learning. Clustering. Semantic Similarity metrics. Agglomerative clustering methods. K-mean. Hidden Markov Models. Statistical Learning Theory: PAC learnability. Kernel-based Learning. Polynomial and Radial Basis Function Kernels. String and Tree kernels. Semantic kernels. Neural Modeling: Perceptron, Multilayer Percetrons, Deep Neural Networks. Language Models and Recurrent Networks. Attention-based Neural Networks. Transformers: BERT, GPT models. 0-Shot Learning for NLP. Introduction to the main platforms for the development of ML software: Weka, SciKit, PyTorch, KeLP.

    Section II: Deep Networks for Natural Language Processing.
    Supervised Language Processing tools. HMM-based POS tagging. Named Entity Recognition. Statistical and Neural parsing. Shallow Semantic Parsing: kernel based semantic role labelling. Neural models for Textual Inference. End-to-End Neural semantic parsing. Information Extraction. Trasformer based Language processing: pre-training and fine-tuning. 0-shot Neural Models.

    Section III: ML Application in the Web: Sentiment Analysis and Social Media Analytics.
    Ranking Models for the Web. Introduction to Social Network Analysis: rank, centrality. Random walk models: Page Rank. Question Answering Systems. Wikipedia-based knowledge Acquisition. Social Web Analysis. Opinion Mining and Sentiment Analysis.


    Testi di Riferimento

    • IR - Introduction to Information Retrieval , Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze, Cambridge University Press. 2008. Find the book Home page HERE.
    • ML - Introduction to Deep Neural Learning, Deep Learning, Ian Goodfellow, Yoshua Bengio, Aaron Courville, MIT Press, 2016.
    • ML - Pattern Recognition and Machine learning, C. Bishop. Springer. 2006.
    • ML ed IR - Automatic Text Categorization: from Information Retrieval to Support Vector Learning, Roberto Basili, Alessandro Moschitti, ARACNE Editore, 2005.
    • Web IR - Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. 2nd Edition, July 2011, Springer.
    • Dispense fornite dal docente

    Lezioni (Lessons Slide)


    Link Utili


    LABORATORI: Progetti ed Esercizi