Esci dai Frame

  Web Mining e Retrieval (a.a. 2020/21)
Secondo Semestre
Docente: Roberto Basili Email: basili@info.uniroma2.it
    Elenco dei File nel deposito

Sommario Contenuti

1.Novita'

2.Programma del Corso

3.Testi di Riferimento

4.Link Utili

5.Diapositive delle lezioni

6.Progetti ed Esercizi Proposti


Novita'

  • !!! ATTENZIONE !!! Secondo le modalitÓ didattiche comuni a tutti i corsi della Laurea Magistrale di Informatica, le lezioni e le esercitazioni del Corso di WM&R verranno tenute on-line sulla piattaforma MS Teams d'ateneo.

    Le lezioni avranno inizio a partire dall'8 Marzo 2021, prossimo.

    Alcuni incontri con gli studenti nell'aula prevista dall'orario sarano tenuti durate il Corso, dedicato ad esercitazioni collettive ed alla preparazione agli esami. Essi verranno annunciati per tempo durate lo svolgimento delle lezioni.
    .

  • !!! WARNING !!! According to teaching modalities adopted for all courses of the Computer Science curriculum, all the lessons for the WM&R course will be hed on-line on the MS Teams platforms made avaiable by the University.

    The course will start on Monday March 8, 2021.

    Some lessons or pre-tests before exams will be hed in presence, in the rooms made available for the course, but these will be timely announced during the on-line lessons and published on this site.





  • !!! REQUEST !!! - All students interested to attending the Course for this semester are invited to register to the Course at the Delphi platform. If, for any reason, you cannot proceed to the registration, e.g. the Course does not appear among those ones that are part of your standard academic curriculum, do not worry: you have to contact the course responsible by e-mail, and comunicate the intention to attend: he will then upload your registration to Delphi, manually.

    In the next days, on-line videoconferences will be run at the time the weekly lessons are scheduled, through the Microsoft Teams platform that the Tor Vergata University is making available to teachers and students.

    Notice that all invitations will be sent only to Delphi registered students.



  • The teams of the course under MS Teams is: "BASILI-8066922-WEB_MINING_AND_RETRIEVAL". Please check your membership on MS Teams.
  • Course TIMETABLE:
    • LUNEDI', h. 14:00-16:00
    • MERCOLEDI', h. 9:30-11:30
    • GIOVEDI'', h. 11:30-13:30
  • Le lezioni del Corso inizieranno regolarmente Lunedi' 8 Marzo 2021, alle ore 14:00 su MS Teams.
    Gli studenti che intendono seguire il Corso sono pregati di registrarsi ad esso, accedendo al sito Delphi.

  • Le diapositive delle lezioni saranno pubblicate durante il ciclo delle lezioni su queste pagine.
  • Il Corso insiste sulle ricerche ed i progetti innovativi del Semantics Analytics Group (SAG), che si occupa di Machine Learning e Natural Language Processing nella progettazione ed ingegnerizzazione di Sistemi Software Avanzati di Intelligenza Artificiale, e nelle loro applicazioni predittive nella interpretazione e ricerca di documenti, nella sicurezza in rete, nella analisi dei Social Network e nei processi di Digital Transformation.
    Sono attive alcune sperimentazioni e progetti presso il SAG Laboratory for Semantics Analytics, da cui sono emanate annualmente alcune Borse di Studio e Premi di Laurea.
    Sara' possibile discutere in dettaglio le diverse Tesi con il coordinatore di SAG, prof. Roberto BASILI, o con il responsabile tecnico del Laboratorio, prof. Danilo CROCE.
    L'orario di ricevimento, diverso da quello dei Corsi, e' da concordare con i docenti via e-mail.


    RECENTI PROPOSTE di TESI di LAUREA.

  • Programma


    Segue il programma preliminare del Corso che sara' messo a punto ed finalizzato al termine delle lezioni del Corso.

    Section I: Machine Learning and Kernel-based Learning.
    Machine Learning and Artificial Intelligence. Supervised methods. Probabilistic and Generative Methods. Unsupervised Learning. Clustering. Semantic Similarity metrics. Agglomerative clustering methods. K-mean. Hidden Markov Models. Statistical Learning Theory: PAC learnability. Kernel-based Learning. Polynomial and Radial Basis Function Kernels. String and Tree kernels. Semantic kernels. Neural Modeling: Perceptron, Multilayer Percetrons, Deep Neural Networks. Language Models and Recurrent Networks. Introduction to the main platforms for the development of ML software: TensorFlow, Weka, SciKit, KeLP.

    Section II: Statistical Language Processing.
    Supervised Language Processing tools. HMM-based POS tagging. Named Entity Recognition. Statistical parsing. PCFGs: Charniak parser. Lexicalized Parsing Methods. Shallow Semantic Parsing: kernel based semantic role labelling. Information Extraction. Introduction to IBM's Watson.

    Section III: Web Mining & Retrieval.
    Ranking Models for the Web. Introduction to Social Network Analysis: rank, centrality. Random walk models: Page Rank. Web Search Engines. SEO. Google. Preference Learning for IR. Question Answering Systems. Wikipedia-based knowledge Acquisition. Social Web. Graph-based algorithms for community detection. Opinion Mining and Sentiment Analysis.


    Testi di Riferimento

    • IR - Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze, Cambridge University Press. 2008. Find the book Home page HERE.
    • ML - Pattern Recognition and Machine learning, C. Bishop. Springer. 2006.
    • ML ed IR - Automatic Text Categorization: from Information Retrieval to Support Vector Learning, Roberto Basili, Alessandro Moschitti, ARACNE Editore, 2005.
    • Web IR - Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. 2nd Edition, July 2011, Springer.
    • Dispense fornite dal docente

    Lezioni (Lessons Slide)


    Link Utili


    LABORATORI: Progetti ed Esercizi

    • Saranno QUI resi disponibili Esercizi e Soluzioni di preparazione alla Prove d'Esame.