Information Retrieval (a.a. 2024/25)
Docente: Danilo Croce Email: croce@info.uniroma2.it
    Elenco dei File nel deposito

 

Sommario Contenuti

1.Novità

2.Programma del Corso

3.Testi di Riferimento

4.Link Utili

5.Diapositive delle lezioni

6.Progetti ed Esercizi Proposti


Novità

  • Si comunica che il Primo Esonero è fissato per Mercoledi' 13 Novembre 2024 alle ore 11.30 in Aula B15. Si ricorda a tutti di iscriversi al canale teams e di venire muniti del proprio PC per poter sostenere il Test a Risposta Multipla che si terrà su Microsoft Forms
  • Le lezioni del Corso seguiranno il seguente calendario settimanale:
    • MARTEDI', h. 14:00-16:30 (Aula 1 - Macroarea di Ingegneria)
    • MERCOLEDI', h. 11:30-13:30 (Aula B15 - Macroarea di Ingegneria)

    Il ricevimento studenti si terra' dopo ciascuna lezione, previa prenotazione da parte dello studente.
  • Per essere aggiunti al corso ed al canale Teams, e' NECESSARIO ISCRIVERSI al corso stesso usando la Pagina di Iscrizione (Delphi).

  • Programma del Corso

    Segue il programma preliminare del Corso che sara' messo a punto ed finalizzato al termine delle lezioni del Corso.

    • Introduzione al problema dell'Information Retrieval
    • Definizione della nozione di Inverted Indices
    • Costruzione di Indici per l'Information Retrieval
    • Algoritmi per la codifica e compressione dell'Informazione
    • Funzione di Ranking documentale
    • Introduzione al Vector Space Model
    • Modelli Probabilistici per l'Information Retrieval
    • Valutazione dei Sistemi di IR
    • Sviluppo efficiente e su larga scala di sistemi di IR
    • Crawling e Detection di risorse duplicate
    • Introduzione a IR engines (e.g., Apache Lucene)
    • Introduzione a Map Reduce



    Testi di Riferimento

    • IR - Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze, Cambridge University Press. 2008. Find the book Home page HERE.
    • Dispense fornite dal docente

    Lezioni (Lucidi)

    • QUI saranno pubblicate le slide delle singole lezioni. Non costituiscono l'esclusivo materiale didattico su cui si puo' preparare l'esame ma forniscono i dettagli sugli aspetti del programma cui concentrare la propria preparazione e gli esempi ed esercizi utili alla comprensione della materia.
      E' possibile visionare il materiale dello scorso anno accademico al seguente LINK.
    • Il seguente materiale viene pubblicato anche nel canale Teams del corso.
    • Lezione Iniziale: Introduzione al Corso.
    • Lezione 1: Introduzione al Modello Booleano e Definizione della nozione di Inverted Indices (le slide di riferimento possono essere trovate al seguente link)
    • Lezione 2: Costruzione di Indici per l'Information Retrieval (le slide di riferimento possono essere trovate al seguente link)
    • Lezione 3: Algoritmi per la codifica e compressione dell'Informazione nell'IR (le slide di riferimento possono essere trovate al seguente link)
    • Lezione 4: Funzione di Ranking documentale. Introduzione al Vector Space Model
      • Lezione 4.1: Una breve introduzione alla nozione di Distributional Lexical Semantics
    • Lezione 5: Valutazione dei Sistemi di Information Retrieval

    Esercitazioni

    • QUI saranno pubblicate le slide delle singole esercitazioni e laboratori.
    • Esercitazione 1: Implementazione di Indici per l'Information Retrieval in Python.
      Nei seguenti Python Book vengono riportati degli esempi di:
      • Indici non Posizionali
      • Query complesse ad Indici non Posizionali
      • Indici Posizionali
      Per gli esempi e' necessario scaricare il corpus 20Newsgroups anche scaricabile al seguente LINK.

    Progetti

    • L'esame comprende, in maniera NON obbligatoria, lo svolgimento di un progetto implementativo da eseguire eventualmente in gruppi. Per gli studenti che dovessero sostenere ancora l'esame da 9 CFU (A.A. 2019-2020) il progetto e' obbligatorio. La descrizione dei progetti proposti sara' disponibile durante il corso.