Lucidi usati a lezione ed altro materiale didattico (2009-2010)

NOTA: I lucidi sono tutti aggiornati al 2009. I lucidi aggiornati al 2010 hanno una "*"

Lucidi

  • Introduzione al corso (ppt) *
  • Information Retrieval: architettura, trattamento dei documenti, indicizzazione, metodi di ranking booleano , vettoriale e booleano esteso (ppt) *
  • Valutazione delle prestazioni di un sistema di retrieval (ppt) *
  • La libreria di IR open-source Lucene (ppt) *

Altri metodi di ranking:

  • Metodi di ranking probabilistici (ppt) *
  • Latent Semantic Indexing (ppt) *
  • Query Expansion e Relevance Feedback (pdf) *

Information retrieval sul web

  • Ricerca, Indicizzazione e Ranking dei documenti sul Web. Principali metodi di link analysis usati dai motori di ricerca (ppt) *

Intelligent Information Retrieval

  • Trattamento del linguaggio naturale (Natural Language Processing): introduzione e cenni ai metodi stocastici per "speech and language processing" (HMM) (ppt) *
  • Information Extraction (ppt) *
  • Sistemi di Question Answering (ppt)
  • Document clustering e applicazioni (pdf) NO 2010
  • Opinion Mining (ppt) *
  • Introduzione al multimedia retrieval (ppt)*
  • Image retrieval tramite forma (ppt) *
  • Annotazione automatica di materiale multimediale (ppt) *

Esercitazione di mid-course 2011 (lucene)

Indicizzare una base documentale e creare una semplice search engine con Lucene.

file tar.gz con messaggi su argomenti di sport, religione, politica, motori

breve descrizione dell'esercitazione e modalità di consegna

Il progetto Eclipse utilizzato a lezione per mostrare le API di Lucene (nota: richiede il file xml di SimpleWiki -- vedi file Test.java -- o di un altro wiki nella radice del progetto)

Tutorial su Lucene http://www.lucenetutorial.com/

Lucidi usati a lezione 2011 ppt

Materiale per il progetto 2010 (2011 da concordare col docente)

Il tema del progetto 2010 è Opinion Mining, e trovate la descrizione su (doc).

SentiWordNet e altre risorse di interesse sono state inviate per email agli studenti che hanno seguito il corso. Chi non ha seguito deve inviarmi una email di richiesta. Nella sezione "Materiale Aggiuntivo" trovate una survey sul tema.

Potete scaricare qui una cartella "zipped" con i datsets (opinioni su temi vari) (zip)

Esercizi svolti in classe e compiti di esame

  • Esercizo 1: ranking booleano vettoriale (pdf) (2010)
  • Esercizio 2: two-layers belief network (pdf) (2010)
  • Esercizio 3: LSI, Rocchio, BIM (pdf) (2010)
  • Compito di esame luglio 2009 (pdf)
  • Compito di esame giugno 2010 con soluzioni (pdf)

Materiale aggiuntivo (la selezione dipende dal programma dell'anno in corso, i miei suggerimenti sono evidenziati dalla (*) )

  • Tre articoli zippati su generalized Vector Space model e metodi per il calcolo della similarità fra termini (zip)
  • Un articolo su IR probabilistico (pdf) (*)
  • Un articolo di Turtle e Croft (1990) su IR probabilistico (html) (*)
  • Un articolo per approfondire la matematica del Latent Semantic Indexing (pdf) (*)
  • Un articolo piu' semplice sul latent semantic indexing (pdf) (*)
  • Una survey su Web Information Retrieval (pdf)
  • Una survey sui metodi di ranking, basati sull'analisi del grafo del Web (pdf) (*)
  • Il capitolo 9 del libro di C. Manning su "link analysis", con la spiegazione di PageRank e Hits(pdf) (*)
  • Un'altra survey sulle metriche per il Web (pdf)
  • Metodi per la costruzione di Ontologie (rassegna prodotta dal progetto europeo OntoWeb) (pdf)
  • Una survey su Hidden Markov Models e Algoritmo di Viterbi, e loro applicazioni al trattamento del linguaggio naturale (tutorial on hmm and applications)(*)
  • Stato dell'arte sulle ontologie (prodotto dal progetto europeo INTEROP):
    • Ontology representation (pdf)
    • Tools for ontology management and learning (pdf)
    • Ontology merging and reconciliation pdf)
    • Interoperabiity through ontologies (pdf)
  • Survey sui sistemi per l'estrazione di informazioni dal web (pdf) (*)
  • Un articolo su open domain question answering (pdf) (*)
  • Una survey su Opinion Mining è scaricabile da http://www.cs.cornell.edu/home/llee/omsa/omsa.pdf
  • Un articolo su web image retrieval (pdf) (*)
  • Leggetevi il numero speciale di Marzo 2009 di IEEE Computer: "Beyond Search". On-line è disponibile solo l'introduzione: (pdf) (*)
  • Un articolo su Elastic matching per Visual Image Retrieval (pdf)(*)
  • Un articolo su Audio Retrieval (pdf)(*)
  • Due articoli su Content-Based Image Retrieval (pdf1, pdf2)(*)
  • Un articolo sull'annotazione automatica di immagini (pdf)(*)
  • Un articolo sul k-d Tree (https://twiki.di.uniroma1.it/pub/Estrinfo/Materiale/kdtree.pdf)(*)


This topic: Estrinfo > WebHome > Materiale
Topic revision: r93 - 2011-04-19 - PaolaVelardi
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2024 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback