Progetto Apprendimento Automatico A.A. 2007/2008
Docente: Roberto Navigli
I progetti sono stati presentati martedì 4 dicembre:
- Riconoscimento di volti (Face recognition)
- Analisi di mercato
- Natural Language Processing: risoluzione dell'ambiguità delle parole (Word Sense Disambiguation)
- Giochi classici (tris, dama, mastermind)
- Videogiochi (pac-man)
- Controllo del traffico
Informazioni più dettagliate sono riportate nella
presentazione dei progetti.
Svolgimento del progetto
Il progetto deve essere
svolto individualmente. Nel caso in cui venga svolto da un gruppo di due studenti (comunque non più di due), è necessario
concordare espressamente con il docente il contenuto del progetto in modo che sia chiaro l'apporto individuale. Nel caso in cui lo studente voglia svolgere un progetto diverso da quelli proposti, è necessario il consenso esplicito del docente.
Codice etico: gli studenti, nel consegnare il proprio progetto, si assumono implicitamente la responsabilità che questo non sia stato copiato, neanche parzialmente, da altri studenti o da altre fonti.
Consegna del progetto
Lo studente deve
consegnare una relazione in formato cartaceo contenente:
- una breve descrizione del problema
- una descrizione delle scelte effettuate per progettare il/i classificatore/i (rappresentazione del problema, eventuali parametri o strutture del classificatore, ecc.)
- una valutazione adeguata del classificatore (consiglio di valutare rispetto ai diversi metodi di addestramento, rispetto alle due baseline classiche (baseline casuale e baseline della classe più frequente) e, laddove possibile, rispetto a dimensioni differenti dell'insieme di dati)
Inoltre deve
inviare via email la
relazione in formato elettronico (doc o pdf) e tutto il software necessario ad apprendere il classificatore (insiemi di addestramento e/o di test, codice scritto dallo studente, ecc.).
I criteri di valutazione sono riportati per ciascun progetto nella presentazione sopra citata. I 6 progetti hanno
validità fino a tutto settembre 2008 (dopodiché, gli studenti sono pregati di riferirsi al progetto dell'A.A. 2008/2009).
Informazioni e dataset utili per i progetti
Riconoscimento dei volti (Face Recognition)
- Su Wikipedia
- La pagina del progetto
di riconoscimento dei volti del corso di Apprendimento Automatico di Tom Mitchell, contenente l'insieme di dati e le foto dei volti da analizzare.
Analisi di mercato
- L'insieme di dati
di utenti della Rete da analizzare secondo criteri a vostra scelta.
Risoluzione dell'ambiguità delle parole (Word Sense Disambiguation)
- Su Wikipedia
- WordNet
, il dizionario in formato elettronico rispetto al quale sono specificati i sensi delle parole nell'insieme di dati. La versione 2.0, utilizzata nell'insieme di dati fornito al punto seguente, è disponibile qui
.
- Insiemi di dati per risolvere l'ambiguità di 29 nomi della lingua inglese (i sensi sono specificati rispetto a WordNet 2.0).
- Stopwords: parole da escludere perché non informative
Giochi e videogiochi
E' necessario modellare il concetto di avversario. Nel caso in cui si faccia uso di apprendimento per rinforzo, vi consiglio di leggere questi articoli:
Controllo del traffico
- Un esempio
di controllo del traffico mediante programmazione genetica.
--
RobertoNavigli - 10 Dec 2007