[Dizionario] Presentammi...
Giuseppe Bilotta
oblomov a freemail.it
Lun 20 Ott 2003 23:57:24 CEST
lunedì 20 ottobre 2003 Dario Zanotti ha scritto:
> Beh, come prima mail mi sembra assai prolissa. Vorrei pero`
> concludere con una serie di domande: di che si occupa
> esattamente questa lista, cosa fa (o dovrebbe fare) "Favele"
> e verso quali orizzonti naviga.
Per "Favele" non sono forse la persona più giusta per
rispondere, giacché l'ideatore e creatore è Marco Gaiarin
(spero d'aver scritto il nome giusto :)).
Favel è nato (inizialmente) con una funzione essenzialmente di
"word prediction" (la motivazione e la discussione le puoi
trovare nella tesi di Gaiarin).
Tuttavia, a mia modesta opinione, il suo lavoro si può
utilizzare (con modifiche minime) per attuare una accurata
analisi del testo: data una parola, Favele (o qualcosa basato
su Favele) è in grado di fare un'analisi grammaticale completa
della parola, dando anche le varie possibilità se più d'una
(e.g.: letto = sostantivo maschile singolare, o participio
passato del verbo leggere). A dimostrazione di questo fatto, ho
sviluppato un pacchetto (favele-perl) con una grezzissima
interfaccia Tk che fa questo lavoro; puoi scaricare il tutto da
Savannah.
Ho intenzione, appena ho un po' di tempo libero, di
(1) ripetere il lavoro in Ruby (di cui sto scoprendo la potenza
e l'efficenza in questi giorni);
(2) aggiungere il supporto per le enclitiche;
(3) dare al tutto un'interfaccia più maneggevole;
Attualmente, Favele ha alcune limitazioni; a parte il già
citato mancato supporto per le enclitiche, vi è innanzi tutto
un problema di povertà lessicale; ma con un adeguato lavoro
collaborativo (aggiungere parole al lessico è quanto mai
semplice) questa deficienza può facilmente essere risolta
(possibilmente sfruttando il dizionario di OpenOffice.org).
Un secondo punto debole, che è conseguenza del punto di forza, è
un problema di velocità: l'implementazione in Perl mi "uccide"
il computer se si fa un'analisi di un testo completo. Una delle
mie speranze è che in Ruby le cose vadano meglio, vi farò
sapere se e quando.
Eppure, proprio grazie alla ricchezza dei risultati
dell'analisi, è possibile sfruttare codesti per trovare alcuni
errori (e.g. "un mano" è sicuramente errato, anche se poi è da
vedere se è "una mano" o "un nano"): ovviamente, perché questo
accada occorre uno strumento (e penso che quelli a cui stai
lavorando tu potrebbero essere un'ottima base) che: (a) prenda
i risultati analitici di Favele (b) costruisca una struttura
della frase (c) determini (e segnali) eventuali punti
"irrisolvibili", nonché le mancanze lessicali.
--
Giuseppe "Oblomov" Bilotta
Maggiori informazioni sulla lista
Dizionario