[Dizionario] Presentammi...

Giuseppe Bilotta oblomov a freemail.it
Lun 20 Ott 2003 23:57:24 CEST


lunedì 20 ottobre 2003 Dario Zanotti ha scritto:

> Beh, come prima mail mi sembra assai prolissa. Vorrei pero`
> concludere con una serie di domande: di che si occupa
> esattamente questa lista, cosa fa (o dovrebbe fare) "Favele"
> e verso quali orizzonti naviga.

Per "Favele" non sono forse la persona più giusta per
rispondere, giacché l'ideatore e creatore è Marco Gaiarin
(spero d'aver scritto il nome giusto :)).

Favel è nato (inizialmente) con una funzione essenzialmente di
"word prediction" (la motivazione e la discussione le puoi
trovare nella tesi di Gaiarin).

Tuttavia, a mia modesta opinione, il suo lavoro si può
utilizzare (con modifiche minime) per attuare una accurata
analisi del testo: data una parola, Favele (o qualcosa basato
su Favele) è in grado di fare un'analisi grammaticale completa
della parola, dando anche le varie possibilità se più d'una
(e.g.: letto = sostantivo maschile singolare, o participio
passato del verbo leggere). A dimostrazione di questo fatto, ho
sviluppato un pacchetto (favele-perl) con una grezzissima
interfaccia Tk che fa questo lavoro; puoi scaricare il tutto da
Savannah.

Ho intenzione, appena ho un po' di tempo libero, di

(1) ripetere il lavoro in Ruby (di cui sto scoprendo la potenza
e l'efficenza in questi giorni);

(2) aggiungere il supporto per le enclitiche;

(3) dare al tutto un'interfaccia più maneggevole;


Attualmente, Favele ha alcune limitazioni; a parte il già
citato mancato supporto per le enclitiche, vi è innanzi tutto
un problema di povertà lessicale; ma con un adeguato lavoro
collaborativo (aggiungere parole al lessico è quanto mai
semplice) questa deficienza può facilmente essere risolta
(possibilmente sfruttando il dizionario di OpenOffice.org).

Un secondo punto debole, che è conseguenza del punto di forza, è
un problema di velocità: l'implementazione in Perl mi "uccide"
il computer se si fa un'analisi di un testo completo. Una delle
mie speranze è che in Ruby le cose vadano meglio, vi farò
sapere se e quando.

Eppure, proprio grazie alla ricchezza dei risultati
dell'analisi, è possibile sfruttare codesti per trovare alcuni
errori (e.g. "un mano" è sicuramente errato, anche se poi è da
vedere se è "una mano" o "un nano"): ovviamente, perché questo
accada occorre uno strumento (e penso che quelli a cui stai
lavorando tu potrebbero essere un'ottima base) che: (a) prenda
i risultati analitici di Favele (b) costruisca una struttura
della frase (c) determini (e segnali) eventuali punti
"irrisolvibili", nonché le mancanze lessicali.


-- 
Giuseppe "Oblomov" Bilotta




Maggiori informazioni sulla lista Dizionario