[Dizionario] Favele/Perl e compagnia -- informazioni e richiesta di discussione
Giuseppe Bilotta
oblomov a freemail.it
Sab 19 Apr 2003 01:31:06 CEST
Salve gente,
Notizia principale: ho caricato Favele/Perl sul repository che è,
come sapete, accessibile dalla pagina principale su:
http://savannah.nongnu.org/projects/favele
È possibile sfogliare il repository CVS per il software, e
dovreste vedere due moduli: favele e favele-perl
Per scaricare l'ultima versione dovrebbe bastare cliccare sul link
(nascosto?) "this directory as a tarball" in fondo alla pagina.
Novità: ho aggiunto uno scriptino, favele-tk, ancora altamente
preliminare (parecchia roba è codificata manualmente ...); uso:
prendete un file di testo (italiano) che vi interessa analizzare,
mettelo nella directory dove c'è favele-tk chiamandolo
"readtest.txt" (spiacente, il nome per ora non è a scelta ... ci
arriveremo :>) e lanciate favele-tk; (requisito: il toolkit
Perl/Tk, ovviamente). Se posizionate il cursore su una parola,
dovrebbe comparirvi, nel pannello di destra, una lista dei
possibili significati (con parole ancora molto "in codice" ... ci
arriveremo anche lì!)
Cosa che potreste fare per aiutare: segnalate le parole semplici
che non riconosce; per parole semplici intendo parole che non sono
formate da più parole/particelle (vedere anche "cose da fare")
Cose da fare:
(1) manipolazione di parole composte
In italiano questo si riduce essenzialmente, per lo più, alla
trattazione corretta delle enclitiche ("dicendomi", "andandosene")
nei verbi; ma il discorso si potrebbe probabilmente fare più
generale.
Bisogna decidere due cose:
* come implementare la cosa a livello di *definizione* (tenendo
conto che probabilmente sarà necessario permettere una certa
ricorsività)
* come trattare tali parole livello di interfaccia (cosa fa Favele
quando viene fornita in input una parola che può essere
(de)composta?)
(2) definire il concetto di "parola"; direi che la cosa si
dovrebbe fare in termini di RegEx (espressioni regolari), e
supponendo una conversione automatica in minuscolo la definizione
di parola sarebbe:
[a-zàèìòùáéíóú]+'?
(ovvero una serie di caratteri alfabetici seguiti al più da un
apostrofo (elisione))
(3) rendere favele-tk più parametrico (in termini di nomi di file,
opzioni e roba del genere), e fargli riconoscere come "parola" ciò
che in italiano è effettivamente una parola (vedi sopra)
Fatemi sapere che ne pensate,
--
Giuseppe "Oblomov" Bilotta
Maggiori informazioni sulla lista
Dizionario