[Dizionario] Favele
Giuseppe Bilotta
oblomov a freemail.it
Ven 27 Set 2002 22:43:34 CEST
venerdì 27 settembre 2002 Marco Gaiarin ha scritto:
MG> Quindi mi fa sommo piacere pensare che possa essere utile a qualcuno, e
MG> pensare che il suo sviluppo possa riprendere.
MG> Ma forse è il caso che spieghi per bene cosa voleva essere favele.
[snip]
MG> Qunidi passo a spiegare i file. Esiste un file di definizione della
MG> lingua (.lang) che contiene riferimenti ad alcuni parametri della
MG> lingua e del dizionario in uso, e una definizione spero non troppo
MG> cervellotica delel tipologie gramamticali (articolo, ...) con alcune
MG> loro caratteristiche.
MG> Sono bit field perchè poi quando calcolo i risultati con favele posso
MG> confrontare nua parla candidata con una possibile con un semplice or.
MG> Segue la definizione dei flag aggiuntivi presenti eventualmente in
MG> queste categorie (determinativo, ...) con maschere per definire limiti
MG> (l'articolo non può essere infinito ;) e poi una definizione di regole
MG> di espansione.
MG> Attenzione che a me interessano solo e soltanto i suffissi, quindi nno
MG> mi sono assolutamente radicalmente strafregato degli affissi in
MG> generale, quindi dei prefissi. A me interessa indovinare una parola da
MG> 2-3 carateri inseriti, do per scontato di avere il prefisso...
MG> [poi non è vero, se potessi condensare i prefissi potrei assegnare
MG> meglio i pesi...]
MG> Alal fine le righe autotag permettono di (tentare di) assegnare
MG> categoria e flag a una parola nuoova.
MG> I file .lex contengono il dizionario. In testa hanno delle statistiche
MG> generali assolutamente inutili se avessi avuto volgia di scrivere una
MG> funzioncina che si faceva i conti in fase di lettura da disco del file.
MG> ;)
MG> Poi c'è un elenco di forme verbali, con relativi tipi/flag/indicazioni
MG> di regolarità.
MG> Il formato è semplicissimo, e con un po' di perl credo s possa trarne
MG> qualsiasi cosa. Tutta la parte iniziale è fatta a manina, mentre
MG> l'elenco dei verbi regolari (e nomi regolari) è stata presa da non
MG> ricordo manco dove, ma ricontrollata a manina.
MG> [ma sono un perito, abbiate misericordia]
[snip]
MG> Non ho osato riprendere in mano il codice, snoo passati due anni e
MG> sicuramente non ricordo assolutamente nulla... ;)))
MG> Ad ogni modo spero di aver almeno chiarito a che cosa serve favele, per
MG> me può essere esteso e migliorato, questo è indubio, ma nase e resta un
MG> sistema per prevedere la parola in scrittura in quel dato istante,
MG> quindi con un uso limitato e sicuramente non compatibile con una
MG> correzione ortografica, che invece deve cercare parole similia quelle
MG> digitate come ad esempio tuti i miei errori di ortografia in questa
MG> email.
Invece secondo me proprio la combinazione di file .lang+.lex
permette di fare un generico strumento di "analisi del testo" che,
presa una parola, ne determini categoria, numero, genere, etc,
elencando tutte le possibilità. Il file .lang per l'italiano mi
sembra eccellente; se c'è qualcosa da rimpinguare, questo è il
file .lex, e qui mi vengono in mente due cose:
(1) la funzione di aggiunta automatica delle parole può aiutare a
riempire "grezzamente" il .lex, facendo una passata su testi
corretti.
(2) "fissato" poi il .lex, favele può essere usato come:
(a) correttore ortografico
(b) base del motore del vocabolario e del dizionario dei
sinonimi/contrari
(c) correttore grammaticale (*questo* richiederà *molto* lavoro,
mi sa :))
(d) strumento di predizione del testo più completo del "banale"
AutoText di OpenOffice.org
MG> Detto questo... non ho nessun problema a rilassare la licenza a LGPL,
MG> e sarei onorato di vedere questa cosa finire in qualcosa di serio come
MG> openoffice.
Eccellente ... (alla Mr. Burns ;))
MG> Chiedo solo una piccola cosa: mi piacerebbe restasse una libreria a se,
MG> qindi mi chiedo se valga la pena aprire un progetto su savannah.gnu.org
MG> o cose simili, e chi possa esere interessato a lavorarci sopra.
Non mi pare ci fossero dubbi sul mantenimento della forma
libreria. Anche se ad essere onesto io non sono riuscito a creare
una .dll (o equivalentemente un .so) dalla compilazione ... come
devo fare?
--
Giuseppe "Oblomov" Bilotta
Maggiori informazioni sulla lista
Dizionario