[Dizionario] Presentammi...
Dario Zanotti
dario.zanotti a siemens.com
Lun 20 Ott 2003 17:35:03 CEST
Ciao a tutti.
Sono Dario Zanotti, l'autore di Tommaso e dei suoi fratellini della
famiglia Di Lemma, di cui avete avuto eco da Ruggero.
Non ho il tempo di inoltrarmi troppo nello storico delle vostre mail, arrivo
quindi al punto per conto mio: se sono off-topic, ditemelo senza problemi.
La fam. Di Lemma nasce per un compito preciso: rilevare refusi nei
testi facilitando il lavoro di chi li deve correggere. Non un correttore
ortografico in linea, quindi, ma un semi-batch che trita testi finiti, e li
sputa sotto forma di analisi.
Fondamentale e` quindi l'interfaccia grafica in grado di facilitare e velocizzare
la gestione dei sospetti errori.
Il programma funziona analizzando il testo in maniere differenti:
1) analisi della parola -e qui viene utilizzato, per ora, un dizionario OpenOffice
modificato-
2) analisi della riga: per la punteggiatura e i nessi fra lemmi.
Le tecnologie di base sono quelle delle regular expression.
Tecnicamente ho seguito la seguente strada: trovare il piu` velocemente possibile se
un lemma e` valido; se non lo e` cercare di catalogare il tipo di errore attraverso una serie di
tipologie. Questo torna utile in fase di analisi da parte degli utenti.
Poi la riga (informatica, i letterati direbbero il paragrafo) nel suo complesso viene analizzata per
la punteggiatura e per i nessi fra lemmi, con una particolare attenzione ai
refusi tipici dei lettori OCR. Ultimamente ho aggiunto alcune analisi
sul genere dei lemmi (maschile/femminile), vedro` dove portera`, e cosa verra`
trovato.
Avrei voluto compiere il salto verso il meta-linguaggio (vedasi mail girate dal Ruggero),
ma il tempo e gli omografi frenano il mio entusiasmo. Ho 750 testi da passare al setaccio
e la faccenda e` pesa.
Intanto ho riprogettato l'interfaccia grafica, e sto migliorando Narciso,
che diventera` il gestore dei dizionari dei lemmi.
Beh, come prima mail mi sembra assai prolissa. Vorrei pero` concludere con
una serie di domande: di che si occupa esattamente questa lista, cosa fa (o dovrebbe
fare) "Favele" e verso quali orizzonti naviga.
Ciao ancora e grazie
dell'attenzione.
Dario
-------------- parte successiva --------------
Un allegato non testuale è stato rimosso....
Nome: dario.zanotti.vcf
Tipo: text/x-vcard
Dimensione: 309 bytes
Descrizione: Card for Dario Zanotti
URL: <http://lists.softwarelibero.it/pipermail/dizionario/attachments/20031020/99928ef7/attachment.vcf>
Maggiori informazioni sulla lista
Dizionario