[Dizionario] Re: Aggiornamenti sul dizionario italiano per Ispell

Massimo D'Antoni dantoni a unisi.it
Gio 11 Apr 2002 23:52:43 CEST


Mi inserisco nella discussione sul dizionario per ispell, anche in
qualita' di autore del file di affissi 
  http://www.firenze.linux.it/~piccardi/nuovo.aff.gz
di cui si è parlato negli scorsi messaggi.

Preciso che la mia idea di partenza era proprio quella di creare un
dizionario per ispell. 
Sono partito da un file di affissi esistente (se non ricordo male
proprio quello del dizionario italiano debian), mi sono accorto che
questo file non sfruttava appieno la possibilità di creare parole
modificando le desinenze, e ho finito per moficarlo in profondita',
grammatica alla mano.
Credo che il risultato non sia male, ma potrebbe essere ulteriormente
completato: in particolare, quando mi sono fermato stavo escogitando
un modo per trattare i verbi irregolari.
Invece sono convinto che non sia opportuno trattare le elisioni
(es. "un'amica") come se fossero prefissi.
Ulteriore considerazione: la gestione degli affissi di ispell non è
molto flessibile (sara' anche per questo che aspell al momento non
prevede la gestione degli affissi?), e in fondo quello che ci
interessa e' economizzare sull'inserimento delle parole creando in
automatico le varie voci "derivate". 
Dunque potrebbe avere dei vantaggi, e non credo che sia complicato,
svincolarci completamente da ispell e creare un generatore di voci a
partire dal file di affissi utilizzando qualche linguaggio che usi le
regular expressions, tipo perl.

Sul dizionario: avevo notato che alcuni di quelli esistenti (specie
quelli molto estesi) erano pieni di errori (gli accenti spesso
sbagliati...) e accettavano termini e forme che io non vorrei mai
vedere in un mio scritto. Dunque sono ripartito da un limitato elenco
di parole di uso corrente. L'idea era quella di affiancare a questo
elenco dizionari specialistici, magari pensando alla creazione di
dizionari "custom" secondo le diverse esigenze (la stessa idea di
Antonio Gulino), e sfruttando al meglio le diverse competenze di chi
contribuisce alla compilazione.

Condivido (anche perche' avevo sostenuto una tesi analoga) la
preoccupazione di concentrarci inizialmente su un obiettivo limitato,
come quello di creare un elenco di parole per correttore ortografico.
Credo pero' che la cosa migliore sia partire da zero, e non modificare
un dizionario esistente, magari già di grandi dimensioni.

Infatti, per il funzionamento stesso di un correttore ortografico, e'
piu' facile correggere in corso d'opera errori come l'assenza nel
dizionario di una parola giusta piuttosto che la presenza di una parola
sbagliata.

Inoltre, teniamo presente che il lavoro piu' grosso e' quello di
assegnare gli affissi alle parole.

Saluti,

   Massimo

   
MESSAGGIO PER SIMONE, che gestisce la mailing list: va be' che tu hai
la tastiera americana e non hai settato il LOCALE, ma quando ti decidi
a far sì che il digest di questa lista riproduca le lettere accentate?



   



Maggiori informazioni sulla lista Dizionario