[Discussioni] Dizionario Italiano e GPL/LGPL [was Chiusura sito www.warez.at]
Gianluca Turconi
luctur a comeg.it
Mar 6 Nov 2001 11:20:53 CET
Salve,
> Io invece non ho capito in cosa consiste il progetto. Ho visto tanti
> file di affissi e tanti elenchi di parole raccolti da diverse persone,
> ma tutti abbandonati da qualche anno. Non e` che mettendoli insieme
> gia` si ottiene qualcosa di buono?
[cut]
L'idea di partenza era proprio quella. Però se si dà un'occhiata alla
correttezza delle wordlist c'è da mettersi le mani nei capelli. Esempio:
mai provato a scrivere cerceremo, cercerete etc e correggerlo con
l'Ispell montato su Mandrake 8.0, RH 7.1 e altre distro ancora? Non so
come siano state ottenute quelle liste, ma è probabile che siano state
create in automatico usando degli affix che non comprendevano i verbi
irregolari, riflessivi, etc. Quindi bisognerebbe unire il tutto e
controllarlo parola per parola. Un lavoro che una sola persona non può
fare in un tempo ragionevole. Una volta raggiunta una lista che possiamo
considerare soddisfacente, si deve poi passare alla compressione
attraverso gli affix. Avere un dizionario in formato testo da 10 Mb
potrebbe andare bene su un Athlon 1.2 GHz, ma su un pentium 133... Le
regole presenti nell'Ispell di Debian di cui mi servo come base sono la
somma fatta da Loris Palmerini di versioni precedenti, ma anche il suo
lavoro presenta delle lacune che però ho parzialmente già corretto.
Mi ripeto ancora una volta, il mio interesse principale è ottenere un
correttore ortografico funzionante per OpenOffice.org sotto LGPL per
convenienza, sotto GPL per convinzione personale.
Serve:
a) una lista di parole sufficientemente completa che poi possa essere
compressa (anche se munch per OOo è veramente scarso)
b) un file affix in formato MySpell
Se qualcuno è disposto a darmi una mano, sotto GPL ho già pronto il file
affix e una lista di parole con le relative flag derivate da iitalian
Debian (e non witalian di Davide Salvetti) che però deve essere corretta
manualmente (lavoro gramo). Tutto questo può essere convertito in
formato Ispell con un paio di giorni di lavoro.
Se si volesse optare per LPGL si dovrebbe partire da zero per non avere
rogne con i copyrighter attuali, perché dal discorso che mi ha fatto
Palmerini (l'unico che sono riuscito a contattare), mi farebbe problemi
persino sulle regole grammaticali che ha usato nel suo file affix.
Lo spazio web servirebbe per avere una casa comune dove gli utenti, se
lo desiderano, possono contribuire con le proprie aggiunte nelle
wordlist (o crearne di specialistiche: giuridica, medica, informatica,
etc,etc) o negli affix per la compressione. Così si avrebbe una centrale
unica per un correttore ortografico italiano. Si eviterebbe la
parcellizazzione degli sforzi che c'è stata fino ad ora. Su questo punto
posso anche fare da solo, anche se rischierei di finire su geocities o
xoom :(
Per quel che riguarda le liste derivate da dizionari proprietari,
penserei personalmente a contattare le aziende o i privati interessati e
avendo un ruolo istituzionale all'interno del Marketing Project di OOo,
potrebbe anche risultare più semplice. Però mi servirebbero dei recapiti
certi.
Saluti,
Gianluca
More information about the discussioni
mailing list