[Dizionario] Re: dizionario Digest, Vol 6, Issue 2
201068
201068 a libero.it
Gio 2 Set 2004 15:06:36 CEST
Salve a tutti, come dicevo a Paolo sto cercando di realizzare, da qualche mese nel mio poco tempo libero, un correttore ortografico, un analizzatore logico ed un analizzatore grammaticale.
Su quest'ultimo sto incontrando molte difficoltà per codificare le varie (troppe) regole, anche perchè non ho una visione d'insieme dell'argomento, sono un informatico non un linguista.
Per questa ragione mi interessava capire qualcosa di più sugli esperimenti di deduzione grammaticale fatti da Paolo e possibilmente averne un esempio. Grazie in anticipo ;-)
Per il correttore ortografico, ho realizzato un database di parole, attingendo a tutto ciò che ho trovato online (wordlist e dizionari italiano/altre lingue free). Ho integrato questultimo, usando le regole grammaticali che ho valorizzato finora , con le varianti, maschili/femminili, plurali, coniugazioni dei verbi, elisioni etc. Ci ho aggiunto nomi propri di persona, sigle,abbreviazioni etc. Poi ho provveduto a verificare questo dizionario con testi vari e pagine online (letteratura, news,blog etc) accantonando tutte quelle parole/varianti che non ho trovato, ordinando il database per frequeza delle parole.
Ho ottenuto alla fine un elenco grossolano con più di un milione di record, che uso per il correttore ortografico. Riesco a segnalare degli errori ed eventualmente a suggerire delle parole con fonetica simile. Rudimentale, ma da solo non potevo fare di meglio.
Usando wordnet (inglese purtroppo) ed alcuni dizionari free (italiano/inglese inglese/italiano) ho cercato di trovare delle corrispondenze e di valorizzare dei synset sul mio database (Con grossi problemi sugli omonimi e sui contesti) . In pratica ho un circa un milione di parole correlate a poco più di 50.000 gruppi di parole con significato grossomodo simile.
Ho anche cercato di classificare ogni parola (aggettivo/nome/nome proprio/verbo/pronomi etc. etc.)
Il risultato è ancora troppo rudimentale. Mi avrebbe aiutato molto un wordnet italiano,ma non mi risulta che esista niente di consultabile gratuitamente.
Enrico
Maggiori informazioni sulla lista
Dizionario