[Dizionario] Re: dizionario Digest, Vol 6, Issue 2

201068 201068 a libero.it
Gio 2 Set 2004 15:06:36 CEST


Salve a tutti, come dicevo a Paolo sto cercando di realizzare, da qualche mese nel mio poco tempo libero, un correttore ortografico, un analizzatore logico ed  un analizzatore grammaticale. 
Su quest'ultimo sto incontrando molte difficoltà per codificare le varie (troppe) regole, anche perchè non ho una visione d'insieme dell'argomento, sono un informatico non un linguista. 
Per questa ragione mi interessava capire qualcosa di più sugli esperimenti di deduzione grammaticale fatti da Paolo e possibilmente averne un esempio. Grazie in anticipo ;-)

Per il correttore ortografico, ho realizzato un database di parole, attingendo a tutto ciò che ho trovato online (wordlist e dizionari italiano/altre lingue  free). Ho integrato questultimo, usando le regole grammaticali che ho valorizzato finora , con le varianti, maschili/femminili, plurali, coniugazioni dei verbi, elisioni etc. Ci ho aggiunto nomi propri di persona, sigle,abbreviazioni etc. Poi ho provveduto a verificare questo dizionario con testi vari e pagine online (letteratura, news,blog etc) accantonando tutte quelle parole/varianti che non ho trovato, ordinando il database per frequeza delle parole. 
Ho ottenuto alla fine un elenco grossolano con più di un milione di record, che uso per il correttore ortografico. Riesco a segnalare degli errori ed  eventualmente a suggerire delle parole con fonetica simile. Rudimentale, ma da solo non potevo fare di meglio.

Usando wordnet (inglese purtroppo) ed alcuni dizionari free (italiano/inglese inglese/italiano) ho cercato di trovare delle corrispondenze e di valorizzare dei synset sul mio database (Con grossi problemi sugli omonimi e sui contesti) . In pratica ho un circa un milione di parole correlate a poco più di 50.000 gruppi di parole con significato grossomodo simile.
Ho anche cercato di classificare ogni parola (aggettivo/nome/nome proprio/verbo/pronomi etc. etc.) 
Il risultato è ancora troppo rudimentale. Mi avrebbe aiutato molto un wordnet italiano,ma non mi risulta che esista niente di consultabile gratuitamente.


Enrico









Maggiori informazioni sulla lista Dizionario