[Dizionario] Proviamo a ripartire.
Simone Piccardi
piccardi a firenze.linux.it
Dom 17 Feb 2002 19:57:57 CET
Anzitutto le mie scusa per la assoluta latitanza negli ultimi due mesi,
questioni personali e di lavoro mi hanno preso il poco tempo libero
disponibile.
Qualcosa pero` sono riuscito a combinare (grazie soprattutto al lavoro
fatto in precedenza da Massimo D'Antoni che aveva trascritto a mano una
lista delle principali parole della lingua italiana).
Trovate questa lista (ripulita dagli affissi e da doppioni e parole
derivate) su:
http://www.firenze.linux.it/~piccardi/lemmi.txt.gz
una versione della stessa lista, con gli affissi per ispell (fino alla
B, il resto e` da fare) sta su:
http://www.firenze.linux.it/~piccardi/vocabolario.txt.gz
ed il relativo file di affissi sta su:
http://www.firenze.linux.it/~piccardi/nuovo.aff.gz
Questi ultimi due pero` li ho messi piu` che altro come riferimento, la
cosa interessante sara` quelli di poterli produrre automaticamente una
volta che si avra` disponibile la classificazione delle parole.
La prima lista potrebbe essere un buon punto di partenza per la
classificazione (sono 7260 parole).
Sto provando a mettere giu` anche alcune idee su come fare la
classificazione, una prima classificazione potrebbe essere quella fra
aggettivi, sostantivi e verbi, maschile e femminile, ecc. Appena avro`
qualcosa di piu` strutturato (spero non fra altri 2 mesi) mi rifaro`
vivo.
Mi han suggerito che per la stesura della classificazione sarebbe molto
utile usare XML, io pero` sono completamente ignorante al riguardo (ed i
pochi contatti avuti con il suo zio/cugino sgml mi han fatto fuggire a
gambe levate), c'e` qualcuno che conosce meglio la materia?
Ciao
Simone
Maggiori informazioni sulla lista
Dizionario