[Dizionario] Dizionario su palmare
Andrea Sivieri
andrea.sivieri a libero.it
Sab 6 Set 2003 14:32:49 CEST
Ciao Damon!
Quello che dici è giusto, ma a proposito di questo punto:
> 2. Scannerizzare
>
> Scannerizzare el dizionario, fare l'OCR, comparare le resultate
> con una lista di parole per controllare l'ortografia. (Fatto
> mezzo a mano, mezzo automaticamente.)
>
> http://www.yorku.ca/lbianchi/italian.html (accenti tagliati)
e` gia` stata fatta qualche prova e si e` osservato
che l'OCR sulle pagine ingiallite di un vecchio
dizionario funziona talmente male da non
essere praticabile. Anche il migliore OCR sbaglia
parole a raffica, perche` la qualita` di
stampa di allora non era eccelsa (caratteri
un po' sovrapposti, contorni non perfettamente
nitidi...)
L'idea alternativa era quella di fare le scansioni,
metterle su Internet e poi trascriverle a mano
in modo collaborativo, ad esempio con un Wiki,
come dici tu. Questa via sarebbe di sicuro piu`
rapida che non correggere i trilioni di errori
dell'OCR sull'arcaico testo.
Mi viene in mente un'altra cosa:
il vecchio dizionario che ho in casa e` un po'
delicato e facendo scansioni pagina per pagina
si distruggerebbe di certo. Pensavo quindi di
digitalizzare le pagine usando invece una
fotocamera digitale ad alta risoluzione.
Non ho ancora cominciato, a parte il tempo
che ci vuole, soprattutto perche` non ho ancora
una fotocamera adatta...
Ciao, Andrea
PS: la lista di Luigi Bianchi e` un lavoro molto utile.
http://www.yorku.ca/lbianchi/italian.html
Solo due considerazioni, al di la` dell'uso per il
quale tu la consigliavi:
1. per tutte le forme regolari è possibile generare
declinazioni e coniugazioni in automatico a patto
di avere alcune informazioni di base. Ci sarebbero
poi da aggiungere a mano solo le forme irregolari.
Rendendo quindi un po' piu` sofisticata l'impostazione
della lista, ci sarebbero quindi in seguito grandi
risparmi di tempo e lavoro da parte dei compilatori.
2. La licenza della lista e` GNU GPL, ma due righe
dopo viene vietato qualsiasi uso commerciale, mentre
la GNU GPL lo consente esplicitamente. Questa e`
una piccola contraddizione.
La GNU GPL afferma per questo aspetto che un lavoro coperto da
tale licenza deve poter essere venduto o ceduto a qualsiasi prezzo
(il prezzo puo' essere basso, o anche di milioni, oppure naturalemente
ci puo` essere cessione gratuita), a patto che venga indicato dove
poter trovare gratuitamente i sorgenti completi del lavoro stesso
e che non vengano imposte restrizioni aggiuntive alla
modifica/distribuzione del lavoro stesso.
Maggiori informazioni sulla lista
Dizionario