[Dizionario] Dizionario su palmare

Andrea Sivieri andrea.sivieri a libero.it
Sab 6 Set 2003 14:32:49 CEST


Ciao Damon!

Quello che dici è giusto, ma a proposito di questo punto:

> 2. Scannerizzare
>
> Scannerizzare el dizionario, fare l'OCR, comparare le resultate
> con una lista di parole per controllare l'ortografia.  (Fatto
> mezzo a mano, mezzo automaticamente.)
>
> http://www.yorku.ca/lbianchi/italian.html (accenti tagliati)

e` gia` stata fatta qualche prova e si e` osservato
che l'OCR sulle pagine ingiallite di un vecchio 
dizionario funziona talmente male da non 
essere praticabile. Anche il migliore OCR sbaglia
parole a raffica,  perche` la qualita` di 
stampa di allora non era eccelsa (caratteri
un po' sovrapposti, contorni non perfettamente
nitidi...)

L'idea alternativa era quella di fare le scansioni,
metterle su Internet e poi trascriverle a mano 
in modo collaborativo, ad esempio con un Wiki,
come dici tu. Questa via sarebbe di sicuro piu` 
rapida che non correggere i trilioni di errori 
dell'OCR sull'arcaico testo.

Mi viene in mente un'altra cosa:
il vecchio dizionario che ho in casa e` un po'
delicato e facendo scansioni pagina per pagina
si distruggerebbe di certo. Pensavo quindi di
digitalizzare le pagine usando invece una
fotocamera digitale ad alta risoluzione.
Non ho ancora cominciato, a parte il tempo
che ci vuole, soprattutto perche` non ho ancora 
una fotocamera adatta...

Ciao, Andrea

PS: la lista di Luigi Bianchi e` un lavoro molto utile.

http://www.yorku.ca/lbianchi/italian.html

Solo due considerazioni, al di la` dell'uso per il
quale tu la consigliavi:

1. per tutte le forme regolari è possibile generare
declinazioni e coniugazioni in automatico a patto
di avere alcune informazioni di base. Ci sarebbero
poi da aggiungere a mano solo le forme irregolari.
Rendendo quindi un po' piu` sofisticata l'impostazione
della lista, ci sarebbero quindi in seguito grandi 
risparmi di tempo e lavoro da parte dei compilatori.

2. La licenza della lista e` GNU GPL, ma due righe
dopo viene vietato qualsiasi uso commerciale, mentre
la GNU GPL lo consente esplicitamente. Questa e`
una piccola contraddizione. 

La GNU GPL afferma per questo aspetto che un lavoro coperto da 
tale licenza deve poter essere venduto o ceduto a qualsiasi prezzo
(il prezzo puo' essere basso, o anche di milioni, oppure naturalemente
ci puo` essere cessione gratuita), a patto che venga indicato dove
poter trovare gratuitamente i sorgenti completi del lavoro stesso
e che non vengano imposte restrizioni aggiuntive alla 
modifica/distribuzione del lavoro stesso.






Maggiori informazioni sulla lista Dizionario