[Dizionario] Petrocchi, Melzi e diritti d'autore; nota su TEI XML DTD per dizionari
Giovanni Pensa
public a giovannipensa.com
Gio 15 Ago 2002 12:00:01 CEST
On Wed, 2002-08-14 at 18:45, Andrea Sivieri wrote:
> Quando si fosse sicuri che un dato dizionario
> abbia veramente i diritti scaduti e che valga la
> pensa di prenderlo come riferimento, secondo
> me si potrebbe tentare un approccio ad alto
> parallelismo per tirarlo fuori dalla carta.
>
> Dimmi poi se ti sembra realistico l'approccio che sto per descrivere...
È un'idea geniale! In effetti non ha senso per i romanzi, dove finisce
che poche persone fanno il lavoro, ma per un dizionario è perfetta.
Allora, algoritmiamo.
1. Trovare un dizionario che sia valido, privo di diritti sia per il
contenuto che per la grafica, questione delicata.
2. Scansire, scandire, scannerizzare e scannare le pagine. Trovare un
buon rapporto risoluzione, dimensione, leggibilità. Credo che anche in
bianco/nero una jpeg (brevetti a parte) è molto più piccola di una png,
se non si perde in riconoscibilità. Non so quanto ci voglia, mica
troppo, ma io in 6 mesi ho fatto solo 140 scansioni, tanto per dire.
3. Trovare un host che non si spaventi a mettere un po' di immagini, e
con un po' di CGI/PHP/... Credo che, in mancanza d'altro, sourceforge o
savannah potrebbero andare. Anche se chiedere prima agli italiani...
linux.it o softwarelibero.it o altri...
4. Mettere tutte le pagine online. Indicizzare le pagine almeno ad una
definizione (la prima). A questo punto si avrebbe già un dizionario
online, scomodo, senza copia-incolla, etc.
5. Quando l'utente cerca una definizione, mostrare l'immagine e una form
contenente il lavoro fatto finora, o vuota se nulla è stato fatto, e
usare un po' di "brand" per convincere i visitatori a collaborare.
("Hai 5 minuti? Abbiamo bisogno di te!", "Hai trovato quello che
cercavi? Ce lo digiti, per favore?" ...) Se facciamo un po' di
pubblicità magari funziona. Ovviamente se qualcuno vuole fare pagine e
pagine, è più che benvenuto. Io manterrei comunque un'interfaccia web,
con versioni (CVS) e più viste (l'immagine, l'HTML e i sorgenti XML, più
la form) per permettere sempre un confronto e facilitare le correzioni.
6. Lavorare ad un'applicazione XML, basandoci sul TEI e su altri formati
"per dizionari o enciclopedie". Trasformare i frammenti testuali (alla
wiki?) in frammenti XML. Avere un'opera. Inserirla in wikipedia, farne
dei PDF in automatico, integrarla con altre opere (si, mantenendo sempre
l'identità di ogni voce), mandare un'email a Stallman, integrarla con
dict.org, ...
7. ...
8. Profitto. (No questa era una citazione di South Park.)
Proprio non ho tempo, ma in autunno butterò giù qualche idea sul sito,
sul formato XML e sulle immagini. E manderò in giro qualche richiesta
su quali dizionari (anche più d'uno) lavorare.
Per la prima volta mi sembra un progetto quasi fattibile, in qualche
anno di medio lavoro.
g.
Maggiori informazioni sulla lista
Dizionario