[Dizionario] Ragionamenti su procedura trascrizione dizionario

Andrea Sivieri andrea.sivieri a sempreverdi.net
Ven 3 Set 2004 00:10:40 CEST


>PS:   [...] al di là della informatizzazione del Melzi
>dovremmo stabilire cosa noi vogliamo che ci sia nel dizionario oltre
>all'entrata e alla definizione, e particolare non trascurabile è il pubblico
>(più è generico più bisogna curare i particolari, per riuscire ad introdurre
>il maggior numero di informazioni necessarie senza appesantirlo con olte
>ridondanze). [...]

Aggiornaci mano mano che ti vengono idee su come dare una buona
impostazione e omogeneità alle nuove voci che aggiungeremo.
Credo che in ogni caso si cercherà di rimanere molto sobri...
visto che non si tratta di un enciclopedia. Per evitare ridondanze
in caso di sinonimi direi che si scriverà la definizione per
il termine di uso più frequente, e gli altri rimanderanno ad esso.

Più avanti con una passata successiva questa cosa magari la si 
potrà gestire con i famosi ponti verso WordNet e in certi
casi probabilemente ci troveremo ad aggiungere termini... 
a WordNet! In modo che ci dia copertura completa.

E' bello che WordNet tiene anche i legami di un termine
con termini più specifici e termini più generici.
Ad esempio: animale <- mammifero <- felino <- gatto
Questa cosa si otterrebbe gratis anche per l'italiano
facendo ponti sistematici verso i synset di WordNet!  :_)

> E' vero che il problema è il "copyright" delle definizioni, ma è anche vero
> che con l'utilizzo dei corpora e quindi con la combinazione dei lemmi in
> contesti diversi diventa più semplice comprendere il significato specifico
> della parola e quindi anche darne una definizione.

Questo lo faremo di sicuro appena si riuscirà a rodare
e mettere in pista i vari strumenti di ausilio linguistico
che sono in preparazione!

> Dato il carattere esplicativo e semplice che dovrebbero avere le
> definizioni, per me non è difficile crearle, ma piuttosto,  controllare e/o
> avere la certezza che non siano già state utilizzate da altri dizionari.

Se per dire una cosa c'è un solo modo semplice, allora se per 
sbaglio avremo talune definizioni semplici uguali a quelle che
si trovano su dizionari commerciali, non credo che questo sarà
un problema. Se c'è un solo modo per dire una cosa,
allora la sua espressione non ha il carattere di origninalità
che le permetta di essere protetta. Però per sicurezza
quando ci accorgeremo di aver usato per sbaglio la
stessa definizione di dizionari commerciali, direi che 
cercheremo un po' di parafrasarla, magari fondendo
in modo originale spunti presi da 3 dizionari diversi...
in questo modo direi che si perderà sempre qualsiasi
collegamento di grossa similitudine con le definizioni
di un qualche dizionario commerciale. Poi usare una
certa serie di parole in modo diverso non è un crimine
visto che le parole sono in numero limitato... come
le note musicali. Per essere accusati di plagio credo che
la similitudine debba essere marcata e la frase avere
più di tre parole.

> A me piace molto, specie la parte "dei palloni
> aereostatici colorati" :-))))))))))

:-)

>Quando cominciamo dal punto 1? 
>e come?

Il punto 1 comincia in questi giorni con la sperimentazione
di una procedure realistica. Conviene che facciamo un po'
di test in piccolo inizialmente.  :-)

Elenco di possibili semplici indicazioni riguardanti procedura 
suggerita che mi vengono in mente per ora.

A) Scrivere il proprio nome utente in cima alla pagina
che si sta trascrivendo e scrivere anche una data
per la quale si pensa di aver finito la trascrizione
(dopo una settimana ad esempio, ma di media 
basterebbero due-tre ore). Questa data non sia
più lontana di due settimane dal momento di inzio, 
altrimenti avremmo pagine bloccate per  mesi...
perchè si cercherà di non toccare le pagine
"prenotate".

Se poi quella data viene raggiunta nessun problema,
perchè qualcun altro potrà prendere la stessa pagina
o si potrà specificare una nuova data (con la sicurezza
che la persona non si è dimenticata della sua pagina :-)

B) Chi conclude la trascrizione di una pagina potrebbe
essere considerato la persona da associare alla pagina
per un eventuale premio dopo estrazione.

C) Per lo stile da seguire, basta cliccare modifica su
questa pagina e vedere come ho fatto:
http://laboratorio.sempreverdi.net/wiki/M14-A0001

D) Suggerisco di andare a capo quando il Melzi va a capo,
ma nel caso di parole spezzate togliere il trattino e portarle
per intero sulla riga superiore.

E) Perchè la pagina sia considerata completa vanno messi
anche gli accenti acuti o gravi. Visto che non sono nella
tastiera, si può ad esempio fare il copia incolla dalla
tabellina di simboli nella colonna sinistra del sito.
E' una cosa che probabilmente viene più veloce
se fatta alla fine (così si fanno in serie tutte le "a acute"
e poi tutte le "e acute" e poi...)

> Quanti sono quelli che hanno la
>famosa edizione del 1914? 

Non serve averne tante perchè mano a mano che si completeranno
le pagine pubblicherò altre scansioni: non sono tantissime (poco più di 800)
e poi ho intenzione di acquistare uno scanner velocissimo... 

In ogni caso pensavo di prendere l'edizione 1917 identica alla 1914
(le matrici paiono le stesse, ma chi lo sa, forse ci sono piccole correzioni).

> Io controllerò nuovamente, ma credo che la mia non
>ha data, il che non è di buon auspicio. 

Guarda se anche la tua è una probabile 1917!

> Infatti come tutti sapete le case
>editrici da tempi immemori amano molto ripubblicare i dizionari giocando
>sull'equivoco ristampa/nuova edizione e per mettersi al sicuro applicano
>sempre qualche modifica, (definizioni, esempi, foto ecc.). Questo non
>dovrebbe essere un grosso problema per il contenuto per il nostro
>dizionario, ma lo potrebbe essere per le licenze se inseriamo qualcosa che
>non era nell'edizione del 1914, ma in quele successive, (anche se a nostra
>insaputa), ci dovrebbe essere la possibilità di ricontrollare tutto il
>dizionario nel suo insieme a informatizzazione effettuata (e' un
>lavoraccio!!!!!!!!!!!!).

L'edizione 1914 e 1917 hanno gli stessi curatori, per cui dovrebbero
essere perfettamente di pubblico dominio tutte e due!  :-)
Anche se la seconda non ha una data, ma il migliao è ben indicato!

Ciao, Andrea




Maggiori informazioni sulla lista Dizionario