[Dizionario] Dizionari, array e cioccolatini

Mar 7 Set 2004 01:19:00 CEST

> >Per curiosità parlando della guerra del 1915-1918 qual'è
> > l'ultima data del 1918 che nomina il tuo Melzi?
>
> Ho controllato alla voce guerra sella sezione enciclopediaca
> (pp.489-495), vengono riportati tutti gli avvenimenti parlando di
> guerra conclusa e quasi al termine dell'articolo appare: "Il
> trattato con la Germania divenne esecutivo dopo sanzionato da tre
> delle grandi potenze (sebbene mai sin qui (aprile 1920) ratificato
> dagli Stati uniti d'america) [...]

Ecco, adesso abbiamo datato il tuo dizionario con precisione assai alta!  :-)

> > Potremmo quindi fare le scansioni di tutte le pagine del
> > tuo o di tutte le pagine del mio e metterle nel sito, come
> > ho fatto per le prime tre pagine del Melzi 1916:
>
>  Poi trascriverle tutte...
>
> Oltre ad un problema di scanner, comunque ovviabile il danno
> maggiore della mia versione è che alcune paginee risultano tagliate
> dal "cane" (scusate l'espressione, ma sui libri sono molto
> facilmente irritabile) di rilegatore. Però l'idea è veramente
> buona, è anche più semplice da ridigitare avendo tutti e due le
> vidiate sullo stesso schemo.

Qui serve ancora qualche settimana, perchè non voglio
prendere uno scanner a caso, ma uno scanner adatto.
Di quelli che hanno il vetro che arriva fino al bordo,
in modo da prendere una facciata alla volta, senza
rovinare il volume (che viene aperto solo a 90 gradi).  :-)

> > In questo modo per una certa voce con il passare degli
> > anni potremo avere tutta una serie di definizioni con
> > l'indicazione che provengono da:
> > - Melzi 1916
> > - Melzi 1920
> > - Petrocchi 19XX
> > - Scritta da noi 2004
>
> anche questo mi sembra molto interessante. Potremmo anche fare la
> scansione di quello "in migliore stato" e in seguito degli altri in
> modo che il controllo possa essere fatto velocemente da tutti,
> ciascuno riguardando le proprie pagine digitate. E rimarrebbe solo
> qualche elemento no leggibile.

Si, certo c'è da fare qualche prova...  :-)

> > Per quanto riguarda le definizioni nuove, staremo attenti
> > a non plagiare nessuno. Per gli esempi pescheremo da fonti
> > nostre (Ad esempio possiamo pescare frasi di esempio con
> > termini moderni in corpus che includono vaste raccolte
> > di testi giornalistici contemporanei. Citazione di brevi
> > frasi scelte in questo modo di sicuro è lecita e così
> > non copieremo gli esempi degli altri dizionari moderni!)
>
> Si, è esattamente a questo uso che avevo immaginato potessero
> servirci programmi come Valentina o simili.
>
> Consci dei corpora giornalistici dai quali possiamo attingere?

C'è questo che è un corpus giornalistico significativo:
http://home.sslmit.unibo.it/~guy/aitla_repubblica.htm

Ma stavo pensando che per avere una sorgente variegata di frasi di esempio
a cui tutti tutti possano avere accesso, eventualmente potremo pescare...
dai motori di ricerca!

> > Quindi sono a favore di conservare il carattere enciclopedico,
> > ma per praticità organizzativa terrei le parti linguistica
> > ed enciclopedica separate (come viene fatto nei vecchi Melzi).
> > Completando prima la prima parte...
> >
> > Cosa ne dici?
>
> Si mi sembra molto logico. Anche perchè, correggimi se sbaglio, poi
> una volta immesse le due parti, potremmo facilmente creare dei
> collegamenti, in modo che da una voce della parte linguistica si
> passi direttamente a quella enciclopedica di più ampio respiro,
> vero?

Si, non ce limite ai modi in cui possiamo riorganizzare
il materiale, quando avremo la materia prima!  :-)

Ovvio che i lavori ingrati li faremmo fare al computer
con opportune procedure batch... (vedi glossarietti passati)

> L'unico esempio italiano di dizionario enciclopedico italiano in
> cui le due parti siano integrate, che conosco, è un vecchio Sansoni
> (degli anni '60 ca) che amo molto, ma è troppo recente per il
> nostro lavoro. Semmai gli daremo un'occhiatina in seguito (potrò
> vedere di fare qualche scansione eventualmente).

Non dobbiamo superare troppo in fretta lo stato 
dell'arte in fatto di dizionari enciclopedici...
altrimenti diranno che togliamo loro il lavoro!  ;-)

> > PROCEDURA 1
>
> Mi sono stampata tutte le procedure, ora le proverò, complimenti
> comunque per la chiarezza, sei molto didattico. E' una dote
> invidiabile.

Ti ringrazio!

> > Marika, scrivo qui in lista, perchè molte persone ci scoprono
> > dagli archivi di questa mailing-list e leggendo questi messaggi
> > possono imparare le stesse cose. [...]
>
> Hai ragione, è così che vi ho conoscuti io. Ma non ho avuto ancora
> il tempo (rimado a dopo il dottorato) di finire il database
> personale di tutti gli intervenenti con i relativi interventi, così
> credo che un po' tutti abbiate delle competenze informatiche molto
> avanzate e mi spiace se questo vuol dire appesantire la ML.

Figurati... il bello dei mezzi informatici moderni
è che se c'è una mail che non interessa, la si può 
sempre saltare senza che nessuno dica niente.  :-)

> > PS: per le differenze tra le diverse licenze espanderò
> > il glossarietto prossimamente... poi anche queste cose
> > le metteremo nel sito.  :-)
>
> Ok., anche se non ho capito ancora bene per quale procedimento
> "psico-attitudinale" sembra essere più facile seguire le
> spiegazioni e le comunicazioni tramite ML piuttosto che leggere le
> stesse cose direttamente da un sito. Forse perchè ci si immagina
> l'interlocutore e/o si instaura un dialogo sebbene virtuale che
> stimola l'attenzione reciproca (scusate deformazione, tra le mie
> specializzazioni una molto preponderante è l'analisi delle
> motivazioni dell'apprendimento).

Credo sia anche un po' la predisposizione femminile a relazionarsi
con le altre persone su numerosi piani. E' la fortuna di avere
l'emisfero sinistro ben connesso con il destro...  :o)

> Comunque, qualsiasi sia il motivo resta un dato di fatto che sto
> imparando più cose dalle tue spiegazioni che da anni di letture di
> articoli di linguistica computazionale. Mi appassiona veramente
> molto la "magia" che riuscite a creare :))

:-)

> >Per ora non abbiamo relazioni esplicite con il progetto
> > wiktionary.
>
> Visto che i riferimenti al progetto wiktionary sono sempre più
> frequenti, ho dato un'occhiatina e mi sono iscritta alla loro ML,
> per cercare di capire a cosa vi riferite, ma oltre alla mia poca
> simpatia che nutro verso l'uso dell'inglese= lingua universale, mi
> sembra veramente un progetto più ampio e un po' diverso rispetto al
> nostro.

Gli obiettivi sono in parte sovrapposti, 
l'approccio è piuttosto diverso...

Quando saremo pronti, faremo conoscere
il nostro progetto anche a loro.  :-)

> Cos'è una "una serie di array"

Puoi immaginare un array come una scatola di cioccolatini.

Hai un array unidimensionale se i cioccolatini sono su di
un'unica fila, bidimensionale se sono su diverse file, ecc.

Di fatto un array è un contenitore di oggetti più semplici.

Come fai ad individuare un preciso cioccolatino?

Dovrai indicare ad esempio  che desideri il terzo cioccolatino
della serie, o, nel caso di array bidimensionali, indicherai 
le "coordinate" come a battaglia navale.  :-)

In astratto abbiamo quindi una serie di elementi contenuti
nel contenitore array, a cui potremo accedere indicando
le opportune coordinate, che in gergo vengono dette indici
dell'array. Ad esempio il terzo cioccolatino e l'elemento
di indice 3.

Una serie di array sono... una serie di scatole di cioccolatini!  :o)

Ciao, Andrea