[Dizionario] Re: dizionario Digest, Vol 4, Issue 6

Ven 16 Lug 2004 22:58:23 CEST

Alle 16:11, venerdì 16 luglio 2004, Giovanni Pensa ha scritto:
> On Fri, 2004-07-16 at 15:14, ML wrote:
> > Perchè non cominciamo a creare un database sull'équipe che
> > intende partecipare?
>
> Io mi candido a collaborare su due fronti:
>
> 1. la definizione dello schema XML;
>
> 2. le impostazioni tipografiche.

Ciao Giovanni,

che piacere sentirti!  :-)

> Sul primo punto so che saranno grandi dibattiti.  Io non sono un
> linguista, piu' un tecnico, pero' ho sempre amato dizionari ed
> enciclopedie.  Il mio (umile, come dicono gli americani) punto di
> vista e' che, pur partendo da testo "libero", sarebbe bello andare
> verso qualcosa di piu' formale.  Per me l'XML dovrebbe sostituire
> la punteggiatura.
>
> A proposito del Wikizionario (http://it.wiktionary.org/), da quello
> che vedo non usano alcun markup se non quello di Wikipedia, con
> qualche sezione (Sinonimi, Vedi anche), ma tutto molto implicito, e
> tanti link.

Hai ragione, per avere garanzie di mantenere le informazioni
necessarie, conviene probabilmente fare il contrario:
ci facciamo come dici un wiki-coso-xmlloso e poi
il risultato del lavoro lo forniamo eventualmente 
a posteriori a wiktionary.

Così magari anche possiamo usare una licenza più
tipo BSD che tipo FDL (che è la licenza di wiktionary).

BSD -> il risultato del lavoro si può usare per tutti
  gli scopi a patto che vengano riconosciuto chi è
  l'autore del lavoro. I lavori derivati possono usare
  un po' tutte le licenze che si vuole.

FDL ->  il risultato del lavoro si può usare per tutti
  gli scopi a patto che venga riconosciuto chi è
  l'autore del lavoro e che i lavori derivati siano a
  loro volta FDL.

Personalmente avrei una leggera preferenza per una licenza tipo BSD,
ma anche una licenza più tipo FDL, per me sarebbe ok. La parte di
materiale di pubblico dominio invece rimarrebbe ovviamente tale,
visto anche che marchieremo chiaramente la provenienza di ogni cosa.

> Direi di partire senza un piano preciso, cercando solo di non
> perdere troppe informazioni, e applicare cambiamenti man mano.  Un
> wiki-coso-xmlloso sarebbe ottimo.

Provo a fare un paio di esperimenti per vedere se possiamo
avere un wiki-coso-xmlloso nostro.  :-)

> Per esempio, da:
>
> [b]Atomico[/b] [i]agg.[/i] Relativo all'atomo ...
>
> a:
>
> <voce>
>   <lemma>atomico</lemma>
>   <gr><agg/></gr>
>   <def>Relativo all'<vedi>atomo</vedi>.</def>
>   ...
> </voce>
>
> Che e' un po' come lanciarsi da un aereo sperando di trovare un
> paracadute prima di raggiungere terra.
>
> g.

Hai ragione: è talmente facile marchiare queste cose, che dobbiamo
tentare di farlo. La difficoltà sta solo nell'avere lo schema perfetto...
ma di fatto non ci serve lo schema perfetto!

In particolare senza l'esperienza sul campo non si chiarirà mai cosa 
serve e cosa non serve, cosa funziona e cosa non funziona.

Partiamo senza schema, senza paracadute, che volando...
impareremo a volare!  :-)

Potremmo per iniziare avere alcune voci un po' ciccione di 
esempio e poi fare le altre per similitudine...

Se strada facendo si renderanno opportuni cambiamenti,
il peggio che può succedere sarà che dovremo rinominare
dappertutto alcuni marchietti oppure fare occasionali
passate di aggiornamento, il che mi sembra accettabile...

Direi come unica avvertenza di fermarci magari qualche settimana
sulle voci ciccione (qualche esempio di sostantivo, verbio, aggettivo, ecc.)
per arrivare a dei marchietti di massima (in gergo tag) che ci soddisfano
almeno all'80% e con quelli poi si può ben partire.  :-)

Giovanni, hai per caso sotto mano gli esperimenti che
avevamo fatto in passato? A quei tempi avevamo già
ragionato su di un po' di casi...

Ah, ecco, sarebbe bello incorporare in modo nativo
ed elegante da subito i collegamenti ai sinonimi e contrari!
Mi sembra che su questo fronte avessimo degli esempi
niente male... dico giusto?

Poi addirittura con un meccanismo simile a quello dei
sinonimi si potranno agganciare le traduzioni inglesi dei termini.
Queste farebbero poi da ponte verso le numerose risorse
che sono disponibili per la lingua inglese (ad esempio
il wiktionary inglese con la traduzione dei vocaboli
in tante altre lingue). Ma è fantascienza e poi come
si diceva il wiktionary ha i suoi limiti...  ;-)

Passo a fare qualche esperimento con il TikiWiki!  :-)
(non è specializzato sull'XML, ma probabilmente lo regge,
dove non c'è confusione con i suoi tag nativi).

Ciao, Andrea

PS: domanda ai non informatici: guardando l'esempio di Giovanni,
si riesce, vero, ad intuirne un po' il funzionamento?

<voce>
  <lemma>atomico</lemma>
  <gr><agg/></gr>
  <def>Relativo all'<vedi>atomo</vedi>.</def>
  ...
</voce>

I marchietti di questo tipo: <blabla> indicano l'inizio di una parte di tipo "blabla".
Quelli invece di questo tipo </blabla> indicano la fine di una parte di tipo "blabla".

Hanno forse un'apparenza un po' strana per l'occhio non allenato, 
ma sono in realtà delle pure e semplici convenzioni, niente di più.

Ci si mette daccordo che l'inizio di una definizione verrà segnato
con <def> la fine con </def>. L'inizio della spiegazione grammaticale
con <gr> la fine con </gr>, ecc.

L'unica cosa che dobbiamo magari fare è fermarci un po' di più sulle
prime voci così se la denominazione di qualche marchietto non piace
lo cambiamo subito invece che farlo dopo 10000 voci...  ;-)

PS2: secondo me all'interno di <gr>...</gr> potremmo anche fare a meno 
di usare l'xml, ma comunque metterci daccordo su convenzioni uniformi.