[Dizionario] necesse XML

Mirko Maischberger mirko a lilik.it
Ven 27 Set 2002 20:33:30 CEST


Sono d'accordo che disaggregare sia molto piu`
difficile di aggregare, soprattutto se nel
disaggregare non si vuole perdere l'aggregazione
originale :)

Ciao, provo a darti le mie impressioni sui punti 
che mi sono saltati all'occhio.


Il ven, 2002-09-27 alle 19:20, Andrea Sivieri ha scritto:
>...
>         <word>frutto</word>
> 
>         <!--    Lista dei sinonimi -->
>                 
>         <syn>prodotto della terra, prodotto</syn>

questo in xml si scrive 
<syn>prodotto della terra</syn>
<syn>prodotto</syn>
altrimenti introduci una notazione nuova (la virgola) e non e` piu`
xml, ma un ibrido.

>         <def src="Melchi">Tutto ciò che la terra produce</def>
>         <def src="Test1">Prova</def>        
>         
>         <def src="Test2">Prova</def>                
> 
>         <!--    Ogni definizione viene da una qualche 
>                 fonte a cui e` associato un identificatore (esempio: Melchi).
>                 Possono esserci anche decine di definizioni-->

Questa andra` estesa... def/src non credo basti.
       
> 
>         <!--    Considerazioni simili valgono per la lista di esempi -->
>         
>         <example src="Bibbia">Per sei anni seminerai la tua terra e 
> raccoglierai i suoi frutti. [Esodo 23,10]</example>

Se le citazioni dalla bibbia fossero molte potrebbe convenire mettere il
firerimento in 3 attributi separati.

>     </meaning>
> 
>...
>     <meaning>
>         <word>pèsca</word>         <!-- Notare l'accento -->

Se mettiamo l'accento pero` credo che mettiamo in difficolta` anche il
correttore ortografico (correntemente scriviamo pesca, a meno che non ci
siano dei dubbi di interpretazione). Come lo risolviamo questo problema?


>         <syn>frutto</syn>    
>         <def src="Melchi">Frutto del pesco</def>
>         
>         <!--    Segue la traduzione verso un meaning inglese (identificato da
>                 "word|primo_sinonimo"). -->
>                         
>         <trans lang="en">peach|fruit</trans>

Anche in questo caso introdurre il "pipe" per dividere le parole non
e` XML e alla lunga genera problemi ed e` difficile da processare con un
XSL.

>         
>         <!--    Sarebbe secondo me di scarsa utilita` tradurre 
>                 un po' come viene parole italiane in parole varie di altre
>                 lingue. La cosa piu` efficiente mi sembra tradurre tutti
>                 i meaning italiani o di altre lingue in meaning inglesi.
>                 Se si fa questo per M lingue, si hanno automaticamente M*M
>                 dizionari multilingue pronti, avendo fatto un lavoro 
>                 proporzionale a M, invece che M*M.
>                 Senza contare il fatto che si avrebbe la corrispondenza
>                 con i sinonomi giusti nelle altre lingue: e` questo quello
>                 che un traduttore vorrebbe. :-) -->                        
>         
>         <!--    Dove non e` scritto lang="en" o lang="<altro>" e` sottointeso 
>                 lang="it", a meno che uno dei tag progenitori non abbia 
>                 lang="<altro>", nel qual caso si eredita lang="<altro>"  -->

Rimango dell'idea che la mia proposta di <accezione lang=""> sia la più
flessibile. una semplice corrispondenza (anche molti a molti) lemma
italiano <-> lemma inglese non contiene abbastanza informazioni per
formare un dizionario bilingue.

Mentre la forma che proponevo puo` essere usata per inglobare questa
(credo sia piu` generale).

>... 
> <!--    Sia le forme regolari che quelle irregolari dovranno essere
>         collegate alle forme base, che poi fanno da ponte verso i significati
>         (meanings). E` indicata la classe in modo da permettere
>         la declinazione o coniugazione a partire dalla forma base
>         (a riguardo ci sono cose da perfezionare) -->
> 
> <base_forms>
>     <base_form>
>         <word>pèsca</word>
>         <comment>il frutto</comment>
>         <class>noun:f-ca-che</class>
>     </base_form>

Perche' in una sezione a parte e non nel file precedente?
Anche in questo caso poi e` presente una notazione estranea
all'XML
io avrei scritto 

<noun>-ca</noun>
<noun>-che</noun>

o una qualsiasi variante in cui l'informazione non vada parsata da
nessuno se non dal parser xml.


Scusa se ho tagliato il resto, non ho avuto il tempo di leggerlo. Mi
riprometto di farlo domani

Ciao

-- 
Mirko Maischberger  -  jabber: silicio a jabber.org  -  GnuPG Key:
5B35D286
Messaggi HTML o con allegati potrebbero non ricevere attenzione
immediata




Maggiori informazioni sulla lista Dizionario