[Dizionario] Re: [Dizionaridizionario] necesse XML

Andrea Sivieri andrea.sivieri a libero.it
Sab 28 Set 2002 16:36:26 CEST


> Mirko ha scritto:
> > > Rimango dell'idea che la mia proposta di <accezione lang=""> sia la pi 
%/1iso8859-15ù
> > > flessibile. una semplice corrispondenza (anche molti a molti) lemma
> > > italiano <-> lemma inglese non contiene abbastanza informazioni per
> > > formare un dizionario bilingue.
> > >
> > > Mentre la forma che proponevo puo` essere usata per inglobare questa
> > > (credo sia piu` generale).
> 
> Hai ragione: la tua impostazione inizia a convincermi,
> provo a fare qualche esperimento...

Ecco un esperimento che si avvicina abbastanza a quello che dici tu
e in piu` prende a prestito dalle TEI guidelines alcune cose:
( http://www.tei-c.org/P4X/DI.html )

<dictionary>

<entry id="colour" lang="en">
    <form>
        <orth>colour</orth>
        <orth utype="geo" uvalue="U.S.">color</orth>        
        <!-- utype==usage_type, uvalue==usage_value, ispirato da TEI -->
    </form>
    <sense n="1">
        <def>Any hue distinguished from white or black.</def>
    </sense>
</entry>

<entry id="pesca" lang="it">
    <form category="noun" num="s" gen="f">
        <!-- entrambe le seguenti ortografie sono valide -->
        <orth>pesca</orth>
        <orth>pèsca</orth>        
        <!-- per la pronuncia bastera` scegliere una delle translitterazioni
possibili dell'alfabeto fonetico internazionale. Comunque in italiano ci sono
regole che possono ricavare la pronuncia in automatico in buona parte
dei casi (tipicamente credo che basti conoscere gli accenti). Un paio di
anni fa avevo fatto parlare un sintetizzatore vocale inglese in italiano
propinandogli il testo italiano trasformato con regole automatiche:
non sbagliava molto, la difficolta` piu` grossa e` stata fargli dire "gl" 
come in "aglio" oppure "z" come in "orzo"  ;-) -->
        <pron>...</pron>
    </form>
    
<!-- il fatto di numerare i sensi come fa il TEI renderebbe superfluo fare 
giochi con i sinonimi per distinguere un significato dall'altro -->

<!-- il <sense>, sarebbe il <significato> di Mirko -->

<!-- il fatto di numerare anche definizioni ed esempi, quando c'e` bisogno
perche` sono multipli (altrimenti e` sottointeso n="1"), permette di 
specificare in modo esatto e rapido cosa e` la traduzione di cosa 
(e` una variante della tecnica delle accezioni di Mirko)
-->
    
    <sense n="1">
        <syn>fruit</syn>
    
        <def n="1" src="Melchi">Frutto del pesco</def>
        <def n="1" lang="en">Fruit of the peach (tree)</def>        
        
        <def n="2">Il frutto morbido e succoso del pesco
avente polpa gialla e buccia vellutata gialla con zone tinte di rosso,
ed un nocciolo con superficie corrugata contenente un singolo seme.
</def>  
        <def n="2" lang="en">The soft juicy fruit of the tree named peach, 
having yellow flesh, downy, red-tinted yellow skin, and a deeply 
sculptured stone containing a single seed.
</def>

    </sense>
</entry>

<entry id="pesca2" lang="it">

<!-- metterei il vincolo che le forme, le ortografie, le pronunce, ecc.
possono essere multiple in un entry, esse pero` devono poter essere accoppiate
con ognuno dei significati (sense) che seguono nella stessa entry.
Se un cambio di ortografia o pronuncia implica un insieme di significati 
diversi, allora renderei obbligatorio fare una entry separata -->

    <form>
        <orth>pesca</orth>
        <orth>pésca</orth>        
        <pron>...</pron>
    </form>
    <sense n="1">
        <syn>cattura di pesci</syn>
    
        <def src="Melchi">Il pescare</def>
        <def lang="en">Fishing</def>
    </sense>
    <sense n="2">
        <syn>estrazione</syn>
    
        <example>La pesca di beneficenza</example>
    </sense>    
</entry>

<!-- l'id segnato qui di seguito fa da identificatore per i ref -->    
<entry id="frutto" lang="it">
    <form>
        <orth>frutto</orth>
        <pron>...</pron>
    </form>
    <sense n="1">
        <syn>vegetale</syn>
    
        <def n="1" src="Melchi">Il frutto carnoso, o polputo, 
prodotto dai vegetali</def>

        <def n="1" lang="en">Fruit of the peach (tree)</def>        
    </sense>

<!-- utype==usage_type, uvalue==usage_value-->
<!-- valori per utype e uvalue, presi da indicazioni TEI per tag <usg>-->

    <sense n="2" utype="style" uvalue="figurative">
        <def n="1" src="Melchi">Rendita, profitto</def>        
        <syn>guadagno</syn>
        <syn>utile</syn>
        <syn>attivo</syn>
        <syn>interesse</syn>
        <syn>profitto</syn>
        <syn>compenso</syn>
        <syn>vantaggio</syn>
        <syn>rendita</syn>
        <syn>resa</syn>

        <!-- lista dei contrari -->
        <anti>perdita</anti>

        <!-- possibile modo per fare un collegamento verso l'entry inglese 
corrispondente -->
        <trans ref="fruit" lang="en" sense="2" />
        
        <!-- possibile modo per importare la definizione tradotta presente in
        una entry inglese, notare che la def afferma di essere n="1" ovvero
        di corrispondere alla def italiana n="1" di questo sense, per cui 
dovra`        
        essere la sua traduzione letterale oppure scegliersi un altro valore 
di n -->
        <!-- usando collegamenti di questo tipo si potrebbe fare che tutte le
        lingue collegano verso def, example e simili delle entry inglese,
        ma non inglobano direttamente il testo inglese nelle proprie entry
        in questo modo non c'e` piu` la ridondanza di dover mettere in ogni 
posto
        la traduzione inglese (magari di diverse righe) con la possibilita` di
        sbagliare qualcosa nella copiatura e perdendo in quest'ultimo caso
        tutta la corrispondenza multi-lingue. Immaginate quindi che 
        nell'esempio della pesca
        le definizioni inglesi non siano inline, ma risiedano nella propria
        entry, al loro posto invece un collegamento, tipo il seguente: -->
        
        <def n="1" ref="fruit" lang="en" sense="2" def="1" />
        
        <!-- riassumendo quest'ultima idea che mi e` venuta dice che:
        * ogni entry contiene solo testi nella propria lingua
        * contiene poi collegamenti esatti verso parti precise delle opportune
          entry inglesi, che poi fanno da ponte verso tutte le altre lingue 
-->
    </sense>

    <sense n="3">    
        <example n="1" src="Bibbia" pos="Esodo 23,10">
Per sei anni seminerai la tua terra e raccoglierai i suoi frutti.
</example>    
        
        <example n="1" ref="fruit" lang="en" sense="3" example="1" />
    </sense>        
    
</entry>

<entry id="fruit" lang="en">
    <form>
        <orth>fruit</orth>
        <pron>...</pron>
    </form>
    <sense n="1">
    ...
    </sense>
    <sense n="2">
        <def n="1" src="Melchi">Remunaration, profit</def>
    </sense>
    <sense n="3">    
        <example n="1" src="Bible" pos="Exodus 23,10">
Six years thou shalt sow thy land, and shalt gather in the fruits thereof.
</example>            
    </sense>            
</entry>

</dictionary>

Sto tralasciando per ora tutto il sistema di regole.
Quando si fosse deciso un buon sistema per gestire
regole ed eccezioni, non ci sarebbero problemi ad
agganciarlo.

Ciao,
       Andrea
       

PS: imporrei che complesso(noun) e complesso(adj) 
devono essere in entry distinte, trovando una convenzione
per generare id distinti per le loro entry.




Maggiori informazioni sulla lista Dizionario