[Dizionario] necesse XML

Simone Piccardi piccardi a firenze.linux.it
Ven 27 Set 2002 11:34:19 CEST


On Fri, 2002-09-27 at 11:10, Giovanni Pensa wrote:
> Io (per quel che vale) voto per l'XML e basta.  Un DB è comodo per fare
> da indice e ricerca full-text se si vuole un server.  Altrimenti un po'
> di XSLT o Perl/Python/etc. e dal documento XML si estrae quello che
> volete, come lo volete.
Infatti, questo e` il motivo che mi fa preferire comunque XML,
nonostante il fatto che lo conosca appena.

> Qualcosa già esiste, ad esempio nel progetto TEI (usato dagli accademici
> della crusca) c'è il capitolo "Print Dictionaries"
> 
> 	http://www.tei-c.org/P4X/DI.html
Ci do' un'occhiata...

> (Questo è un esempio, ignorate il contenuto che sto inventando con molta
> fantasia.)
> 
>     <voce>
>       <lemma>casa</lemma>
>       <sillabazione>ca-sa</sillabazione>
>       <pronuncia>'kasa</pronuncia>
> 	<grammatica> <sostantivo/> <femminile/> </grammatica>
>       <definizione>...</definizione>
>       <esempio>Non bombardate la mia casa.</esempio>
>       <citazione>
>         <canzone>
>           <verso>Voglio andare a casa</verso>
>           <verso>La casa dov'è?</verso>
>           <verso>La casa dove posso stare</verso>
>         </canzone>
>       </citazione>
>       <traduzione xml:lang="en" >house</traduzione>
>       <traduzione xml:lang="fr" >maison</traduzione>
>       <sinonimo>abitazione</sinonimo>
>     </voce>
Per essere una cosa buttata li' mi pare gia` valida.


> Mancano almeno due cose.  Come identificare la voce?  Esplicitamente con
> un attributo id="casa", o implicitamente con la costruzione
> dell'identificatore dal lemma?  E come separare gli omografi?  Potrebbe
> venir fuori "casa_s" da non confondere con un eventuale "casa verbo"...
Non ho capito, che intendi?

> 
> E come sistemare la gestione dei suffissi?  Un semplice attributo che
> rimanda ad una lista?  Ad esempio suffisso="ae"? O segnalare solo le
> voci irregolari?
Per questo basterebbe riferirsi ai file di suffissi di ispell gia`
esistenti (magari con opportuni tag per indicare il file usato)

> 
> Decise queste cose si potrebbe riversare la lista delle parole, tanto
> per avere del materiale, e lavorare su questo.
Un'altra cosa utile, da fare quanto prima, e` fare il generatore delle
liste per ispell. Questo permetterebbe di iniziare a inserire nuove
parole sulla base dell'uso delle suddette liste da parte di utenti che
potrebbero reinviare indietro i loro dizionari personali (sarebbe
facilissimo riottenere le parole mancanti, e al gruppo che cura la
stesura resterebbe la parte che precede la classificazione).

Ciao
-- 
As.| Simone Piccardi - KeyID:2A972F9D - JabberID:simone a jabber.linux.it 
So.| http://firenze.linux.it/~piccardi  -  http://www.softwarelibero.it 
Li.| Prima ti ignorano, poi ti deridono, poi ti combattono.  Poi vinci. 
                                                           M. K. Ghandi
-------------- parte successiva --------------
Un allegato non testuale è stato rimosso....
Nome:        signature.asc
Tipo:        application/pgp-signature
Dimensione:  189 bytes
Descrizione: This is a digitally signed message part
URL:         <http://lists.softwarelibero.it/pipermail/dizionario/attachments/20020927/4c104f24/attachment.pgp>


Maggiori informazioni sulla lista Dizionario