[Dizionario] necesse XML
Simone Piccardi
piccardi a firenze.linux.it
Ven 27 Set 2002 11:34:19 CEST
On Fri, 2002-09-27 at 11:10, Giovanni Pensa wrote:
> Io (per quel che vale) voto per l'XML e basta. Un DB è comodo per fare
> da indice e ricerca full-text se si vuole un server. Altrimenti un po'
> di XSLT o Perl/Python/etc. e dal documento XML si estrae quello che
> volete, come lo volete.
Infatti, questo e` il motivo che mi fa preferire comunque XML,
nonostante il fatto che lo conosca appena.
> Qualcosa già esiste, ad esempio nel progetto TEI (usato dagli accademici
> della crusca) c'è il capitolo "Print Dictionaries"
>
> http://www.tei-c.org/P4X/DI.html
Ci do' un'occhiata...
> (Questo è un esempio, ignorate il contenuto che sto inventando con molta
> fantasia.)
>
> <voce>
> <lemma>casa</lemma>
> <sillabazione>ca-sa</sillabazione>
> <pronuncia>'kasa</pronuncia>
> <grammatica> <sostantivo/> <femminile/> </grammatica>
> <definizione>...</definizione>
> <esempio>Non bombardate la mia casa.</esempio>
> <citazione>
> <canzone>
> <verso>Voglio andare a casa</verso>
> <verso>La casa dov'è?</verso>
> <verso>La casa dove posso stare</verso>
> </canzone>
> </citazione>
> <traduzione xml:lang="en" >house</traduzione>
> <traduzione xml:lang="fr" >maison</traduzione>
> <sinonimo>abitazione</sinonimo>
> </voce>
Per essere una cosa buttata li' mi pare gia` valida.
> Mancano almeno due cose. Come identificare la voce? Esplicitamente con
> un attributo id="casa", o implicitamente con la costruzione
> dell'identificatore dal lemma? E come separare gli omografi? Potrebbe
> venir fuori "casa_s" da non confondere con un eventuale "casa verbo"...
Non ho capito, che intendi?
>
> E come sistemare la gestione dei suffissi? Un semplice attributo che
> rimanda ad una lista? Ad esempio suffisso="ae"? O segnalare solo le
> voci irregolari?
Per questo basterebbe riferirsi ai file di suffissi di ispell gia`
esistenti (magari con opportuni tag per indicare il file usato)
>
> Decise queste cose si potrebbe riversare la lista delle parole, tanto
> per avere del materiale, e lavorare su questo.
Un'altra cosa utile, da fare quanto prima, e` fare il generatore delle
liste per ispell. Questo permetterebbe di iniziare a inserire nuove
parole sulla base dell'uso delle suddette liste da parte di utenti che
potrebbero reinviare indietro i loro dizionari personali (sarebbe
facilissimo riottenere le parole mancanti, e al gruppo che cura la
stesura resterebbe la parte che precede la classificazione).
Ciao
--
As.| Simone Piccardi - KeyID:2A972F9D - JabberID:simone a jabber.linux.it
So.| http://firenze.linux.it/~piccardi - http://www.softwarelibero.it
Li.| Prima ti ignorano, poi ti deridono, poi ti combattono. Poi vinci.
M. K. Ghandi
-------------- parte successiva --------------
Un allegato non testuale è stato rimosso....
Nome: signature.asc
Tipo: application/pgp-signature
Dimensione: 189 bytes
Descrizione: This is a digitally signed message part
URL: <http://lists.softwarelibero.it/pipermail/dizionario/attachments/20020927/4c104f24/attachment.pgp>
Maggiori informazioni sulla lista
Dizionario