[Dizionario] necesse XML

Andrea Sivieri andrea.sivieri a libero.it
Ven 27 Set 2002 13:19:14 CEST


Ciao!

> O si fa una lista di parole, o si lavora sui suffissi di *spell, o si fa
> un DB, o si fa un testo in formato dict, o si usa un formato strano,
> ...., o si usa XML.  Certo, da un DB, da un file Excel (!), da quello che
> volete si pu %/1iso8859-15ò tirar fuori un file XML, ma non sar 
%/1iso8859-15à che la
> rappresentazione in XML di qualcos'altro.
> 
> Io (per quel che vale) voto per l'XML e basta.  Un DB  %/1iso8859-15è 
comodo per fare
> da indice e ricerca full-text se si vuole un server.  Altrimenti un po'
> di XSLT o Perl/Python/etc. e dal documento XML si estrae quello che
> volete, come lo volete.

Generalmente si fa la distinzione tra due
tipi di XML: un tipo piu` indirizzato ai dati
(come ad esempio SVG) ed un tipo piu`
indirizzato ai documenti (come ad esempio
DocBook o XHTML).

L'impostazione che c'e` nella mia mente
(e che in realta` non ho mai esposto, perche`
devo ancora verificarla e poi non ci stava nel 
margine del foglio ;-) e` effettivamente tabulare.

Chiamero` codesto XML, TabXML (Tabular XML)
ed esso ha in effettivamente una corrispondenza
diretta con lo schema di un database relazionale,
per cui nella sua definizione possono essere
usati per ottimizzarlo strumenti come i diagrammi
entita`-relazione (vedi qualsiasi libro sui database).

Chiamero` invece DocXML l'XML aggregato di cui si 
parla nelle ultime mail e di cui in effetti si era parlato 
anche in passato.

I dati portati dal TabXML essendo equivalenti
al contenuto stesso di un db relazione, sono
ad esso equipotenti.

L'impostazione sulla quale stavo riflettendo
intendeva fare in modo automatico il passaggio
TabXML->DocXML.

Se pero` fosse inserito pagina per pagina un
vero dizionario, allora la strada sarebbe invece
DocXML->TabXML e andrebbe a riepire le
"tabelle" con le definizioni, ad esempio,
"completando" il db relazionale (virtuale
nel caso non si stia usando anche un
vero db SQL).

Non sto qui a difendere la mia impostazione,
perche` devo ancora controllare che essa
possa fare effettivamente con la facilita` che
immagino certi tipi di analisi.

Parlando in generale, i nomi dei tag XML
li metterei tutti in inglese, per facilitare
eventuali collaborazioni future con progetti
internazionali. Inoltre nomi non troppo 
accorciati, altrimenti si perdono i benefici di 
avere i tag. 

Questo non vuol dire che uno debba
per forza scriversi a mano fiumi di XML.
Esempio: ritrovata una lista con 4000
verbi irregolari, non mi metterei riga per
riga a trasformarlo in XML, ma semmai
userei la funzione automatica di nedit
macro->learn_keystrokes
[provare per credere: http://www.nedit.org/]

Ciao,
         Andrea





Maggiori informazioni sulla lista Dizionario