[Formati] Definizione e obiettivi
Mirko Maischberger
mirko at lilik.it
Sat Jan 29 10:09:37 UTC 2005
Mi sono accorto che nonostante abbia già scritto un po' tanto, sono
stato ancora troppo sintetico, aggiungo quindi qualche nota qua e là. Vi
prego comunque di leggere prima il messaggio precedente.
Lo so che in qualche modo vi sto annoiando, ma prima di entrare nel vivo
e fare proposte ho bisogno di discutere ancora un po' con voi.
Mirko Maischberger wrote:
> Per me POSIX, IEEE ed ISO oltre che chiaramente ECMA, IETF, oasis, ecc.
> sono tutte ottime fonti di documentazione per formati dati liberi, ma
> non tutte lo sarebbero se dessi la definizione a priori, senza curarmi
> dell'esistente.
Nota: forse vado a memoria e forse sbaglio, ma mi pare che, sebbene
alcuni standard IEEE siano rilasciati gratuitamente -- comunque mai
liberamente -- i più nuovi siano quasi sempre a pagamento. Mi pare che
lo stesso avvenga per ISO e POSIX... ma il campo non è vasto... è
vastissimo...
> Lo stesso ASCII-7, se non ci fosse l'ECMA, ma solo ANSI, ISO, UNI, ecc.
> non sarebbe un formato libero... e non lo è sotto quel nome, ma sotto
> quello di ECMA-6.
Anche qui, almeno una dozzina di enti hanno definito lo standard ASCII-7
e non mi pare che lo abbiano fatto tutte sotto quel nome (ma potrei
sbagliarmi, anche perché l'unico standard che posso leggere è quello ECMA-6)
Mi pare che quello ANSI sia a pagamento:
http://webstore.ansi.org/ansidocstore/product.asp?sku=ANSI+INCITS+4-1986+(R2002)
Quello ISO pure:
http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=4777
Il sito UNI è na roba che non vi dico... :)
Mentre quelle ECMA-6 sono gratuite:
http://www.ecma-international.org/publications/standards/Ecma-006.htm
> molti molti meno formati liberi che non formati utilizzabili
> con software libero.
Qui non intendo dire solo che OOo apre i .doc, ma che .doc non è libero,
ma anche che i .blend di Blender, .xcf di gimp non lo è a detta della
doc di gimp. In qualche modo quindi XCF è un formato libero, ma non
interoperabile, DOC non è né libero né interoperabile, mentre
praticmanete qualsiasi formato XML valido è sia libero che interoperabile.
Qui una nota alla nota: un XML si dice "ben formato" se apre e chiude
correttamente tutti i tag e mette le virgolette nei posti giusti, mentre
si dice "valido" se è possibile validarne il contenuto tramite un DTD o
uno /schema/. Se da una parte è vero che sono possibili tecniche di
camuffamento malizioso da cui bisogna guardarsi è anche vero che
chiunque abbia usato XML è in grado di dire se un formato è XML o meno,
a prescindere dal fatto che sia valido.
Infatti un file XML è definito come "linguaggio di meta-markup per
documenti di tipo testuale. I dati vengono inclusi [...] sotto forma di
stringhe di tessto, circondati dai tag di markup che li descrivono."[1].
Quindi se i tag non sono descrittivi NON È XML.
> Il validatore è sicuramente un "accessorio" importante, infatti mentre
> per il software la maggior libertà è quella di poterlo cambiare, per un
> formato la miglior garanzia è che non cambi troppo spesso. Almeno
> fintanto che, in Europa, la possibilità di modificare un formato sarà
> garantita a tutti e indipendentemente dalla volontà di chi lo ha creato
> (sempre salvo brevetti). Pensa poi al valore che ha avuto il validatore
> per la rinascita di HTML e il freno che ha messo alle tendenze ad
> "estenderlo" autonomamente di Netscape prima e di Microsoft poi.
>
> Un esempio calzante a questo proposito è RTF: inutile dire "se è
> documentato è libero", se poi non esiste un modo per verificare che il
> software proprietario che lo implementa, che è di fatto
> l'"implementazione di riferimento", lo faccia correttamente. RTF, per
> come è implementato, è libero poco più del .DOC.
Qui mi torna in mente XML. Molti dei formati (non binari) in giro oggi
(xhtml, svg, sxw, abw, gnumeric, dia...) hanno un loro DTD o schema e un
validatore già pronto. Il "costringere" o "suggerire fortemente"
l'esistenza di un validatore potrebbe spingere molto verso XML valido
(che come detto prima presuppone che il formato sia auto-documentante).
>> Assolutamente si, credo sia la cosa migliore, e in effetti il documento
>> finora prodotto, benché unico si distingueva in due parti appositamente
>> (lo trovi negli archivi della lista). Sono d'accordo nel separalo in due
>> parti distinte.
>
> Non l'avevo notato, forse lo dovrei rileggere meglio. È la stessa
> versione che c'è su cvs?
Beh, sì, ok, comunque siamo d'accordo sul contenuto.
[1] O'Reilly 2001 - XML, Guida di Riferimento - Harold, Means
--
Mirko Maischberger - jabber: mirko at jabber.linux.it - GPGKey: 5B35D286
Mail HTML o con allegati potrebbero non ricevere attenzione immediata
More information about the formati
mailing list