[Formati] Definizione e obiettivi

Mirko Maischberger mirko at lilik.it
Sat Jan 29 10:09:37 UTC 2005


Mi sono accorto che nonostante abbia già scritto un po' tanto, sono 
stato ancora troppo sintetico, aggiungo quindi qualche nota qua e là. Vi 
prego comunque di leggere prima il messaggio precedente.

Lo so che in qualche modo vi sto annoiando, ma prima di entrare nel vivo 
  e fare proposte ho bisogno di discutere ancora un po' con voi.

Mirko Maischberger wrote:
> Per me POSIX, IEEE ed ISO oltre che chiaramente ECMA, IETF, oasis, ecc. 
> sono tutte ottime fonti di documentazione per formati dati liberi, ma 
> non tutte lo sarebbero se dessi la definizione a priori, senza curarmi 
> dell'esistente.

Nota: forse vado a memoria e forse sbaglio, ma mi pare che, sebbene 
alcuni standard IEEE siano rilasciati gratuitamente -- comunque mai 
liberamente -- i più nuovi siano quasi sempre a pagamento. Mi pare che 
lo stesso avvenga per ISO e POSIX... ma il campo non è vasto... è 
vastissimo...

> Lo stesso ASCII-7, se non ci fosse l'ECMA, ma solo ANSI, ISO, UNI, ecc. 
> non sarebbe un formato libero... e non lo è sotto quel nome, ma sotto 
> quello di ECMA-6.

Anche qui, almeno una dozzina di enti hanno definito lo standard ASCII-7 
e non mi pare che lo abbiano fatto tutte sotto quel nome (ma potrei 
sbagliarmi, anche perché l'unico standard che posso leggere è quello ECMA-6)

Mi pare che quello ANSI sia a pagamento:
http://webstore.ansi.org/ansidocstore/product.asp?sku=ANSI+INCITS+4-1986+(R2002)

Quello ISO pure:
http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=4777

Il sito UNI è na roba che non vi dico... :)

Mentre quelle ECMA-6 sono gratuite:
http://www.ecma-international.org/publications/standards/Ecma-006.htm


> molti molti meno formati liberi che non formati utilizzabili 
> con software libero.

Qui non intendo dire solo che OOo apre i .doc, ma che .doc non è libero, 
ma anche che i .blend di Blender, .xcf di gimp non lo è a detta della 
doc di gimp. In qualche modo quindi XCF è un formato libero, ma non 
interoperabile, DOC non è né libero né interoperabile, mentre 
praticmanete qualsiasi formato XML valido è sia libero che interoperabile.

Qui una nota alla nota: un XML si dice "ben formato" se apre e chiude 
correttamente tutti i tag e mette le virgolette nei posti giusti, mentre 
si dice "valido" se è possibile validarne il contenuto tramite un DTD o 
uno /schema/. Se da una parte è vero che sono possibili tecniche di 
camuffamento malizioso da cui bisogna guardarsi è anche vero che 
chiunque abbia usato XML è in grado di dire se un formato è XML o meno, 
a prescindere dal fatto che sia valido.

Infatti un file XML è definito come "linguaggio di meta-markup per 
documenti di tipo testuale. I dati vengono inclusi [...] sotto forma di 
stringhe di tessto, circondati dai tag di markup che li descrivono."[1]. 
Quindi se i tag non sono descrittivi NON È XML.


> Il validatore è sicuramente un "accessorio" importante, infatti mentre 
> per il software la maggior libertà è quella di poterlo cambiare, per un 
> formato la miglior garanzia è che non cambi troppo spesso. Almeno 
> fintanto che, in Europa, la possibilità di modificare un formato sarà 
> garantita a tutti e indipendentemente dalla volontà di chi lo ha creato 
> (sempre salvo brevetti). Pensa poi al valore che ha avuto il validatore 
> per la rinascita di HTML e il freno che ha messo alle tendenze ad 
> "estenderlo" autonomamente di Netscape prima e di Microsoft poi.
> 
> Un esempio calzante a questo proposito è RTF: inutile dire "se è 
> documentato è libero", se poi non esiste un modo per verificare che il 
> software proprietario che lo implementa, che è di fatto 
> l'"implementazione di riferimento", lo faccia correttamente. RTF, per 
> come è implementato, è libero poco più del .DOC.

Qui mi torna in mente XML. Molti dei formati (non binari) in giro oggi 
(xhtml, svg, sxw, abw, gnumeric, dia...) hanno un loro DTD o schema e un 
validatore già pronto. Il "costringere" o "suggerire fortemente" 
l'esistenza di un validatore potrebbe spingere molto verso XML valido 
(che come detto prima presuppone che il formato sia auto-documentante).

>> Assolutamente si, credo sia la cosa migliore, e in effetti il documento
>> finora prodotto, benché unico si distingueva in due parti appositamente
>> (lo trovi negli archivi della lista). Sono d'accordo nel separalo in due
>> parti distinte. 
> 
> Non l'avevo notato, forse lo dovrei rileggere meglio. È la stessa 
> versione che c'è su cvs?

Beh, sì, ok, comunque siamo d'accordo sul contenuto.

[1] O'Reilly 2001 - XML, Guida di Riferimento - Harold, Means
-- 
Mirko Maischberger - jabber: mirko at jabber.linux.it - GPGKey: 5B35D286
Mail HTML o con allegati potrebbero non ricevere attenzione immediata


More information about the formati mailing list