[Dizionario] Se n'è discusso qui?
Andrea Sivieri
andrea.sivieri a sempreverdi.net
Mer 1 Set 2004 19:56:32 CEST
Ciao Giuseppe!
Per ora non abbiamo relazioni esplicite con il progetto wiktionary.
La mia idea era questa:
1. definiamo una procedura semplice ma rigorosa in modo che
il Melzi intero possa essere trascritto da centinaia di persone,
facendo in modo che se una persona sta lavorando ad una pagina
non venga disturbata da altri su quella pagina.
2. quando la procedura sarà definita e spiegata chiaramente nel Wiki,
annunceremo la cosa sulla mailing listi dei progetti wiktionary/
wikipedia/liberliber e inoltre ai telegiornali e con dei palloni
aereostatici colorati in modo da raccogliere quanti più
collaboratori possibili.
3. quando il Melzi sarà completamente trascritto proporremo
a wiktionary un possibile inserimento del Melzi nel wiktionary
stesso, in modo manuale curato da loro o in modo batch grazie
ad uno script che qualcuno scriverà...
4. voci aggiuntive per le parole che non sono nel Melzi
nella mia ottica sarebbe meglio raccoglierle nel nostro
progetto con una licenza più liberale della FDL e poi
donarle anche al progetto wiktionary (che invece è
regolato dalla GNU FDL).
5. non è escluso che in futuro faremo un collegamento
delle varie definizioni del Melzi con il corrispondente
senso/synset di WordNet. A quel punto collegando
dizionari in varie lingue agli stessi sensi/synset di WordNet
(che fungono da ponte di collegamento), avremo
automaticamente anche un superbo dizionario multilingua!
... o almeno italiano-inglese-italiano... senza un certo tipo di
ridondanza che tende a formarsi nell'ambito di wiktionary.
Cosa ne pensate?
Ciao, Andrea
PS: anche i sinonimi italiani aggiunti successivamente
li aggregherei collegandoli ai relativi synset di WordNet
inglese. WordNet europeo invece è come se non esistesse
vista la sua licenza, ma noi riusciremo probabilmente a
riprodurre una cosa abbastanza equivalente, ma libera. :-)
GLOSSARIETTO
PS: un synset di WordNet è un'insieme di sinonimi
che possono essere descritti da un'unica definizione,
perchè esprimono uno stesso senso.
Una stessa parola si può trovare quindi in diversi synset
se ha diversi sensi (significati).
Aggregando i sinonimi attorno al loro significato,
non si ha la ridondanza che si avrebbe associando
ad ogni parola tutti i suoi sinonimi. Pensate
cosa succederebbe invece se ogni parola di un gruppo
di M parole riportasse altre M parole...
Wiktionary mi pare molto ridondante perchè ripete
tutto tante volte quante sono le lingue.
Esempio:
====it: CANE====
de: Hund
en: dog
=====en: DOG====
it: cane
de: Hund
=====de: HUND====
it: cane
en: dog
Invece che avere unicamente i pezzi indicati sotto
semplicemente collegati al loro giusto synset.
===synset: DOG ===
[en] dog,hound,fido [en definition] 4-legged mammal
[it] cane [it definition] mammifero con 4 zampe che abbaia
[de] Hund
===synset: CAT===
[en] cat
[it] gatto,micio
[de] Katze
...
Nel momento che si avessero i collegamenti:
[en] cat -> synset:CAT
[en definition] sort of tiger, but much smaller -> synset:CAT
[it] gatto -> synset:CAT
[it definition] simpatico felino peloso e miagolante -> synset:CAT
[de] Katze -> synset:CAT
sarebbe banale tradurre gatto in tutte le lingue... passando per l'inglese. :-)
... e anche avere a portata di mano tutte le definizioni:
questa mi sembra la via più razionale per gestire la cosa.
Occupazione di spazio proporzionale ad M invece che M x M.
> Salve,
>
> a proposito del dizionario Wiki e del suo contenuto, in che
> relazioni siamo con il progetto Wiktionary?
>
> http://it.wiktionary.org/
>
> (vedi ad esempio:
>
> <url:http://it.wiktionary.org/wiki/Elettronegatività>
>
> )
>
> Il loro è ovviamente un progetto estremamente più vasto
> (significati, traduzioni, etc), ma in qualche modo collegato al
> nostro.
Maggiori informazioni sulla lista
Dizionario