[Dizionario] Se n'è discusso qui?

Alberto Capponi alberto a studiocapponi.com
Lun 6 Set 2004 09:15:44 CEST


Andrea Sivieri wrote:

>Ciao Giuseppe!
>
>Per ora non abbiamo relazioni esplicite con il progetto wiktionary.
>
>La mia idea era questa:
>
>1. definiamo una procedura semplice ma rigorosa in modo che 
>il Melzi intero possa essere trascritto da centinaia di persone, 
>facendo in modo che se una persona sta lavorando ad una pagina
>non venga disturbata da altri su quella pagina.
>
>2. quando la procedura sarà definita e spiegata chiaramente nel Wiki,
>annunceremo la cosa sulla mailing listi dei progetti wiktionary/
>wikipedia/liberliber e inoltre ai telegiornali e con dei palloni
>aereostatici colorati in modo da raccogliere quanti più 
>collaboratori possibili.
>
>3. quando il Melzi sarà completamente trascritto proporremo
>a wiktionary un possibile inserimento del Melzi nel wiktionary 
>stesso, in modo manuale curato da loro o in modo batch grazie 
>ad uno script che qualcuno scriverà...
>
>4. voci aggiuntive per le parole che non sono nel Melzi
>nella mia ottica sarebbe meglio raccoglierle nel nostro
>progetto con una licenza più liberale della FDL e poi
>donarle anche al progetto wiktionary (che invece è
>regolato dalla GNU FDL).
>
>5. non è escluso che in futuro faremo un collegamento
>delle varie definizioni del Melzi con il corrispondente
>senso/synset di WordNet. A quel punto collegando
>dizionari in varie lingue agli stessi sensi/synset di WordNet
>(che fungono da ponte di collegamento), avremo 
>automaticamente anche un superbo dizionario multilingua! 
>... o almeno italiano-inglese-italiano... senza un certo tipo di  
>ridondanza che tende a formarsi nell'ambito di wiktionary.
>
>Cosa ne pensate?
>
>Ciao, Andrea
>
>PS: anche i sinonimi italiani aggiunti successivamente
>li aggregherei collegandoli ai relativi synset di WordNet 
>inglese. WordNet europeo invece è come se non esistesse 
>vista la sua licenza, ma noi riusciremo probabilmente a 
>riprodurre una cosa abbastanza equivalente, ma libera.  :-)
>
>GLOSSARIETTO
>
>PS: un synset di WordNet è un'insieme di sinonimi
>che possono essere descritti da un'unica definizione,
>perchè esprimono uno stesso senso.
>
>Una stessa parola si può trovare quindi in diversi synset
>se ha diversi sensi (significati).
>
>Aggregando i sinonimi attorno al loro significato,
>non si ha la ridondanza che si avrebbe associando
>ad ogni parola tutti i suoi sinonimi. Pensate
>cosa succederebbe invece se ogni parola di un gruppo
>di M parole riportasse altre M parole...
>
>Wiktionary mi pare molto ridondante perchè ripete
>tutto tante volte quante sono le lingue.
>
>Esempio:
>
>====it: CANE====
>de: Hund
>en: dog
>=====en: DOG====
>it: cane
>de: Hund
>=====de: HUND====
>it: cane
>en: dog
>
>Invece che avere unicamente i pezzi indicati sotto 
>semplicemente collegati al loro giusto synset.
>
>===synset: DOG ===
>[en] dog,hound,fido [en definition] 4-legged mammal 
>[it] cane [it definition] mammifero con 4 zampe che abbaia
>[de] Hund
>
>===synset: CAT===
>[en] cat 
>[it] gatto,micio 
>[de] Katze
>...
>
>Nel momento che si avessero i collegamenti:
>
>[en] cat -> synset:CAT
>[en definition] sort of tiger, but much smaller -> synset:CAT
>[it] gatto -> synset:CAT
>[it definition] simpatico felino peloso e miagolante -> synset:CAT
>[de] Katze -> synset:CAT
>
>sarebbe banale tradurre gatto in tutte le lingue... passando per l'inglese.  :-)
>... e anche avere a portata di mano tutte le definizioni:
>questa mi sembra la via più razionale per gestire la cosa.
>
>Occupazione di spazio proporzionale ad M invece che M x M.
>
>  
>
>>Salve,
>>
>>a proposito del dizionario Wiki e del suo contenuto, in che
>>relazioni siamo con il progetto Wiktionary?
>>
>>http://it.wiktionary.org/
>>
>>(vedi ad esempio:
>>
>><url:http://it.wiktionary.org/wiki/Elettronegatività>
>>
>>)
>>
>>Il loro è ovviamente un progetto estremamente più vasto
>>(significati, traduzioni, etc), ma in qualche modo collegato al
>>nostro.
>>    
>>
>
>_______________________________________________
>dizionario mailing list
>dizionario a softwarelibero.it
>http://lists.softwarelibero.it/mailman/listinfo/dizionario
>
>
>  
>
completamente d'accordo! è molto più efficiente in termini di spazio e 
di possibilità di ricerca una struttura dati organizzata come una rete 
semantica al posto di una serie di array. Tutti i progetti più evoluti 
come Wordnet utilizzano meccanismi come questo. L'unico punto "delicato" 
della questione è il concetto di area semantica in cui le varie 
sfumature e varianti dello stesso concetto vengono espresse da diverse 
parole perchè assumono connotazioni diverse.



Maggiori informazioni sulla lista Dizionario