[Dizionario] Re: dizionario Digest, Vol 5, Issue 9

ML marikalo a hotmail.com
Ven 27 Ago 2004 13:22:03 CEST


Ragazzi per la manovalanza, la scelta e l'organizzazione della macro e
microstruttura del dizionario, di qualsiasi tipo di materiale o  individuare
le caatteristiche necessarie e quelle secondarie e/o superflue, io sono
sempre disponibile, (sicuramente molto di più non appena avrò consegnato
questa rogna di una tesi). Il mio limite consiste però nella comprensione
tecnica e nella successiva elaborazione, ovvero per rendervi chiaramente
l'idea dei vostri ultimi messaggi non ho compreso quasi nulla (algoritmi,
kiwi, Python etc.) dove posso trovare un glossarietto (chiaro) che mi possa
fare capire di cosa parlate? forse così potrei esservi anche più utile.
P.S.
Kiwi è 1 programma per fare le bibliografie? Se no, ne esiste 1?
A presto Marìka
----- Original Message -----
From: <dizionario-request a softwarelibero.it>
To: <dizionario a softwarelibero.it>
Sent: Friday, August 27, 2004 10:50 AM
Subject: dizionario Digest, Vol 5, Issue 9


> Send dizionario mailing list submissions to
> dizionario a softwarelibero.it
>
> To subscribe or unsubscribe via the World Wide Web, visit
> http://lists.softwarelibero.it/mailman/listinfo/dizionario
> or, via email, send a message with subject or body 'help' to
> dizionario-request a softwarelibero.it
>
> You can reach the person managing the list at
> dizionario-owner a softwarelibero.it
>
> When replying, please edit your Subject line so it is more specific
> than "Re: Contents of dizionario digest..."
>
>
> Today's Topics:
>
>    1. Re: Nasce laboratorio.sempreverdi.net! (Andrea Sivieri)
>    2. Re: Nasce laboratorio.sempreverdi.net! (Paolo Mascellani)
>    3. Re: Nasce laboratorio.sempreverdi.net! (Andrea Sivieri)
>    4. A priori (Andrea Sivieri)
>    5. Re: A priori (Paolo Mascellani)
>    6. Re: A priori (Andrea Sivieri)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Thu, 26 Aug 2004 18:29:19 +0200
> From: Andrea Sivieri <andrea.sivieri a sempreverdi.net>
> Subject: Re: [Dizionario] Nasce laboratorio.sempreverdi.net!
> To: Lista del Progetto Dizionario Libero
> <dizionario a softwarelibero.it>
> Message-ID: <200408261829.19421.andrea.sivieri a sempreverdi.net>
> Content-Type: text/plain;  charset="iso-8859-1"
>
> > Provero` a pubblicizzare la cosa presso alcuni amici che si
> > occupano di linguistica computazionale. Magari anche altri possono
> > fare lo stesso.
> >
> > Ciao, Paolo.
>
> Certo!  :)
>
> La ricerca internazionale ha di sicuro pubblicato
> qualche paper su questo argomento.
>
> Sarebbe bello riuscire a raccogliere un po' di link
> agli ultimi risultati disponibili (disponibili nel senso
> che siano raggiungibili pubblicamente su internet).
>
> E' questo:
http://fuzzy.cs.uni-magdeburg.de/~borgelt/doc/apriori/apriori.html
> il genere di tecnica che hai seguito nel tuo esperimento?
>
> In caso affermativo potremmo aggiungere un collegamento alla pagina...
>
> Ciao, Andrea
>
>
>
>
> ------------------------------
>
> Message: 2
> Date: Thu, 26 Aug 2004 18:19:27 +0200
> From: Paolo Mascellani <paolo a elabor.homelinux.org>
> Subject: Re: [Dizionario] Nasce laboratorio.sempreverdi.net!
> To: Lista del Progetto Dizionario Libero
> <dizionario a softwarelibero.it>
> Message-ID: <412E0D8F.5080502 a elabor.homelinux.org>
> Content-Type: text/plain; charset=us-ascii; format=flowed
>
> Caro Andrea,
>
> >>Provero` a pubblicizzare la cosa presso alcuni amici che si
> >>occupano di linguistica computazionale. Magari anche altri possono
> >>fare lo stesso.
> >
> > La ricerca internazionale ha di sicuro pubblicato
> > qualche paper su questo argomento.
> >
> > Sarebbe bello riuscire a raccogliere un po' di link
> > agli ultimi risultati disponibili (disponibili nel senso
> > che siano raggiungibili pubblicamente su internet).
>
> Certo, ma si tratterebbe quantomeno di una tesina ed io non riesco
> proprio a farlo (oltre a non averne la competenza). La mia speranza e'
> che qualcuno decida di metterci a lavorare un laureando o un dottprando.
>
> > E' questo:
http://fuzzy.cs.uni-magdeburg.de/~borgelt/doc/apriori/apriori.html
> > il genere di tecnica che hai seguito nel tuo esperimento?
> >
> > In caso affermativo potremmo aggiungere un collegamento alla pagina...
>
> Mi pare che il link che hai trovato si riferisca al miglioramento (ne
> sono stati fatti diversi per quel che ne so) dell'algoritmo originale,
> di Agrawal. Come puoi vedere, non si tratta per nulla di un algoritmo
> relativo alla linguistica computazionale, ma afferisce al cosiddetto
> "knowledge discovery in databases", la cui comunita` e`, a mio parere,
> molto piu` aperta di quella del "natural languages processing".
>
> Io, a suo tempo, avevo avuto l'idea di applicare questo algoritmo
> (quello base: i miglioramenti successivi sono molto tecnici e non
> cambiano la qualita` dei risultati, ma solo l'efficienza e a me
> interessava intanto capire se l'idea era buona), con qualche modifica,
> alla ricerca di regole grammaticali. L'esperimento dette risultati
> incoraggianti, ma ancora molto preliminari, dopo di che ebbi altro da
> fare ...
>
> Non so se mettere il link che indichi tu sia una buona idea, in quanto
> la versione dell'algoritmo da me utilizzata e` molto meno sofisticata e,
> sostanzialmente, ne condivide solo l'idea di base. Potrebbe aver senso,
> come dicevi prima, fare una bibliografia ragionata in cui,
> eventualmente, inserire anche questo link, ma ...
>
> Se si trova un volontario per fare queste cose, gli posso dare il mio
> (scarso) supporto.
>
> Nel frattempo, ho scritto alle persone con cui avevo interagito a suo
> tempo per vedere se sono interessati.
>
> Ciao, Paolo.
>
> --
> Paolo Mascellani
> METAware spa - p.mascellani a metaware.it
> Margherita onLine - paolomascellani a margheritaonline.it
> eLabor scrl - paolo a elabor.homelinux.org
> via G. Garibaldi 33, 56127 Pisa - tel. 050 098 0888 - fax 050 313 7878
> http://elabor.homelinux.org - info a elabor.homelinux.org
>
>
>
> ------------------------------
>
> Message: 3
> Date: Thu, 26 Aug 2004 20:21:47 +0200
> From: Andrea Sivieri <andrea.sivieri a sempreverdi.net>
> Subject: Re: [Dizionario] Nasce laboratorio.sempreverdi.net!
> To: Lista del Progetto Dizionario Libero
> <dizionario a softwarelibero.it>
> Message-ID: <200408262021.47479.andrea.sivieri a sempreverdi.net>
> Content-Type: text/plain;  charset="iso-8859-1"
>
> > >>Provero` a pubblicizzare la cosa presso alcuni amici che si
> > >>occupano di linguistica computazionale. Magari anche altri
> > >> possono fare lo stesso.
> > >
> > > La ricerca internazionale ha di sicuro pubblicato
> > > qualche paper su questo argomento.
> > >
> > > Sarebbe bello riuscire a raccogliere un po' di link
> > > agli ultimi risultati disponibili (disponibili nel senso
> > > che siano raggiungibili pubblicamente su internet).
> >
> > Certo, ma si tratterebbe quantomeno di una tesina ed io non riesco
> > proprio a farlo (oltre a non averne la competenza). La mia speranza
> > e' che qualcuno decida di metterci a lavorare un laureando o un
> > dottprando.
>
> Scusa, scrivendo in fretta avevo espresso male quello che intendevo.
>
> Intendevo che io, tu, i tuoi amici, altri ancora, senza la pretesa di
> fare una tesi compiuta, anzi senza alcuna pretesa, potremmo intanto
> ammassare i collegamenti utili riguardo a questo argomento.
>
> Sono sicuro che poi con il tempo, grazie al meccanismo del wiki,
> si auto-organizzerebbero da soli in una forma più ordinata e
> magari qualche informatico che passa, così, per passatempo,
> farà altri esperimenti ancora.
>
> Se inizierò ad avere abbastanza spunti sull'argomento (e un po' di tempo)
> magari qualche esperimento in Python lo farò anche io!  :-)
>
> Tu cosa avevi usato come analizzatore morfologico per il latino?
> Sai di analizzatori morfologici per l'inglese?
>
> > > E' questo:
> > > http://fuzzy.cs.uni-magdeburg.de/~borgelt/doc/apriori/apriori.htm
> > >l il genere di tecnica che hai seguito nel tuo esperimento?
> > >
> > > In caso affermativo potremmo aggiungere un collegamento alla
> > > pagina...
> >
> > Mi pare che il link che hai trovato si riferisca al miglioramento
> > (ne sono stati fatti diversi per quel che ne so) dell'algoritmo
> > originale, di Agrawal. Come puoi vedere, non si tratta per nulla di
> > un algoritmo relativo alla linguistica computazionale, ma afferisce
> > al cosiddetto "knowledge discovery in databases", la cui comunita`
> > e`, a mio parere, molto piu` aperta di quella del "natural
> > languages processing".
>
> Si, dovremmo mettere un link alla descrizione della versione base
dell'algoritmo.
>
> Intanto probabilmente possiamo partire con questo:
> http://en.wikipedia.org/wiki/A_priori_algorithm
>
> Poi magari da altri parti è spiegato in modo più esteso e semplice da
seguire...
> o qualcuno su Wikipedia un giorno spiegherà passo passo con degli esempi
> cosa fa quello pseudo-codice!  :-)
>
> > Io, a suo tempo, avevo avuto l'idea di applicare questo algoritmo
> > (quello base: i miglioramenti successivi sono molto tecnici e non
> > cambiano la qualita` dei risultati, ma solo l'efficienza e a me
> > interessava intanto capire se l'idea era buona), con qualche
> > modifica, alla ricerca di regole grammaticali. L'esperimento dette
> > risultati incoraggianti, ma ancora molto preliminari, dopo di che
> > ebbi altro da fare ...
>
> L'idea è molto interessante!  :-)
>
> > Non so se mettere il link che indichi tu sia una buona idea, in
> > quanto la versione dell'algoritmo da me utilizzata e` molto meno
> > sofisticata e, sostanzialmente, ne condivide solo l'idea di base.
> > Potrebbe aver senso, come dicevi prima, fare una bibliografia
> > ragionata in cui, eventualmente, inserire anche questo link, ma ...
> >
> > Se si trova un volontario per fare queste cose, gli posso dare il
> > mio (scarso) supporto.
>
> In questo momento siamo solo una manciata di persone,
> ma con il tempo ci sarà la massa critica...
> per trascrivere tutto il Melzi!  :-)
> per raccogliere molte risorse anche sugli analizzatori grammaticali!  :-)
>
> Non credo però avremo presto un volontario votato completamente
> a questo, per cui tutti noi mano a mano che troveremo informazioni
> utili le aggiungeremo alle varie pagine...
>
> Servirà un po' di tempo poi perchè da ammasso di link la cosa
> si trasformi in una... bibliografia ragionata. Ma succederà!  :-)
>
> Pensa che è da qualche anno che si parlava di trascrivere un dizionario ed
è
> appena ora che iniziamo ad avere i mezzi e la convizione per farlo
effettivamente!
>
> > Nel frattempo, ho scritto alle persone con cui avevo interagito a
> > suo tempo per vedere se sono interessati.
>
> Grazie! Le porte sono aperte e saremo onorati di avere anche la loro
collaborazione!  :-)
> (ehm... se sono interessati, come giustamente dici)
>
> Ciao, Andrea
>
>
>
>
> ------------------------------
>
> Message: 4
> Date: Thu, 26 Aug 2004 20:30:39 +0200
> From: Andrea Sivieri <andrea.sivieri a sempreverdi.net>
> Subject: [Dizionario] A priori
> To: Lista del Progetto Dizionario Libero
> <dizionario a softwarelibero.it>
> Message-ID: <200408262030.39179.andrea.sivieri a sempreverdi.net>
> Content-Type: text/plain;  charset="iso-8859-1"
>
> Ah, ecco, qui è spiegato molto meglio!  :-)
>
> http://mega.ist.utl.pt/~ic-apr/documentos/agrawal_vldb94.pdf
>
> Dovevo in qualche modo togliermi la curiosità...  ;-)
>
> Ciao, Andrea
>
>
>
> ------------------------------
>
> Message: 5
> Date: Fri, 27 Aug 2004 09:37:00 +0200
> From: Paolo Mascellani <paolo a elabor.homelinux.org>
> Subject: Re: [Dizionario] A priori
> To: Lista del Progetto Dizionario Libero
> <dizionario a softwarelibero.it>
> Message-ID: <412EE49C.1080104 a elabor.homelinux.org>
> Content-Type: text/plain; charset=ISO-8859-1; format=flowed
>
> Ciao Andrea,
>
> > Ah, ecco, qui è spiegato molto meglio!  :-)
> >
> > http://mega.ist.utl.pt/~ic-apr/documentos/agrawal_vldb94.pdf
> >
> > Dovevo in qualche modo togliermi la curiosità...  ;-)
>
> Vedo che ti stai appassionando ...
>
> In realta` anche in questo lavoro (peccato che sia in pdf: e` meno
> fruibile) si descrive un miglioramento dell'algoritmo originale, che e`
> comunque descritto nella prima parte. La descrizione dell'algoritmo
> originale e` piu` che sufficiente per capire quello che ho fatto io: in
> pratica, basta capire l'idea che ci sta sotto e cioe` che se
> l'associazione di n fatti elementari non ha abbastanza supporto allora
> non lo avranno neppure le associazioni di piu` fatti elementari che
> contengano tali n. Il gioco poi consiste nel definire cosa sono i fatti
> elementari ed il supporto nel nostro caso ...
>
> Credo che approfondire i (grossi) miglioramenti che sono stati fatti
> rispetto all'algoritmo originale, cosi` come studiare altri algoritmi
> (ad esempio quelli proposti da Jiawei Han, sempre per regole
> associative), allo stato del mio esperimento, non ha senso; il punto e`
> capire se:
>
> 1 - le regole associative di tipo grammaticale possono essere dedotte da
> questo principio (l'esperimento fatto suggerisce di si`, ma e` ancora
> troppo preliminare per poterlo sostenere);
>
> 2 - esse possono poi servire per discriminare frasi corrette da frasi
> scorrette.
>
> Se queste due domande avranno risposta positiva allora si potra` pensare
> a migliorare l'algoritmo o a studiarne altri. Dobbiamo pensare a questa
> fase come ad una fase di ricerca, non di applicazione, per questo mi
> piacerebbe che intervenissero dei ricercatori.
>
> Discorso diverso sarebbe se qualcuno che ha gia` risultati disponibili
> sulla correzione grammaticale li mettesse a disposizione.
>
> > Se inizierò ad avere abbastanza spunti sull'argomento (e un po' di
tempo)
> > magari qualche esperimento in Python lo farò anche io!  :-)
>
> Benissimo. Io ti posso passare i miei sorgenti Java.
>
> > Tu cosa avevi usato come analizzatore morfologico per il latino?
>
> Me lo sono costruito io, in modo un po' rocambolesco e forse non del
> tutto legale (anche se non credo che qualcuno possa vantare dei diritti
> sulla grammatica latina), relativamente alle sole parole che componevano
> il centinaio di frasi su cui ho fatto l'esperimento. Su questo aspetto
> tendo ad essere un po' reticente in lista ...
>
> > Sai di analizzatori morfologici per l'inglese?
>
> Non lo so proprio, ma credo che cercando ci si arrivi e che, almeno fino
> a che si rimane a livello di ricerca, si possano utilizzare i metodi un
> po' sbrigativi che ho utilizzato per il Latino.
>
> Ciao, Paolo.
>
> --
> Paolo Mascellani
> METAware spa - p.mascellani a metaware.it
> Margherita onLine - paolomascellani a margheritaonline.it
> eLabor scrl - paolo a elabor.homelinux.org
> via G. Garibaldi 33, 56127 Pisa - tel. 050 098 0888 - fax 050 313 7878
> http://elabor.homelinux.org - info a elabor.homelinux.org
>
>
>
> ------------------------------
>
> Message: 6
> Date: Fri, 27 Aug 2004 11:43:41 +0200
> From: Andrea Sivieri <andrea.sivieri a sempreverdi.net>
> Subject: Re: [Dizionario] A priori
> To: Lista del Progetto Dizionario Libero
> <dizionario a softwarelibero.it>
> Message-ID: <200408271143.41563.andrea.sivieri a sempreverdi.net>
> Content-Type: text/plain;  charset="iso-8859-1"
>
> > Vedo che ti stai appassionando ...
>
> In effetti si  :-)
>
> > In realta` anche in questo lavoro (peccato che sia in pdf: e` meno
> > fruibile) si descrive un miglioramento dell'algoritmo originale,
> > che e` comunque descritto nella prima parte. La descrizione
> > dell'algoritmo originale e` piu` che sufficiente per capire quello
> > che ho fatto io: in pratica, basta capire l'idea che ci sta sotto e
> > cioe` che se l'associazione di n fatti elementari non ha abbastanza
> > supporto allora non lo avranno neppure le associazioni di piu`
> > fatti elementari che contengano tali n. Il gioco poi consiste nel
> > definire cosa sono i fatti elementari ed il supporto nel nostro
> > caso ...
> >
> > Credo che approfondire i (grossi) miglioramenti che sono stati
> > fatti rispetto all'algoritmo originale, cosi` come studiare altri
> > algoritmi (ad esempio quelli proposti da Jiawei Han, sempre per
> > regole associative), allo stato del mio esperimento, non ha senso;
> > il punto e` capire se:
> >
> > 1 - le regole associative di tipo grammaticale possono essere
> > dedotte da questo principio (l'esperimento fatto suggerisce di si`,
> > ma e` ancora troppo preliminare per poterlo sostenere);
> >
> > 2 - esse possono poi servire per discriminare frasi corrette da
> > frasi scorrette.
> >
> > Se queste due domande avranno risposta positiva allora si potra`
> > pensare a migliorare l'algoritmo o a studiarne altri. Dobbiamo
> > pensare a questa fase come ad una fase di ricerca, non di
> > applicazione, per questo mi piacerebbe che intervenissero dei
> > ricercatori.
>
> Certo!
>
> > Discorso diverso sarebbe se qualcuno che ha gia` risultati
> > disponibili sulla correzione grammaticale li mettesse a
> > disposizione.
> >
> > > Se inizierò ad avere abbastanza spunti sull'argomento (e un po'
> > > di tempo) magari qualche esperimento in Python lo farò anche io!
> > > :-)
> >
> > Benissimo. Io ti posso passare i miei sorgenti Java.
>
> Si, grazie, se me li passi li guardo nel fine settimana
> e cerco di capire come hai adattato un algoritmo
> che lavora su insiemi non ordinati ad un problema
> in cui l'ordine pare rilevante...
>
> > > Tu cosa avevi usato come analizzatore morfologico per il latino?
> >
> > Me lo sono costruito io, in modo un po' rocambolesco e forse non
> > del tutto legale (anche se non credo che qualcuno possa vantare dei
> > diritti sulla grammatica latina), relativamente alle sole parole
> > che componevano il centinaio di frasi su cui ho fatto
> > l'esperimento. Su questo aspetto tendo ad essere un po' reticente
> > in lista ...
> >
> > > Sai di analizzatori morfologici per l'inglese?
> >
> > Non lo so proprio, ma credo che cercando ci si arrivi e che, almeno
> > fino a che si rimane a livello di ricerca, si possano utilizzare i
> > metodi un po' sbrigativi che ho utilizzato per il Latino.
> >
> > Ciao, Paolo.
>
> Trovato ieri sera qualche collegamento utile a proposito
> (vedi in particolare sezione taggers):
>
> http://laboratorio.sempreverdi.net/wiki/grammatica_risorse_web
>
> L'approccio basato su algoritmi genetici, mi pare particolarmente
> interessante e anche abbastanza facile da implementare...
> (Come miglioramento e per velocizzare la cosa, gli si potrebbe
> fornire un insieme fisso vincolato di regole fatte a mano semplici e
> su cui si è sicuri e lassargli costruire tutte le altre. Con questa
tecnica
> magari si riesce sia ad evolvere una grammatica abbastanza
> comprensibile ad umani, sia a coprire il 95% di tutti i casi
> possibili immaginabili...  :-)
>
> Ciao, Andrea
>
>
>
>
>
> ------------------------------
>
> _______________________________________________
> dizionario mailing list
> dizionario a softwarelibero.it
> http://lists.softwarelibero.it/mailman/listinfo/dizionario
>
>
> End of dizionario Digest, Vol 5, Issue 9
> ****************************************
>



Maggiori informazioni sulla lista Dizionario