From jpmaher a neiu.edu Thu May 1 21:08:02 2003 From: jpmaher a neiu.edu (john_peter maher) Date: Thu, 01 May 2003 14:08:02 -0500 Subject: [Dizionario] indice reverso? Message-ID: <3EB17092.2218609@neiu.edu> Dove posso trovare una lista di tutti i verbi in -are? p maher chicago From gaio a sv.lnf.it Mon May 5 15:20:20 2003 From: gaio a sv.lnf.it (Marco Gaiarin) Date: Mon, 5 May 2003 15:20:20 +0200 Subject: [Dizionario] Favele/Perl e compagnia -- informazioni e richiesta di discussione In-Reply-To: <13043722609.20030419013106@freemail.it> References: <13043722609.20030419013106@freemail.it> Message-ID: <20030505132020.GO1044@sv.lnf.it> Mandi! Giuseppe Bilotta In chel di` si favelave... > Notizia principale: ho caricato Favele/Perl sul repository che è, > come sapete, accessibile dalla pagina principale su: Grazie. > (1) manipolazione di parole composte Si, mi ero fermato anche io su questa cosa, specialmente sulla questione della ricorsività. Solo che per il campo che interessava a me (word prediction) i suffissi non ho ritenuto necessario gestirli nel dizionario, anche perchè a me serviva elaborare una statistica dell'uso delle parole (nella word prediction il metodo statistico è comunque il preminente), e una parola ``liscia'' e una con il suffisso sono dal punto della statistica due parole diverse, e devono restare tali. Per i prefissi... il problema è assolutamente simile, una parola prefissata e una non prefissata sono statisticamente due parole diverse. > * come implementare la cosa a livello di *definizione* (tenendo > conto che probabilmente sarà necessario permettere una certa > ricorsività) Per i prefissi non è ad ogni modo difficile, a parte qualche controllo per evitare qulche bel loop, in teoria basta far puntare qualche nodo dell'albero nuovamente alla radice. ;) > (2) definire il concetto di "parola"; Io ho definito il concetto di non-parola, ovvero di separatore. Mi pare duale e quindi infine la stessa cosa, che c'è che non va?! -- dott. Marco Gaiarin GNUPG Key ID: 240A3D66 Associazione ``La Nostra Famiglia'' http://www.sv.lnf.it/ Polo FVG - Via della Bontà, 7 - 33078 - San Vito al Tagliamento (PN) gaio(at)sv.lnf.it tel +39-0434-842711 fax +39-0434-842797 Osservatorio sulle sporche menzogne di guerra http://www.peacelink.it/mediawatch/ From oblomov a freemail.it Mon May 5 17:36:17 2003 From: oblomov a freemail.it (Giuseppe Bilotta) Date: Mon, 5 May 2003 17:36:17 +0200 Subject: [Dizionario] Favele/Perl e compagnia -- informazioni e richiesta di discussione In-Reply-To: <20030505132020.GO1044@sv.lnf.it> References: <13043722609.20030419013106@freemail.it> <20030505132020.GO1044@sv.lnf.it> Message-ID: <5714439793.20030505173617@iol.it> lunedì 5 maggio 2003 Marco Gaiarin ha scritto: > Mandi! Giuseppe Bilotta > In chel di` si favelave... >> Notizia principale: ho caricato Favele/Perl sul repository che è, >> come sapete, accessibile dalla pagina principale su: > Grazie. Prego :) >> (1) manipolazione di parole composte > Si, mi ero fermato anche io su questa cosa, specialmente sulla > questione della ricorsività. > Solo che per il campo che interessava a me (word prediction) i suffissi > non ho ritenuto necessario gestirli nel dizionario, anche perchè a me > serviva elaborare una statistica dell'uso delle parole (nella word > prediction il metodo statistico è comunque il preminente), e una parola > ``liscia'' e una con il suffisso sono dal punto della statistica due > parole diverse, e devono restare tali. > Per i prefissi... il problema è assolutamente simile, una parola > prefissata e una non prefissata sono statisticamente due parole > diverse. Ma da un punto di vista di strumento linguistico la differenza tra parola semplice ed alcune parole composte può essere importante (specialmente per le particelle enclitiche mi/ti/si/ci/vi/ce/ne/lo/la/gli etc) >> * come implementare la cosa a livello di *definizione* (tenendo >> conto che probabilmente sarà necessario permettere una certa >> ricorsività) > Per i prefissi non è ad ogni modo difficile, a parte qualche controllo > per evitare qulche bel loop, in teoria basta far puntare qualche nodo > dell'albero nuovamente alla radice. ;) C'è anche il problema che in genere l'enclitica si può semplicemente "appiggicare", ma per alcune parole (verbi all'infinito) richiede cambiamenti sulla parola "base" (parlare -> parlarmi) o sull'enclitica (giovò -> giovommi) >> (2) definire il concetto di "parola"; > Io ho definito il concetto di non-parola, ovvero di separatore. Mi pare > duale e quindi infine la stessa cosa, che c'è che non va?! Che non permette di decidere cosa può andare solo alla fine (come il segno d'elisione) -- Giuseppe "Oblomov" Bilotta From gaio a sv.lnf.it Wed May 7 11:17:02 2003 From: gaio a sv.lnf.it (Marco Gaiarin) Date: Wed, 7 May 2003 11:17:02 +0200 Subject: [Dizionario] Favele/Perl e compagnia -- informazioni e richiesta di discussione In-Reply-To: <5714439793.20030505173617@iol.it> References: <13043722609.20030419013106@freemail.it> <20030505132020.GO1044@sv.lnf.it> <5714439793.20030505173617@iol.it> Message-ID: <20030507091702.GF758@sv.lnf.it> Mandi! Giuseppe Bilotta In chel di` si favelave... > > Grazie. > Prego :) Noncedichè... ;) > Ma da un punto di vista di strumento linguistico la differenza ...nono, hai perfettamente ragione, volevo solo ricordare per l'ennesima volta che ho pensato la struttura dati e i file di configurazione di favele *appositamente* ignorando prefissi e suffissi per i motivi esressi nella precedente mail, tutto qui. > > Io ho definito il concetto di non-parola, ovvero di separatore. Mi pare > > duale e quindi infine la stessa cosa, che c'è che non va?! > Che non permette di decidere cosa può andare solo alla fine > (come il segno d'elisione) Infatti avevo definito il concetto di separatore, e tra i separatori ho tenuto conto di quelli che sono parte della parola. Sono cioè separatori, ma venno tenuti (ovviamente alla fine) e non scartati. dal mio italiano.lang wordsep "\" ,'«»_/<>\t\n\v\r\f" phrasep ".;:!?()[]{}*-" spaceit ",;:)}]>" keepin "'" caseup ".!?" dove wordsep sono i separatori di parola, phrasep i separatori di frase (cambio del contesto), spaceit i separatori che richiedono uno spazio dopo, caseup quelli che richiedono la maiuscola dopo e keepin i separatori che sono tali ma che fanno parte della parola che li precede. -- dott. Marco Gaiarin GNUPG Key ID: 240A3D66 Associazione ``La Nostra Famiglia'' http://www.sv.lnf.it/ Polo FVG - Via della Bontà, 7 - 33078 - San Vito al Tagliamento (PN) gaio(at)sv.lnf.it tel +39-0434-842711 fax +39-0434-842797 Osservatorio sulle sporche menzogne di guerra http://www.peacelink.it/mediawatch/ From oblomov a freemail.it Wed May 7 14:29:46 2003 From: oblomov a freemail.it (Giuseppe Bilotta) Date: Wed, 7 May 2003 14:29:46 +0200 Subject: [Dizionario] Favele/Perl e compagnia -- informazioni e richiesta di discussione In-Reply-To: <20030507091702.GF758@sv.lnf.it> References: <13043722609.20030419013106@freemail.it> <20030505132020.GO1044@sv.lnf.it> <5714439793.20030505173617@iol.it> <20030507091702.GF758@sv.lnf.it> Message-ID: <404939873.20030507142946@iol.it> mercoledì 7 maggio 2003 Marco Gaiarin ha scritto: >> > Io ho definito il concetto di non-parola, ovvero di separatore. Mi pare >> > duale e quindi infine la stessa cosa, che c'è che non va?! >> Che non permette di decidere cosa può andare solo alla fine >> (come il segno d'elisione) > Infatti avevo definito il concetto di separatore, e tra i separatori ho > tenuto conto di quelli che sono parte della parola. > Sono cioè separatori, ma venno tenuti (ovviamente alla fine) e non scartati. > dal mio italiano.lang > wordsep "\" ,'«»_/<>\t\n\v\r\f" > phrasep ".;:!?()[]{}*-" > spaceit ",;:)}]>" > keepin "'" > caseup ".!?" > dove wordsep sono i separatori di parola, phrasep i separatori di frase > (cambio del contesto), spaceit i separatori che richiedono uno spazio > dopo, caseup quelli che richiedono la maiuscola dopo e keepin i > separatori che sono tali ma che fanno parte della parola che li > precede. Hai ragione, era un po' che non rivedevo l'intestazione del file e mi ero dimenticato del "keepin". -- Giuseppe "Oblomov" Bilotta