From gaio a sv.lnf.it Thu Oct 3 11:27:55 2002 From: gaio a sv.lnf.it (Marco Gaiarin) Date: Thu, 3 Oct 2002 11:27:55 +0200 Subject: [Dizionario] Favele In-Reply-To: <885642643.20020927224334@freemail.it> References: <108182605623.20020907131733@freemail.it> <20020927141305.GA16955@sv.lnf.it> <885642643.20020927224334@freemail.it> Message-ID: <20021003092755.GK1691@sv.lnf.it> Mandi! Giuseppe Bilotta In chel di` si favelave... > Invece secondo me proprio la combinazione di file .lang+.lex > permette di fare un generico strumento di "analisi del testo" che, > presa una parola, ne determini categoria, numero, genere, etc, > elencando tutte le possibilità. Il file .lang per l'italiano mi > sembra eccellente; se c'è qualcosa da rimpinguare, questo è il > file .lex, e qui mi vengono in mente due cose: Grazie, la cosa mi lusinga perchè veramente mi sento un buzzurro linguisticamente parlando, e la fonte da cui è stata costruita la definizione della lingua (la grammatica delle magistrali della moglie) non è sicuramente un riferimento illustre... ;))) > (1) la funzione di aggiunta automatica delle parole può aiutare a > riempire "grezzamente" il .lex, facendo una passata su testi > corretti. Questo è verissimo. Sono rimasto impressionato di come, una volta infilati nel vocabolario le cose base, una semplice motore di regexp e due regole potessero indovinare con discreta facilità e precisione tutte le parole sconosciute. > (2) "fissato" poi il .lex, favele può essere usato come: > (a) correttore ortografico Insisto, dubito che possa assolvere a questo compito efficacemente è pensato per una ricerca a prefissi che mal si lega a una correzione ortografica. Occorrerebbe rivedere le strutture dati e gli algoritmi di ricerca, perlomeno. > (b) base del motore del vocabolario e del dizionario dei > sinonimi/contrari Mmmh... ho forti dubbi anche su questo, per lo stesso motivo. > (c) correttore grammaticale (*questo* richiederà *molto* lavoro, > mi sa :)) Si, questo si ma sono vere ambedue le affermazioni. Tra l'altro io credo fermamente che non ne valga la pena, a meno di definire da subito una serie di strutture grammaticali e concentrarsi su quelle. Che so, le 10/100 forme gramjmaticali più abusate/sbagliate. > (d) strumento di predizione del testo più completo del "banale" > AutoText di OpenOffice.org Beh, questo ovviamente si. ;) > Non mi pare ci fossero dubbi sul mantenimento della forma > libreria. Anche se ad essere onesto io non sono riuscito a creare > una .dll (o equivalentemente un .so) dalla compilazione ... come > devo fare? Hem... mi hanno obbligato a usare autoconf/automake, strumenti che non ho mai digerito e che non sono mai riuscito a veder funzionare. Il problema che riscontravo nelle nuove installazioni era che per compilare aveva bisogno di se stessa. Alla fine riuscivo a compilare la libreria, non so come, e da li poi non si lamentava più. ;) Boh, ora ho provato a fare un make distclean, quindi un nuovo ./configure e vediamo... vi faccio sapere, devo reinstallare un po' di pacchetti e la connessione langue. ;) -- dott. Marco Gaiarin GNUPG Key ID: 240A3D66 Associazione ``La Nostra Famiglia'' http://www.sv.lnf.it/ Polo FVG - Via della Bontà, 7 - 33078 - San Vito al Tagliamento (PN) gaio(at)sv.lnf.it tel +39-0434-842711 fax +39-0434-842797 NO al super tributo alla SIAE! http://www.edisport.it/edisport/afdigitale/petizione.nsf/main?openframeset From oblomov a freemail.it Thu Oct 3 12:52:17 2002 From: oblomov a freemail.it (Giuseppe Bilotta) Date: Thu, 3 Oct 2002 12:52:17 +0200 Subject: [Dizionario] Favele In-Reply-To: <20021003092755.GK1691@sv.lnf.it> References: <108182605623.20020907131733@freemail.it> <20020927141305.GA16955@sv.lnf.it> <885642643.20020927224334@freemail.it> <20021003092755.GK1691@sv.lnf.it> Message-ID: <1801387635.20021003125217@freemail.it> giovedì 3 ottobre 2002 Marco Gaiarin ha scritto: >> (1) la funzione di aggiunta automatica delle parole può aiutare a >> riempire "grezzamente" il .lex, facendo una passata su testi >> corretti. MG> Questo è verissimo. Sono rimasto impressionato di come, una volta MG> infilati nel vocabolario le cose base, una semplice motore di regexp e MG> due regole potessero indovinare con discreta facilità e precisione MG> tutte le parole sconosciute. >> (2) "fissato" poi il .lex, favele può essere usato come: >> (a) correttore ortografico MG> Insisto, dubito che possa assolvere a questo compito efficacemente è MG> pensato per una ricerca a prefissi che mal si lega a una correzione MG> ortografica. Occorrerebbe rivedere le strutture dati e gli algoritmi di MG> ricerca, perlomeno. Eppure non dovrebbe essere così difficile. Salvo eccezioni, le radici non subiscono mutamenti durante la declinazione, quindi un regexp match su tutte le possibili radici, più una serie di prove per verificare la effettiva correttezza della declinazione dovrebbe funzionare. Magari la ricerca delle possibili radici può essere semplificata sfruttando l'algoritmo di ricerca per prefissi, per ridurre il numero iniziale di candidati. Sarebbe da vedere in termini di velocità questo cosa comporta. Per quanto riguarda la struttura interna dei dati, non so; ma la struttura "esterna" (file .lex) sembra ok. >> (b) base del motore del vocabolario e del dizionario dei >> sinonimi/contrari MG> Mmmh... ho forti dubbi anche su questo, per lo stesso motivo. Una volta determinato radice, genere, numero, etc il problema è solo un opportuno lookup sul dizionario dei sinonimi, e poi ri-concordare, cosa che si può sempre fare con la struttura dati di favele. >> Non mi pare ci fossero dubbi sul mantenimento della forma >> libreria. Anche se ad essere onesto io non sono riuscito a creare >> una .dll (o equivalentemente un .so) dalla compilazione ... come >> devo fare? MG> Hem... mi hanno obbligato a usare autoconf/automake, strumenti che non MG> ho mai digerito e che non sono mai riuscito a veder funzionare. MG> Il problema che riscontravo nelle nuove installazioni era che per MG> compilare aveva bisogno di se stessa. Alla fine riuscivo a compilare la MG> libreria, non so come, e da li poi non si lamentava più. ;) MG> Boh, ora ho provato a fare un make distclean, quindi un nuovo MG> ./configure e vediamo... vi faccio sapere, devo reinstallare un po' di MG> pacchetti e la connessione langue. ;) Facci sapere quando hai qualcosa :) Ovviamente, se qualcuno con più esperienza con questi strumenti vuole intervenire .. :) -- Giuseppe "Oblomov" Bilotta From gaio a sv.lnf.it Tue Oct 8 18:01:11 2002 From: gaio a sv.lnf.it (Marco Gaiarin) Date: Tue, 8 Oct 2002 18:01:11 +0200 Subject: [Dizionario] Favele In-Reply-To: <1801387635.20021003125217@freemail.it> References: <108182605623.20020907131733@freemail.it> <20020927141305.GA16955@sv.lnf.it> <885642643.20020927224334@freemail.it> <20021003092755.GK1691@sv.lnf.it> <1801387635.20021003125217@freemail.it> Message-ID: <20021008160111.GB2453@sv.lnf.it> Mandi! Giuseppe Bilotta In chel di` si favelave... > Per quanto riguarda la struttura interna dei dati, non so; ma la > struttura "esterna" (file .lex) sembra ok. Sulla struttura esterna non ho dubbi, la consideravo decente non pensavo fosse così buona. ;) > Facci sapere quando hai qualcosa :) Boh... io ho fatto make distclena; ./configure e quinid make e tutto è stato compilato correttamente. Poi non ho provato nulla, non ricordo assolutamente la macro che occorre definire per far caricare la libreria libgfavele (l'hook GTK). > Ovviamente, se qualcuno con più esperienza con questi strumenti > vuole intervenire .. :) Si, per la cronaca, non so quanto abbia senso metterlo su savannah se non ci sarà nessuno interessato a lavorarci su... ma se non lo metto non trovo ``clienti''... uffa, il solito problema, questa pubblicità maledetta... ;))) -- dott. Marco Gaiarin GNUPG Key ID: 240A3D66 Associazione ``La Nostra Famiglia'' http://www.sv.lnf.it/ Polo FVG - Via della Bontà, 7 - 33078 - San Vito al Tagliamento (PN) gaio(at)sv.lnf.it tel +39-0434-842711 fax +39-0434-842797 NO al super tributo alla SIAE! http://www.edisport.it/edisport/afdigitale/petizione.nsf/main?openframeset From oblomov a freemail.it Wed Oct 9 18:50:05 2002 From: oblomov a freemail.it (Giuseppe Bilotta) Date: Wed, 9 Oct 2002 18:50:05 +0200 Subject: [Dizionario] Favele In-Reply-To: <20021008160111.GB2453@sv.lnf.it> References: <108182605623.20020907131733@freemail.it> <20020927141305.GA16955@sv.lnf.it> <885642643.20020927224334@freemail.it> <20021003092755.GK1691@sv.lnf.it> <1801387635.20021003125217@freemail.it> <20021008160111.GB2453@sv.lnf.it> Message-ID: <1991642041.20021009185005@freemail.it> martedì 8 ottobre 2002 Marco Gaiarin ha scritto: MG> Mandi! Giuseppe Bilotta MG> In chel di` si favelave... >> Per quanto riguarda la struttura interna dei dati, non so; ma la >> struttura "esterna" (file .lex) sembra ok. MG> Sulla struttura esterna non ho dubbi, la consideravo decente non MG> pensavo fosse così buona. ;) Oh, sono certo che lo è! O per lo meno, SEMBRA :) >> Facci sapere quando hai qualcosa :) MG> Boh... io ho fatto make distclena; ./configure e quinid make e tutto è MG> stato compilato correttamente. Inclusa la libreria .so? Allora il problema potrebbe essere Mingw-specifico. Hm. >> Ovviamente, se qualcuno con più esperienza con questi strumenti >> vuole intervenire .. :) MG> Si, per la cronaca, non so quanto abbia senso metterlo su savannah se MG> non ci sarà nessuno interessato a lavorarci su... ma se non lo metto MG> non trovo ``clienti''... uffa, il solito problema, questa pubblicità MG> maledetta... ;))) Direi che è meglio metterlo su, intanto. -- Giuseppe "Oblomov" Bilotta From thatswrite a hotmail.com Fri Oct 11 18:11:50 2002 From: thatswrite a hotmail.com (thats right) Date: Fri, 11 Oct 2002 18:11:50 +0200 Subject: [Dizionario] That's Right!!!!! Message-ID: <019489798695231@hotmail.com> Your Email Client does not support MIME encoding. Please upgrade to MIME-enabled Email Client (almost every modern Email Client is MIME-capable). -------------- parte successiva -------------- Un allegato HTML è stato rimosso... URL: From dire1m219ve_e_s_1w a hotmail.com Fri Oct 11 23:19:08 2002 From: dire1m219ve_e_s_1w a hotmail.com (dire1m219ve_e_s_1w) Date: Fri, 11 Oct 02 23:19:08 Öйú±ê׼ʱ¼ä Subject: [Dizionario] adv: Email-Blaster.Newsletter Message-ID: <20021011164256.1E64A3C06B@firenze.linux.it> Un allegato HTML è stato rimosso... URL: From sales a rockwelldatacorp.com Mon Oct 21 13:27:54 2002 From: sales a rockwelldatacorp.com (Daniel James) Date: Mon, 21 Oct 2002 13:27:54 +0200 Subject: [Dizionario] Get your Website seen locally and globally Message-ID: <20021021112318.D60383C09D@firenze.linux.it> Leading web authority (UK) "85% of internet users use search engines to find the sites they want" Georgia Institute of Technology "Search engine listings are the number one way to generate traffic on websites" - WebCMO, "169,400,000 people in the US access the internet. 92% of these people query search engines" Nielsen-Netratings "The internet is an incredible marketing tool, but if your website is not submitted on a regular basis you are missing the whole point of the world wide web" Andersen Steinberg Group "Why is it that when you search for your website on many of the search engines our page simply does not come up, or comes very low down on the listings?" Quite simply your web site designer and your host are NOT responsible for getting your web site seen! No, it isn't your site. No matter how exciting your message or how perfectly you constructed your web site, if people don't know you're there they won't come. You have to get the word out quickly and consistently in order to succeed online. Yes some web designers may submit your website to a couple of search engines, but it is not their remit to proactively submit your company's website to search engines. This is a separate task all together and requires significant technical expertise to get a company registered and then in the upper tiers of search engines. You have to be put there! Search Engines are the most effective way of reaching your target audience both at local and global level. At Rockwell Data Corp we understand you want your web site listed quickly with all the major engines and directories. You want the highest possible placement for the terms your clients use when searching the Internet. Our global exposure solution provides the fast results you are looking for both locally and on a global scale. We Guarantee It! We will submit your web site to up to a minimum of 300 of the world’s leading search engines and keep on doing this during the following 12 months, to give your site and business maximum exposure both locally and globally. - to get your website both the local and global exposure it requires: We submit your website using two complex techniques to give maximum exposure. We first submit you to the world's most powerful search index powering AOL, MSN, Overture (formerly GoTo), iWON, HotBot, About.com, Anzwers, chello, c|net, Eoexchange, Espotting.com, Google, LookSmart, MobilCom, NBCi etc which enjoy 80 million queries per day. You will be indexed and listed in 48 hours, guaranteed. Then, we will proceed to submit your site to the other top engines (a minimum of 200 engines and directories) and then re-submit your site every 30 days thereafter to these. We will not submit your site to the very small engines which usually only result in masses of bulk mails to your site. Your site will be indexed in AOL, MSN, Overture (formerly GoTo), iWON, HotBot, About.com, Anzwers, chello, c|net, Eoexchange, Espotting.com, Goo, LookSmart, MobilCom, NBCi etc within 48 hours, and will be re-indexed every 48 hours thereafter for the next 12 months, to ensure your continued presence in these engines. At Rockwell Date Corp our aim is to get all our clients to the top of the search engines. Our team of qualified internet submission technicians will carefully examine your website and its html coding including the metatags and keywords, comparing them with those of the top 5 companies in your category and then professionally submit your website every month for 1 year using those metatags and keywords that will get your company in the upper tier of the search engines. We are constantly adding new engines, directories as well as regional and topical versions of existing sites to our database. Because your site is submitted each month, you will be assured of being found on these new services. World’s Leading Search Engines: We guarantee that your site will be listed and indexed in the web's top search engines (including AOL, MSN, Overture (formerly GoTo), iWON, HotBot, About.com, Anzwers, chello, c|net, Eoexchange, Espotting.com, Goo, LookSmart, MobilCom, NBCi etc and many others), serving over 82 million search requests a day, in 48 hours from when your order is processed, which occurs within 24 hours of signing up. Mass Exposure locally and globally: We guarantee that on a monthly basis your website will be submitted to a minimum of 300 of the other leading Search engines. This will commence within 24 hours or receiving you details. Monitor your sites progress: You can have peace of mind that the service is working because we guarantee that the search engines will send you through confirmation each time we submit your site. In this way you will be able to see the work we are doing on your behalf. Frequent Updates: Your web pages will be refreshed every 48 hours. This means that any change you make to your web page will be reflected in the search index within two days. You can thus modify your page to fine tune the relevancy and improve your search engine ranking. All without the need to re-submit your URL all the time. No Dropouts: Due to the 48 hour re-indexing, your website URL will remain in the leading search engine indexes for the whole 12 month subscription period. This means that there is no need to worry about having your URL dropped from the search engines, which can happen regularly with other search engine placement services. Cost Savings: Search engine placement is the most cost effective way to attract new visitors to your web site. Companies spend thousands of dollars in online advertising to attract new customers to their web sites. A well-placed search engine listing can be thousand times more cost effective in comparison to traditional banner advertising. Money back Guarantee: If we do not fulfil our commitment in the above guarantee during the 12-month period we will refund your money. To begin submitting your website all we need are your URL and e-mail address. Then within 48 hours your site will be submitted to all the worlds leading search engines. . We will do the rest! You will be amazed by the results! - in complete security - we will get your site noticed - things you should know - back to homepage -------------- parte successiva -------------- Un allegato HTML è stato rimosso... URL: From gaio a sv.lnf.it Fri Oct 25 09:53:30 2002 From: gaio a sv.lnf.it (Marco Gaiarin) Date: Fri, 25 Oct 2002 09:53:30 +0200 Subject: [Dizionario] Non sono morto... Message-ID: <20021025075330.GA1587@sv.lnf.it> ...ma ho dei problemi in famiglia. Datemi un po' di tempo e mi faccio risentire su favele, scusate. Intanto accattatevi questo, credo che la tecnologia che c'è sotto interessi. http://www.cogsci.princeton.edu/~wn/ -- dott. Marco Gaiarin GNUPG Key ID: 240A3D66 Associazione ``La Nostra Famiglia'' http://www.sv.lnf.it/ Polo FVG - Via della Bontà, 7 - 33078 - San Vito al Tagliamento (PN) gaio(at)sv.lnf.it tel +39-0434-842711 fax +39-0434-842797 Difendiamo la Legge 185/90 dall'assalto della lobby delle armi. Blocchiamo subito il disegno di legge n. 1927. http://web.vita.it/185/ http://www.retelilliput.org/petizioni/ http://www.banchearmate.it/ From oblomov a freemail.it Fri Oct 25 11:01:59 2002 From: oblomov a freemail.it (Giuseppe Bilotta) Date: Fri, 25 Oct 2002 11:01:59 +0200 Subject: [Dizionario] Non sono morto... In-Reply-To: <20021025075330.GA1587@sv.lnf.it> References: <20021025075330.GA1587@sv.lnf.it> Message-ID: <128239437.20021025110159@freemail.it> venerdì 25 ottobre 2002 Marco Gaiarin ha scritto: MG> ...ma ho dei problemi in famiglia. Spero si risolvsa tutto per il meglio. MG> Datemi un po' di tempo e mi faccio MG> risentire su favele, scusate. Io ho una mezza idea di provare un analyzer scritto in Perl che utilizzi gli stessi file di dati di favele, per vedere quanto e cosa è necessario aggiungere/cambiare. MG> Intanto accattatevi questo, credo che la tecnologia che c'è sotto MG> interessi. MG> http://www.cogsci.princeton.edu/~wn/ L'articolo "5 papers on ..." è estremamente interesante! Tra l'altro, a differenza di altri aspetti linguistici, mi sembra facilmente adattabile anche all'italiano. -- Giuseppe "Oblomov" Bilotta From andrea.sivieri a libero.it Fri Oct 25 22:01:31 2002 From: andrea.sivieri a libero.it (Andrea Sivieri) Date: Fri, 25 Oct 2002 22:01:31 +0200 Subject: [Dizionario] Non sono morto... Message-ID: <02102522013100.01703@eagle.localdomain> MG> Intanto accattatevi questo, credo che la tecnologia che c' e` sotto MG> interessi. MG> http://www.cogsci.princeton.edu/~wn/ Il bello e` che esiste gia` anche il WordNet italiano con collegamenti ponte verso quello inglese, ma ha una licenza molto restrittiva, al pari di tutti i WordNet che non siano quello originario inglese. ... e` proprio un peccato che organismi di ricerca finanziati con denaro pubblico, non rendano poi disponibili liberamente i risultati della ricerca! Ho poi visto che l'impostazione che suggerivo io in una mail passata per trattare le inflessioni e` gia` seguito da altri: http://ssdi.di.fct.unl.pt/~nmm/artigos/pap_extended.pdf Ciao, Andrea From gaio a sv.lnf.it Tue Oct 29 13:04:09 2002 From: gaio a sv.lnf.it (Marco Gaiarin) Date: Tue, 29 Oct 2002 13:04:09 +0100 Subject: [Dizionario] Favele In-Reply-To: <1991642041.20021009185005@freemail.it> References: <108182605623.20020907131733@freemail.it> <20020927141305.GA16955@sv.lnf.it> <885642643.20020927224334@freemail.it> <20021003092755.GK1691@sv.lnf.it> <1801387635.20021003125217@freemail.it> <20021008160111.GB2453@sv.lnf.it> <1991642041.20021009185005@freemail.it> Message-ID: <20021029120409.GE1861@sv.lnf.it> Mandi! Giuseppe Bilotta In chel di` si favelave... [favele] > MG> Si, per la cronaca, non so quanto abbia senso metterlo su savannah se > MG> non ci sarà nessuno interessato a lavorarci su... ma se non lo metto > MG> non trovo ``clienti''... uffa, il solito problema, questa pubblicità > MG> maledetta... ;))) > Direi che è meglio metterlo su, intanto. Ok, mi sono iscritto a savannah.nongnu.org, ho registrato il progetto con licenza LGPL tra quelli non GNU e ora aspetto l'approvazione per fare l'upload. Appena tutto è fatto vi faccio sapere. ;) -- dott. Marco Gaiarin GNUPG Key ID: 240A3D66 Associazione ``La Nostra Famiglia'' http://www.sv.lnf.it/ Polo FVG - Via della Bontà, 7 - 33078 - San Vito al Tagliamento (PN) gaio(at)sv.lnf.it tel +39-0434-842711 fax +39-0434-842797 Difendiamo la Legge 185/90 dall'assalto della lobby delle armi. Blocchiamo subito il disegno di legge n. 1927. http://web.vita.it/185/ http://www.retelilliput.org/petizioni/ http://www.banchearmate.it/