From mirko a lilik.dmti.unifi.it Wed May 1 01:21:04 2002 From: mirko a lilik.dmti.unifi.it (Mirko Maischberger) Date: 01 May 2002 01:21:04 +0200 Subject: [Dizionario] Divisione del file dei vocaboli, ed inserimento del tutto su CVS. In-Reply-To: <1020160296.27788.6.camel@havnor.centrohl.it> References: <1020008077.12844.22.camel@havnor.centrohl.it> <1020071348.12811.40.camel@havnor.centrohl.it> <1020101163.12811.96.camel@havnor.centrohl.it> <20020429202213.B3688@lilik.dmti.unifi.it> <1020160296.27788.6.camel@havnor.centrohl.it> Message-ID: <1020208865.1236.4.camel@penelope> Il mar, 2002-04-30 alle 11:51, Simone Piccardi ha scritto: > > Io scarico il cvs (sola lettura :( ) e poi? Cosa faccio nelle pause > > di lavoro libere dalla traduzione di fetchmail? > Se vuoi l'accesso scrivi a cgabriel, mandagli una coppia > username/password(crittata), quest'ultima la ottieni con il comando > crypt del perl, ad esempio. Prima di poter scrivere volevo che mi chiarissi meglio cosa hai fatto e cosa intendi fare e che mi assegnassi una parte di lavoro. Appena avro` qualcosa da inserire in cvs parleremo anche dell'accesso, ma ancora mi sembra presto. Assegnami un pezzetto da curare... -- 1024D/5B35D286 Mirko Maischberger From mirko a lilik.dmti.unifi.it Wed May 1 19:59:34 2002 From: mirko a lilik.dmti.unifi.it (Mirko Maischberger) Date: 01 May 2002 19:59:34 +0200 Subject: [Dizionario] Divisione del file dei vocaboli, ed inserimento del tutto su CVS. In-Reply-To: <1020160630.27791.14.camel@havnor.centrohl.it>; from piccardi@firenze.linux.it on Tue, Apr 30, 2002 at 11:57:09AM +0200 References: <1020008077.12844.22.camel@havnor.centrohl.it> <1020071348.12811.40.camel@havnor.centrohl.it> <1020101163.12811.96.camel@havnor.centrohl.it> <20020429202544.C3688@lilik.dmti.unifi.it> <1020160630.27791.14.camel@havnor.centrohl.it> Message-ID: <1020275974.847.43.camel@penelope> Simone Piccardi il 2002/04/30 11:57:09 +0200: |Pero` cosi` mi toccava scrivere V1 ecc. circa 7000 volte, un po' pallosa |come cosa, mentre adesso faccio dei semplici cut&paste col mouse da due |finestre. E` che io il mouse non lo uso mai :] |Non credo che CVS si lamenti poi troppo se ci mettiamo su qualche file. No, no, infatti, dicevo solo che cvs sembrava fatto apposta per gestire la cosa senza bisogno di avere piu` file, non che non si trovi a proprio agio con milioni di file. Ossia che se la sarebbe cavata bene anche con un solo file e mi sembrava piu` semplice, ma concordo che sia solo questione di gusti. |E ottenere un file con quelle caratteristiche e` comunque banale (ma a |questo punto tanto vale farlo con gli affissi). Sì, infatti mi riferivo alla classificazione. |Anzi, appena ho finito le divisioni penso che lemmi.txt e noverb.txt |spariranno (tanto basta un cat | sort per rigenerarli). ok, capito. -- 1024D/5B35D286 Mirko Maischberger From piccardi a firenze.linux.it Thu May 2 10:15:53 2002 From: piccardi a firenze.linux.it (Simone Piccardi) Date: 02 May 2002 10:15:53 +0200 Subject: [Dizionario] Divisione del file dei vocaboli, ed inserimento del tutto su CVS. In-Reply-To: <1020275974.847.43.camel@penelope> References: <1020008077.12844.22.camel@havnor.centrohl.it> <1020071348.12811.40.camel@havnor.centrohl.it> <1020101163.12811.96.camel@havnor.centrohl.it> <20020429202544.C3688@lilik.dmti.unifi.it> <1020160630.27791.14.camel@havnor.centrohl.it> <1020275974.847.43.camel@penelope> Message-ID: <1020327356.8898.1.camel@havnor.centrohl.it> On Wed, 2002-05-01 at 19:59, Mirko Maischberger wrote: > Simone Piccardi il 2002/04/30 11:57:09 +0200: > |Pero` cosi` mi toccava scrivere V1 ecc. circa 7000 volte, un po' pallosa > |come cosa, mentre adesso faccio dei semplici cut&paste col mouse da due > |finestre. > > E` che io il mouse non lo uso mai :] Beh, per una cosa del genere il cut&aste alla X e` fantastico; non devi mai toccare la tastiera. Per il resto tendo anche io a pensarla come te ... Ciao Simone -- Cio' che contraddistingue l'uomo e' la capacita' di farsi domande, cio' che contraddistingue il saggio e' il non accontentarsi delle risposte. From gaio a sv.lnf.it Thu May 2 13:03:35 2002 From: gaio a sv.lnf.it (Marco Gaiarin) Date: Thu, 2 May 2002 13:03:35 +0200 Subject: [Dizionario] Divisione del file dei vocaboli, ed inserimento del tutto su CVS. In-Reply-To: <1020008077.12844.22.camel@havnor.centrohl.it>; from piccardi@firenze.linux.it on Sun, Apr 28, 2002 at 05:34:37PM +0200 References: <1020008077.12844.22.camel@havnor.centrohl.it> Message-ID: <20020502130335.B1969@sv.lnf.it> Mandi! Simone Piccardi In chel di` si favelave... > mi scuso di nuovo per la relativa latitanza, ma avendo trovato un po' di > tempo sono riuscito a rimettere insieme i file coi vocaboli e quello di > affissi. Finalmente ho recuperato anche io i miei file da favele, che in pratica sono la stessa cosa in un altro formato. Allego la definizione della lingua italiana, se serve spiego ma è abbastanza facile, e il dizionario con la classificazione, che ho verificato con sincera accuratezza, per quanto accurato possa essere un perito informatico. ;) -- dott. Marco Gaiarin Associazione ``La Nostra Famiglia'' http://www.sv.lnf.it/ Polo FVG - Via della Bontà, 7 - 33078 - San Vito al Tagliamento (PN) gaio(at)sv.lnf.it tel +39-0434-842711 fax +39-0434-842797 Supporta il disegno di legge sul software libero! http://www.softwarelibero.it/news/news020417_01.shtml -------------- parte successiva -------------- Un allegato non testuale è stato rimosso.... Nome: italiano.lang.gz Tipo: application/octet-stream Dimensione: 5945 bytes Descrizione: non disponibile URL: -------------- parte successiva -------------- Un allegato non testuale è stato rimosso.... Nome: italiano.lex.gz Tipo: application/octet-stream Dimensione: 20629 bytes Descrizione: non disponibile URL: From piccardi a firenze.linux.it Thu May 2 13:14:20 2002 From: piccardi a firenze.linux.it (Simone Piccardi) Date: 02 May 2002 13:14:20 +0200 Subject: [Dizionario] Divisione del file dei vocaboli, ed inserimento del tutto su CVS. In-Reply-To: <1020208865.1236.4.camel@penelope> References: <1020008077.12844.22.camel@havnor.centrohl.it> <1020071348.12811.40.camel@havnor.centrohl.it> <1020101163.12811.96.camel@havnor.centrohl.it> <20020429202213.B3688@lilik.dmti.unifi.it> <1020160296.27788.6.camel@havnor.centrohl.it> <1020208865.1236.4.camel@penelope> Message-ID: <1020338060.11405.44.camel@havnor.centrohl.it> On Wed, 2002-05-01 at 01:21, Mirko Maischberger wrote: > Prima di poter scrivere volevo che mi chiarissi meglio cosa hai fatto e > cosa intendi fare e che mi assegnassi una parte di lavoro. Appena avro` > qualcosa da inserire in cvs parleremo anche dell'accesso, ma ancora mi > sembra presto. Assegnami un pezzetto da curare... Ci provo... L'idea era di creare un file di lemmi (il vecchio lemmi.txt) che contenesse solo le radici. Per questo nel file c'erano solo verbi all'infinito, sostantivi singolari (maschili), aggettivi singolari (maschili). Per il momento la mia idea e` stata quella di suddividere il file unico in tanti file piu` piccoli, secondo una classificazione elementare (suggerimenti per migliorarla sono bene accetti) che renda poi molto facile generare un file con affissi per ispell, semplicemente attaccando lo stesso affisso a tutte le parole di ciascun file. Inoltre avendo file separati in maniera logica mi viene piu` facile riconscere eventuali errori (sia di classificazione che ortografici). Alla fine si dovrebbero avere una serie di file associando a ciascuno dei quali un affisso si dovrebbe poter ottenere velocemente un file per ispell. A quel punto si dovrebbe poter generare un file di vocaboli molto piu` ampio da confrontare con i propri dizionari personali. Con una cosa come: $ cat vocabolario.txt ~/.ispell_default | sort | uniq| > temp.txt $ diff temp.txt vocabolario.txt > diff.txt si otterrebbero le differenze, che poi potrebbero essere integrate velocemente (ricoscendo la opportuna radice, ed infilandola nel file giusto). Per questo a partire da alcune divisione banali (come grep are$ lemmi.txt > verbi_are.txt) ho riclassificato le parole nel segente schema: verbi_are.txt verbi che finiscono in are (epurando le parole come solare, che non sono verbi). verbi_ere.txt verbi che finiscono in ere (con la solita epurazione) verbi_ire.txt verbi che finiscono in ire " verbi_rre.txt verbi che finiscono in rre " riflessivi.txt verbi che finiscono in rsi Da questo ho pure generato un file (duplicati.txt, ma il nome andra` migliorato) di parole che sono sia un verbo che altro (tipo militare). Cosa resta da fare qui: 1) dividere i verbi fra regolari ed irregolari 2) gestire meglio i riflessivi, nel senso che dal punto di vista degli affissi sono semplicemente verbi come gli altri con in piu`, la forma -rsi all'infinito (e, per un sottoinsieme, senza quella regolare, che sono poi quelli che ho cercato di mettere dentro riflessivi.txt). 3) trovare altre e migliori divisioni (se ci sono). Per tutto quello che non sono verbi ho effettuato la ulteriore divisione: nomi.txt sostantivi aggettivi.txt aggettivi altri.txt tutto quello che a prima vista non mi rientrava nei precedenti Con questi tre file si rigenera noverb.txt (che era il file che conteneva tutto quello che non erano verbi). Inoltre ho messo in agg-nomi.txt gli aggettivi che sono anche un sostantivo. Questa e` ancora tutta da verificare. I lavori possibili sono dunque: 1) verifica della divisione (e` stata fatta in fretta) 2) suddivisione ulteriore dei nomi: maschili femminili altro altri criteri? 3) divisione degli aggettivi: che finiscono in o (ed in genere fanno o/a/e/i) che finscono in e (e vanno in e/i) che finiscono in a (e fanno a/i o a/e/i) invarianti (tipo blu). 4) classificazione degli altri 5) eventuali suddivisioni ulteriori (tipo mettere a parte i nomi di citta` e stati). Il criterio generale che ho usato finora e` che i file devono essere complementari, cosi' che si possa riottere un lemmi .txt con un semplice: cat .... | sort > lemmi.txt quando ho ottenuto cose che stavano su piu` categorie le ho sempre messe su altri file. Sul cosa fare: della divisione degli aggettivi me ne sto (come forse si nota) occupando io, sono comunque bene accetti suggerimenti ed idee. Tutto il resto e` a disposizione dei volenterosi. Ciao Simone -- Cio' che contraddistingue l'uomo e' la capacita' di farsi domande, cio' che contraddistingue il saggio e' il non accontentarsi delle risposte. From mirko a lilik.dmti.unifi.it Thu May 2 21:01:50 2002 From: mirko a lilik.dmti.unifi.it (Mirko Maischberger) Date: Thu, 2 May 2002 21:01:50 +0200 Subject: [Dizionario] Divisione del file dei vocaboli, ed inserimento del tutto su CVS. In-Reply-To: <1020338060.11405.44.camel@havnor.centrohl.it>; from piccardi@firenze.linux.it on Thu, May 02, 2002 at 01:14:20PM +0200 References: <1020008077.12844.22.camel@havnor.centrohl.it> <1020071348.12811.40.camel@havnor.centrohl.it> <1020101163.12811.96.camel@havnor.centrohl.it> <20020429202213.B3688@lilik.dmti.unifi.it> <1020160296.27788.6.camel@havnor.centrohl.it> <1020208865.1236.4.camel@penelope> <1020338060.11405.44.camel@havnor.centrohl.it> Message-ID: <20020502210149.A12466@lilik.dmti.unifi.it> |verbi_are.txt verbi che finiscono in are (epurando le parole come | solare, che non sono verbi). |1) dividere i verbi fra regolari ed irregolari | |Tutto il resto e` a disposizione dei volenterosi. Io per adesso comincerei a dividere i verbi regolari della prima in un file a parte, ok? -- 1024D/5B35D286 Mirko Maischberger From piccardi a firenze.linux.it Fri May 3 10:13:10 2002 From: piccardi a firenze.linux.it (Simone Piccardi) Date: 03 May 2002 10:13:10 +0200 Subject: [Dizionario] Divisione del file dei vocaboli, ed inserimento del tutto su CVS. In-Reply-To: <20020502210149.A12466@lilik.dmti.unifi.it> References: <1020008077.12844.22.camel@havnor.centrohl.it> <1020071348.12811.40.camel@havnor.centrohl.it> <1020101163.12811.96.camel@havnor.centrohl.it> <20020429202213.B3688@lilik.dmti.unifi.it> <1020160296.27788.6.camel@havnor.centrohl.it> <1020208865.1236.4.camel@penelope> <1020338060.11405.44.camel@havnor.centrohl.it> <20020502210149.A12466@lilik.dmti.unifi.it> Message-ID: <1020413590.18528.0.camel@havnor.centrohl.it> On Thu, 2002-05-02 at 21:01, Mirko Maischberger wrote: > |verbi_are.txt verbi che finiscono in are (epurando le parole come > | solare, che non sono verbi). > |1) dividere i verbi fra regolari ed irregolari > | > |Tutto il resto e` a disposizione dei volenterosi. > > Io per adesso comincerei a dividere i verbi regolari della prima > in un file a parte, ok? Ok! Ciao Simone -- Cio' che contraddistingue l'uomo e' la capacita' di farsi domande, cio' che contraddistingue il saggio e' il non accontentarsi delle risposte. From mirko a lilik.dmti.unifi.it Sat May 4 14:20:23 2002 From: mirko a lilik.dmti.unifi.it (Mirko Maischberger) Date: 04 May 2002 14:20:23 +0200 Subject: [Dizionario] Verbi con dittongo nelle forme rizotoniche Message-ID: <1020514824.2534.37.camel@penelope> Ciao, ho suddiviso la prima coniugazione in verbi in -gare/-care verbi in -gnare, in -ciare/-giare, -gliare, -iare, messo da parte pochi irregolari e tenuto gli altri in un file di rimasugli. Non so bene come dividere le forme in -iare rizotoniche da quelle rizoatone, ma in fondo sono solo 81 e potrei cercare di raggrupparli manualmente. Ho poi un forte dubbio che vi espongo. Il Serianni riporta che i verbi all'oggetto tendono a perdere il dittongo nelle forme rizoatone e cita al proposito: suona/sonava, siede/sedeva, tiene/teneva. Noi come ci orientiamo? A vederla cosi` sembrerebbe meglio avere le radici per gli affissi nella prima persona (invece che all'infinito), ma non ne sono sicuro. Io ho sempre detto e scritto "suonava" e in internet "vince" 16000 a 724 ("sonava" compare piu` che altro in siti che riportano scritti classici o dialettali). Alla prossima. -- 1024D/5B35D286 Mirko Maischberger From piccardi a firenze.linux.it Sat May 4 18:35:11 2002 From: piccardi a firenze.linux.it (Simone Piccardi) Date: 04 May 2002 18:35:11 +0200 Subject: [Dizionario] Verbi con dittongo nelle forme rizotoniche In-Reply-To: <1020514824.2534.37.camel@penelope> References: <1020514824.2534.37.camel@penelope> Message-ID: <1020530111.27322.26.camel@havnor.centrohl.it> On Sat, 2002-05-04 at 14:20, Mirko Maischberger wrote: > Ciao, > > ho suddiviso la prima coniugazione in verbi in -gare/-care verbi in > -gnare, in -ciare/-giare, -gliare, -iare, messo da parte pochi > irregolari e tenuto gli altri in un file di rimasugli. Molto bene, io nel frattanto ho spezzettato e controllato gli aggettivi. Sono divisi in finale in o, a, e + quello che avanza. Quelli che finiscono in o sono stati ulteriormente divisi sul terminare in go, co o io. In totale ci sono i nuovi file: aggettivi_go.txt aggettivi che finiscono in go aggettivi_co.txt aggettivi che finiscono in co aggettivi_io.txt aggettivi che finiscono in io aggettivi_o.txt il resto di quelli che finisce in o aggettivi_a.txt aggettivi che finiscono in a aggettivi_e.txt aggettivi che finiscono in e aggettivi_altro.txt il resto (sono blu, pari, dispari, buon) Il problema che resta e` che quelli che finiscono in go e co hanno due diversi comportamenti: co -> co chi ca che (ex. stanco, sporco) co -> co ci ca che (ex. tipico, storico) come quelli che finiscono in io: io -> io, i, ia, ie (ex. ampio, medio) io -> io, i, ia, e (ex. selvaggio, randagio). tolti i casi particolari come mio. Gia' su questi, una volta raggruppati quelli con le stesse regole, si potrebbero mettere gli affissi. Io ci ho guardato dentro (a nuovo.aff) ma non mi torna la generazione dei plurali, prevede solo il caso co -> co chi ca che, che non va bene in un sacco di casi. Forse non ci ho capito un tubo io, o ho visto male, ma qualche esperto di affissi mi sa dire se conviene riclassificarli ulteriormente o aggiungere un affisso diverso. > > A vederla cosi` sembrerebbe meglio avere le radici per gli affissi > nella prima persona (invece che all'infinito), ma non ne sono > sicuro. Perche`? > > Io ho sempre detto e scritto "suonava" e in internet "vince" 16000 a 724 > ("sonava" compare piu` che altro in siti che riportano scritti classici > o dialettali). A me suona/sonava non torna. Come del resto tuona/tonava. Gli altri si invece. Ciao Simone -- Cio' che contraddistingue l'uomo e' la capacita' di farsi domande, cio' che contraddistingue il saggio e' il non accontentarsi delle risposte. From mirko a lilik.dmti.unifi.it Sat May 4 18:46:16 2002 From: mirko a lilik.dmti.unifi.it (Mirko Maischberger) Date: 04 May 2002 18:46:16 +0200 Subject: [Dizionario] Verbi con dittongo nelle forme rizotoniche In-Reply-To: <1020530111.27322.26.camel@havnor.centrohl.it> References: <1020514824.2534.37.camel@penelope> <1020530111.27322.26.camel@havnor.centrohl.it> Message-ID: <1020530777.7976.7.camel@penelope> Il sab, 2002-05-04 alle 18:35, Simone Piccardi ha scritto: > Il problema che resta e` che quelli che finiscono in go e co hanno due > diversi comportamenti: > co -> co chi ca che (ex. stanco, sporco) > co -> co ci ca che (ex. tipico, storico) > come quelli che finiscono in io: > io -> io, i, ia, ie (ex. ampio, medio) > io -> io, i, ia, e (ex. selvaggio, randagio). > tolti i casi particolari come mio. > > Gia' su questi, una volta raggruppati quelli con le stesse regole, si > potrebbero mettere gli affissi. > > Io ci ho guardato dentro (a nuovo.aff) ma non mi torna la generazione > dei plurali, prevede solo il caso co -> co chi ca che, che non va bene > in un sacco di casi. > > Forse non ci ho capito un tubo io, o ho visto male, ma qualche esperto > di affissi mi sa dire se conviene riclassificarli ulteriormente o > aggiungere un affisso diverso. > > > > A vederla cosi` sembrerebbe meglio avere le radici per gli affissi > > nella prima persona (invece che all'infinito), ma non ne sono > > sicuro. > Perche`? Per lo stesso motivo per cui e` piu` semplice generare i singolari dai plurali che non viceversa. stanchi -> stanco tipici -> tipico Se gli affissi funzionano come penso io (ma non ne so molto) riescono a classificare i due plurali nella stessa classe mentre partendo dai singolari bisognerebbe separarli manualmente. Idem per i verbi: ad occhio la prima persona da` delle informazioni che l'infinito tace... non ti so spiegare, ci vorrebbe prima qualcuno che lo spieghi a me... ci penso un po'... > > Io ho sempre detto e scritto "suonava" e in internet "vince" 16000 a 724 > > ("sonava" compare piu` che altro in siti che riportano scritti classici > > o dialettali). > A me suona/sonava non torna. Come del resto tuona/tonava. Gli altri si > invece. Gia`, ma negli altri il dittongo cade anche all'infinito... mi perplimo sempre piu` :) -- 1024D/5B35D286 Mirko Maischberger From piccardi a firenze.linux.it Fri May 31 21:05:54 2002 From: piccardi a firenze.linux.it (Simone Piccardi) Date: 31 May 2002 21:05:54 +0200 Subject: [Dizionario] Divisione degli aggettivi e ristrutturazione dei file. Message-ID: <1022871954.1192.2.camel@havnor.centrohl.it> Dato che ho avuto finalmente un po' di tempo, ho provveduto a finire lo sbriciolamento dei file per quanto riguarda gli aggettivi. In ogni caso un bel make dato nella directory base ricrea un lemmi.txt completo. Per complicarmi la vita ho pure diviso le cose in tre directory: nomi verbi aggettivi il cui contenuto e` ovvio, e ci ho messo i relativi file che sono: verbi: riflessivi.txt verbi_are.txt verbi_ere.txt verbi_ire.txt verbi_rre.txt gia` spiegati un'altra volta. Di questi del secondo si sta occupando Mirko. Gli altri sono da classificare (in regolari e non, come primo criterio, poi se ne vengono fuori altri ben venga). nomi: nomi.txt anche questi sono da classificare, al come non ci ho ancora pensato. aggettivi: e qui viene il gran canaio. Questi li ho classificati io, ridividendoli in: agg_e.txt aggettivi in e : e-> e, i agg-e_eli.txt come sopra ma con elisione nel superlativo agile-agilmente agg_a.txt aggettivi in a : a -> a, e, i agg_o.txt aggettivi in o : o -> o, a, i, e agg_co.txt aggettivi in co: co-> co, ci, ca, che agg_chi.txt aggettivi in co: co-> co, chi, cha, che agg_io.txt aggettivi in io: io-> io, i, ia, ie agg_go.txt aggettivi in go: go-> go, ghi, ga, ghe agg_ggio.txt aggettivi in ggio: ggio-> ggio, ggi, ggia, gge agg_inv.txt aggettivi che non hanno declinazione agg_irr.txt irregolari (solo pio, per ora) agg_o_irr.txt aggettivi in o con avverbio irregolare Se pero' guardate nella directory aggettivi trovate solo due file: agg_inv.txt e agg_irr.txt, piu` le seguenti quattro directory: avverbio superlativo avv_e_sup normali Infatti per ciascuna delle precedenti divisioni, eccetto appunto agg_inv.txt e agg_irr.txt, ho provveduto ad una ulteriore divisione in base alla esistenza o meno rispettivamente di: avverbio, superlativo, entrambi, nessuno dei due In questo modo alla fine ciascun file avra` un suo preciso affisso. L'organizzazione e` evidentemente poco chiara, e aspetto suggerimenti per rendere la cosa un po' piu` sensata. Inoltre la divisione l'ho fatta (specie per quanto riguarda la presenza di avverbi e superlativi) molto ad orecchio, e andra` di certo rivista. Ciao Simone -- Cio' che contraddistingue l'uomo e' la capacita' di farsi domande, cio' che contraddistingue il saggio e' il non accontentarsi delle risposte.