From alberto_mineo a libero.it Thu Mar 4 17:24:34 2004 From: alberto_mineo a libero.it (alberto mineo) Date: Thu, 04 Mar 2004 17:24:34 +0100 Subject: [Dizionario] Richiesta info Message-ID: <4.3.2.7.2.20040304172047.02410f28@pop3.sycomnet.it> Salve, sto cercando in rete qualche suggerimento per iniziare a creare un dizionario su cd-rom. Un mio caro amico ha una piccola casa editrice e ha pubblicato un dizionario tecnico italiano-spagnolo-italiano. E' tutto su floppy e mi ha chiesto se riesco a trasformarlo in dizionario elettronico. Io me la cavo bene con l'informatica e ho una discreta esperienza di HTML, ma sinceramente non so nemmeno se sia il linguaggio migliore per quello che devo fare. Potete aiutarmi? grazie alberto mineo From andrea.sivieri a sempreverdi.net Sat Mar 6 12:55:10 2004 From: andrea.sivieri a sempreverdi.net (Andrea Sivieri) Date: Sat, 6 Mar 2004 12:55:10 +0100 Subject: [Dizionario] Richiesta info In-Reply-To: <4.3.2.7.2.20040304172047.02410f28@pop3.sycomnet.it> References: <4.3.2.7.2.20040304172047.02410f28@pop3.sycomnet.it> Message-ID: <200403061255.10468.andrea.sivieri@sempreverdi.net> Ciao Alberto! Non credo convenga trasformare i dati direttamente in html, perchè se poi si decidesse di averli in pdf, in una applet java, o in altri modi ancora, ci sarebbe da fare tutto il lavoro di nuovo. Il modo che viene in mente allora è individuare lo schema dei dati necessario e poi salvarli in un formato intermedio senza nessuna formattazione. Sarà poi un semplice script python, perl, tcl, ruby o altro a fare la conversione da quel formato ad html, oppure latex (per arrivare al pdf), oppure l'applet java potrà caricarlo direttamente. Esempio molto semplificato per dare l'idea, sto probabilmente ignorando molte cose necessario in un dizionario... (voce tratta dal dizionarietto Collins Mondadori inglese/italiano) term | grammar | meaning_id | meaning | context | translation punch | n | 1 | blow || pugno punch | n | 2 | fig: forze || forza punch | n | 3 | tool || punzone punch | n | 4 | drink || ponce punch | vt | 5 || to ~ sb/sth | dare un pugno a qn/qc punch | n | 6 || ~ line | battuta finale Una tabella di questo tipo può essere facilmente compilata dentro un foglio di calcolo (tipo OpenOffice.org calc) e poi salvata come file CSV (comma separated values) in cui come separatore conviene usare una barra verticale o un cancelletto, ma non una virgola! L'alternativa è tenere i dati in XML, ma quello è un passaggio che si può eventualmente fare dopo con semplici conversioni automatiche. Spesso se si parte direttamente con l'XML si tende a disperdersi... In poche parole la strada più veloce mi pare: 1. foglio di calcolo con tutti i dati necessari 2. conversione in file di testo, campi separati da separatore idoneo, righe separata ovviamente da newline 3. script che legge una riga alla volta e trasforma i dati in una forma utile per la presentazione (oppure applet Java, oppure front end multipiattaforma scritto usando wxPython/wxWidgets, oppure scritto in tcl/tk per chi è pratico di tcl) In questo modo si separa il modello dalla presentazione e se si cambia idea sul formato di destinazione si può cambiare in qualsiasi momento lo script di conversione invece che dover riformulare tutti i dati. Spero di averti qualche spunto utile... :) Ciao, Andrea > Salve, > > sto cercando in rete qualche suggerimento per iniziare a creare un > dizionario su cd-rom. Un mio caro amico ha una piccola casa > editrice e ha pubblicato un dizionario tecnico > italiano-spagnolo-italiano. E' tutto su floppy e mi ha chiesto se > riesco a trasformarlo in dizionario elettronico. Io me la cavo bene > con l'informatica e ho una discreta esperienza di HTML, ma > sinceramente non so nemmeno se sia il linguaggio migliore per > quello che devo fare. > > Potete aiutarmi? > > grazie > alberto mineo From andrea.sivieri a sempreverdi.net Sat Mar 6 12:57:09 2004 From: andrea.sivieri a sempreverdi.net (Andrea Sivieri) Date: Sat, 6 Mar 2004 12:57:09 +0100 Subject: [Dizionario] Richiesta info In-Reply-To: <200403061255.10468.andrea.sivieri@sempreverdi.net> References: <4.3.2.7.2.20040304172047.02410f28@pop3.sycomnet.it> <200403061255.10468.andrea.sivieri@sempreverdi.net> Message-ID: <200403061257.09149.andrea.sivieri@sempreverdi.net> > punch | n | 2 | fig: forze || forza intendevo: punch | n | 2 | fig: force || forza Ciao, Andrea From marangon a offvica.it Fri Mar 19 11:18:37 2004 From: marangon a offvica.it (Simone Marangon) Date: Fri, 19 Mar 2004 11:18:37 +0100 Subject: [Dizionario] Vocaboli Message-ID: <001401c40d9b$8c44d630$e70410ac@pc001> Ho letto il suo messaggio sul forum, io sto cercando in rete un file di testo con i vocaboli della lingua italiana, lei mi puo aiutare? Grazie From dario.zanotti a siemens.com Mon Mar 29 15:50:46 2004 From: dario.zanotti a siemens.com (Dario Zanotti) Date: Mon, 29 Mar 2004 15:50:46 +0200 Subject: [Dizionario] Vocaboli References: <001401c40d9b$8c44d630$e70410ac@pc001> Message-ID: <406829B6.50929958@siemens.com> Simone Marangon wrote: > Ho letto il suo messaggio sul forum, io sto cercando in rete un file di > testo con i vocaboli della lingua italiana, lei mi puo aiutare? > Grazie Se c'e`, io non l'ho trovato. Ma una cosa e` cercare un dizionario con le radici dei vocaboli presenti nella lingua italiana, un conto e` una lista dei vocaboli che e` possibile incontrare nella lingua italiana. Ad esempio, a ogni verbo (radice) corrisponde una serie talvolta esagerata di vocaboli (voci verbali, enclitici). E le dimensioni delle due liste sono radicalmente diverse; un buon dizionario contiene circa 80.000 vocaboli: questi possono generare con suffissi e prefissi di vario genere un volume di vari milioni di parole. Escludendo i nomi propri e soprattutto i toponimi, naturalmente. Auguri. Dario -------------- parte successiva -------------- Un allegato non testuale è stato rimosso.... Nome: dario.zanotti.vcf Tipo: text/x-vcard Dimensione: 309 bytes Descrizione: Card for Dario Zanotti URL: