[Dizionario] Proviamo a ripartire.
Mirko Maischberger
mirko a lilik.dmti.unifi.it
Mar 19 Feb 2002 21:42:14 CET
Ciao,
Simone Piccardi il 2002/02/19 8:44:05 +0100:
|Comunque uno script in perl che butta tutto su un database (qualunque
|sia la forma del testo) dovrei essere in grado di arrangiarlo (e
|potrebbe anche essere la scusa buona per imparare il python...).
Per quello non c'è problema, se volete posso dare una mano anch'io,
sia per XML->DB che viceversa.
|Per conto mio pensavo ad una cosa piu` simile a quanto a suo tempo
|proposto da P. Molaro su discussioni, cioe` qualcosa tipo:
|Lemma: pincopallo
|Tipo: sostantivo
|Genere: plurale
|Significato: ...
Può andare, ma non è tanto estensibile, non permette di verificare
la correttezza, né ci sono librerie già pronte per la manipolazione
(che io conosca) altrettanto complete di quelle disponibili per
XML.
Vi faccio un esempio di massima di quello che potrebbe essere il
formato in xml.
<dict>
<def>
<lemma gramm="fam.">pincopallare</lemma>
<tipo attr="verbo">
<eccezione tempo=".." modo="" persona=".." tipo="assente"/>
<eccezione tempo=".." modo="" persona="..">pincopallabbi</eccezione>
</tipo>
<pronuncia>...</pronuncia>
<variante tipo="arc.">pencopallare</variante>
<variante tipo="gerg.">pancopallare</variante>
<accezione>
<suddivisione>
</suddivisione>
<suddivisione tipo="est.">
</suddivisione>
</accezione>
<accezione tipo="fig.">
<suddivisione>
</suddivisione>
<suddivisione>
</suddivisione>
</accezione>
<etimologia>
</etimologia>
</def>
...
</dict>
A partire da un file del genere, con un coniugatore / generatore
di plurali e tenendo conto delle eccezioni, si potrebbe anche
generare (forse) un file per il correttore ortografico (e --
rabbrividisco! -- grammaticale) in automatico. Così come si
possono tirare fuori tutti i sostantivi maschili che non hanno
il plurale, ma che vengono usati in senso figurato!
L'esempio di formato è solo una bozza abbozzata, ma lavorandoci
un po' su fornirà sicuramente una flessibilità maggiore.
|Insomma alla fine un qualcosa tipo XML ma senza tanti tag (che non nego
|mi stiano piuttosto antipatici).
Capisco l'antipatia, ma considera l'esistenza di validatori
e parser già pronti.
Mirko Maischberger.
Maggiori informazioni sulla lista
Dizionario