[Dizionario] Re[2]: [Dizionario] Re: [Dizionario] Gnovità su Favele

Giuseppe Bilotta gip.bilotta a iol.it
Lun 25 Nov 2002 17:55:33 CET


lunedì 25 novembre 2002 Marco Gaiarin ha scritto:
> Mandi! Giuseppe Bilotta
>   In chel di` si favelave...

>> E una domanda per Gaiarin ... qual è esattamente la struttura dei
>> file .lex? Perché alcune voci hanno un numero (sempre 1?) dopo?

> Uffa... ora mi sono impantanato sul CVS, scusate ma sono maldestro, e
> terribilmente incasinato.

> Scusate del delay, ma ero in ``ferie'' (a casa a seguire il decorso
> della frattura di mia madre).

Spero vada tutto bene.

> Orbene, nella word prediction, nonostante tutto, la tecnica che più
> paga è la più semplice, ovevro la frequenza.
> I campi di un dizionario lex sono:

> lemma           categorie       frequenza       timestamp

> dove lemma è la parola o la radice, categorie la/le categoria
> sintattiche e regole di generazione a cui afferisce, frequenza il
> numero di volte utilizzata (in assoluto), timestamp uno unix timestamp
> classico che indica la dataora di ultimo utilizzo.

Bene, in funzione della ristrutturazione del file .lex che ho
effettuato per gestire le radici, ed anche per motivi di
robustezza, ritengo sia più opportuno piazzare frequenza e
timestamp in un file separato (.pred per prediction?). La cosa è
utile perché permette varie cose tipo:

(1) separarle per utente/file/tipo di lavoro
(2) resettarle senza rischiare di manomettere il .lex
(3) aggiungere voci per ogni parola, anche quelle non presenti nel
.lex

-- 
Giuseppe "Oblomov" Bilotta




Maggiori informazioni sulla lista Dizionario