K
kronos
Volevo esporvi i problemi che ho riscontrato i quali non riguardano errori
di programmazione ma possibili ottimizzazioni del programma a me ignote.
Io sto realizzando un programma che realizza l'arricchimento linguistico
automatizzato di un ontologia tramite l'utilizzo di una risorsa linguistica
concettualizzata (tassonomica e con glosse) che nel mio caso particolare è
wordnet.
I programmi da me utilizzati sono:
-Eclipse SDK (piattaforma java)
-Wordnet 2.0
-Protege 3.1
-OneDollarDB (database)
Il problema principale che ho per adesso è la realizzazione di una tabella
nel database contenente due colonne: word,frequency.
Dove word è la colonna contenente tutte le parole che compongono le glosse
di wordnet e frequency è la loro frequenza di apparizione in esse.
Il problema consiste nel fatto che le operazioni effettuate sul database mi
portano via tanto di quel tempo che la tabella viene relaizzata in
esattamente 5 ore.
Ciò non è accettabile ma io non so come altro fare per migliorare questo
tempo.
Se mi dici che puoi aiutarmi su questa cosa io ti mando il codice del
programma e l'interfaccia per wordnet che utilizzo,inoltre lo schema della
tabella del database.
Inoltre ti spiego anche più specificatamente quello che faccio,
ma in poche parole prendo una glossa, la tokenizzo eliminandone gli elementi
di punteggiatura,per ogni parola faccio una select sulla tabella per vedere
se è già stata inserita se no la inserisco con frequenza uno, se si faccio
un update sulla frequenza.
di programmazione ma possibili ottimizzazioni del programma a me ignote.
Io sto realizzando un programma che realizza l'arricchimento linguistico
automatizzato di un ontologia tramite l'utilizzo di una risorsa linguistica
concettualizzata (tassonomica e con glosse) che nel mio caso particolare è
wordnet.
I programmi da me utilizzati sono:
-Eclipse SDK (piattaforma java)
-Wordnet 2.0
-Protege 3.1
-OneDollarDB (database)
Il problema principale che ho per adesso è la realizzazione di una tabella
nel database contenente due colonne: word,frequency.
Dove word è la colonna contenente tutte le parole che compongono le glosse
di wordnet e frequency è la loro frequenza di apparizione in esse.
Il problema consiste nel fatto che le operazioni effettuate sul database mi
portano via tanto di quel tempo che la tabella viene relaizzata in
esattamente 5 ore.
Ciò non è accettabile ma io non so come altro fare per migliorare questo
tempo.
Se mi dici che puoi aiutarmi su questa cosa io ti mando il codice del
programma e l'interfaccia per wordnet che utilizzo,inoltre lo schema della
tabella del database.
Inoltre ti spiego anche più specificatamente quello che faccio,
ma in poche parole prendo una glossa, la tokenizzo eliminandone gli elementi
di punteggiatura,per ogni parola faccio una select sulla tabella per vedere
se è già stata inserita se no la inserisco con frequenza uno, se si faccio
un update sulla frequenza.