
PinakesText metterà a disposizione, in un programma di sviluppo pluriennale, una serie di moduli capaci di utilizzare i livelli del testo opportunamente rilevati e codificati secondo gli standard internazionali del settore. I vari componenti di elaborazione, inoltre, verranno inseriti in una struttura modulare perché possano agire sia interconnessi, sia separatamente gli uni dagli altri.
Un caso tipico è costituito dal modulo di lemmatizzazione per la lingua latina, ormai pronto per essere inserito all’interno dei servizi offerti da Pinakes Text. Un altro caso è costituito dal modulo che organizza le informazioni dell’apparato critico, oggi non ancora realizzato. La sua attivazione consentirà di associare, per ogni elemento (singole parole o interi periodi) del testo, le varianti trasmesse dalle fonti recensite.
Nella versione 3 di Pinakes Text viene anche aggiunto un modulo per l'integrazione di con Pinakes. Tale integrazione permetterà di effettuare annotazioni (e di conseguenza ricerche) semantiche sui testi. Un utente potrà definire un proprio modello concettuale, magari derivandolo da uno fondazionale, e lo utilizzerà per descrivere la semantica delle entità presenti in un testo e le relazioni tra testi differenti. I metadati generati in questa maniera potranno essere impiegati per ricerche semantiche e più in generale per effettuare ragionamenti automatici (validazione informazione, derivazione di nuova conoscenza).
In particolare, esistono altri moduli oltre a quelli che caratterizzano in modo più netto le varie versioni:
Modulo di consultazione e ricerca (realizzato):
Suscettibile di raffinamento della ricerca. E' assai probabile che gli utenti, usando la versione attuale, forniscano indicazioni per modifiche ed aggiunte al meccanismo di ricerca e consultazione (es. ricerca per volume, visualizzazione indice).
Modulo: Contribuzione ed Analisi Filologica
Permetterà agli utenti di contribuire nuova conoscenza e fornirà al filologo gli strumenti di base per svolgere il proprio lavoro (la grande variabilità dipende dal fatto che non è del tutto chiaro quali sono gli strumenti che il filologo considera di base).
Raffinamento Modulo di Contribuzione
E' possibile immaginare che il modulo di contribuzione una volta realizzato debba essere esteso per supportare funzionalità più evolute quali ad esempio il versionamento dei documenti oppure la possibilità di associare un ciclo di vita ai documenti (es. articolo passa da draft a revision a published e nelle varie fasi sono soggetti poterlo modificare). La variabilità dipende dal fatto che l'individuazione delle funzionalità è in corso.
Modulo di Annotazione Semantica
La complessità nell'integrazione tra PKText e Pinakes dipende fortemente dal grado di maturità di Pinakes. Si suppone che la versione definita Advanced sia disponibile e stabile. La variabilità dipende dal fatto che l'individuazione delle funzionalità è in corso.
Modulo di analisi Linguaggio Naturale
Fanno parte di questo modulo: lemmatizzatori, analizzatori morfologici e sintattici etc... La realizzazione di questo modulo può prevedere due approcci: la scrittura di algoritmi specifici; l'integrazione di algoritmi per mezzo (ad esempio) della definizione di interfacce web (wsdl). L'ultima soluzione è certamente auspicabile ma pretende che chi ha scritto gli algoritmi sia in grado di scrivere il lato provider di adattamento ai wsdl. Gli sviluppatori di PKText hanno in questo scenario la responsabilità della scrittura del solo lato consumer.
Modulo Elaborazione Immagini
Fanno Parte di questo modulo: filtri, ocr, segmentatori, riconoscitori di pattern ecc. La realizzazione di funzionalità di questo tipo necessita di conoscenze e competenze specifiche perciò e probabile che sia necessaria l'integrazione in PKText di librerie/prodotti specifici.
Il sistema Pinakes Text predilige lavori editoriali relativi ad opere di storia del pensiero scientifico, ma verranno successivamente effettuate sperimentazioni anche su opere letterarie in poesia e prosa. In collaborazione con la Società Dantesca Italiana, per esempio, sono in corso prove di importazione in PinakesText di dati già disponibili in formato digitale affinché edizioni, immagini, commenti e indici siano consultabili in maniera organica, superando i limiti delle edizioni cartacee da un lato e le disomogeneità o inaffidabilità di quelle in rete dall’altro.