Figur 1 viser søkemakroer ordnet i abstraksjonsnivå slik disse var realisert
i en prototyp
fra 1999, et av bidragene som fulgte avhandlingen 'Argumenterende tekst transformert til
hypertekst'. På basis av en fremlagt modell over utforming av navigeringsbaner gjennom
teksten, ble systemet med søkemakroer ytterligere spesialisert.
Den underliggende teksten - en utredning fra OED, er her preprosessert av en
grammatikkparser (ikke tilgjengelig teknologi i 1999) og lemmaformene av alle ord er
prosessert i redskap som støtter kvantitative tekstanalytiske tilnærmingsmåter.
Søkemakroer som virker på setningsnivå opererer mot klassifiseringer som (Lead,
Dependent, etc) og TAM (Tense & Modality). Slike søkemakroer utgjør et nivå i
filtreringsopsjonene.
Andre søkemakroer inkluderer søkeoperander som er fasetter, f eks Entity Economy
(andel, kontanter, innskudd) - vist til høyre i
figur
11 - Agent Authority (her med seleksjon
av kun regjering). Med slike byggestener er det således mulig å konstruere et fleksibelt
system av søkemakroer tilpasset ulike typer av søkemål - sistnevnte er et begrep som
jeg har valgt å holde klart adskilt fra begrepet informasjonsbehov.
Søkemakroene realiserer koblinger mellom tekstsegment som er klassifisert til å ha
et
sett felles egenskaper. Tematiske indikatorer kan avdekkes automatisk, likeledes
faktiske opplysninger som leveres av en grammatikkparser forut for en ekstrahering og
systematisering i et spesialisert filsystem (Multilevelled Annotation File System).
Klassifisering av dypere meningsinnhold i form av om synspunkt er i favør av noe,
negativ eller positiv valør i evalueringer ol. må være fundert på kvalitative
tilnærmingsmåter, selv om det nå er mulig å fange opp indikatorer på evalueringer,
sammenligninger ol.
Per april 2002 var det utviklet et sett tekstteknologiske redskap som gir støtte i
alle steg i
forlslaget til metode for tekstanalyse som ble fremmet i 1999. I den siste
prototypversjonen (2002) kan en bruker gi et tekstsegment (f eks et avsnitt) som
søkeoperand, og en prosedyre for tematisk tekstsonering finner de områder i andre
tekster som har en grad av likhet (terskelverdier kan justeres). Prosedyrene realiserer en
spesialisert variant av klyngeanalyse med basis i setninger eller setningsfragment.
Neste mål er å utvikle et system som kombinerer tematisk tekstonering og et system
med søkemakroer ordnet i abstraksjonsnivå. Kostnadsestimatet for første prototyp er 1.3
mill NOK.