Announcement

**jum** · 07.03.2013, 12:00

Die Foren-Spezialistin daf�r ist wohl Barbara Boehmer, sie antwortet auch schnell und sehr fundiert.
Falls hier keine Antworten kommen, k�nntest Du es "ausnahmsweise" bei ORAFAQ probieren.

**defo** · 07.03.2013, 13:17

Ich hab in dem Bereich keine brauchbaren Erfahrungen. Trotzdem 2 Fragen.
Wie ist die Aktualisierungsfrequenz der Daten und wie ist die Optimierungsstrategie?
Also wie "gut" ist der Index?
Die SGA in der Gr��e n�tzt ja erst, wenn Oracle glaubt, dass ein ZWischenergebnis da irgendwie reingeht. Der Index bzw. seine Verwendung hat steht an der Stelle aber noch davor. Die schlechten Ergebnisse (bei Wiederholung) deuten ja auch darauf hin, dass die SGA nicht greift.
Hier ein deutscher Link > http://oracle-text-de.blogspot.de/

**dimitri** · 07.03.2013, 15:07

@jum: Werd ich machen. Danke.

@defo: Den Blog von Carsten kenn ich. In die SGA werden ja, mal von Direct Reads, aber doch alle Bl�cke geladen.
Ich denk aber auch, dass es nicht an der SGA liegt, sondern am Index (und damit an mir

) selbst.

Die Daten werden einmal t�glich aktualisiert allerdings nicht alle, sondern nur zwischen 1-10% der Gesamtmenge. Wir werden den Index anschlie�end synchronisieren und am WE Nachts neu aufbauen.

Dim

**dimitri** · 07.03.2013, 15:48

So, ich hab jetzt eine praktikable L�sung gefunden. Statt des Context Index verwende ich jetzt einen CTXCAT Index. F�r meine Zwecke absolut ausreichend:

Code:

begin
 ctx_ddl.create_preference('CAT_WORDLIST', 'BASIC_WORDLIST'); 
 ctx_ddl.set_attribute('CAT_WORDLIST','FUZZY_MATCH','GERMAN');
 ctx_ddl.set_attribute('CAT_WORDLIST','PREFIX_INDEX','TRUE');
 ctx_ddl.set_attribute('CAT_WORDLIST','PREFIX_MIN_LENGTH','3');
 ctx_ddl.create_preference('CAT_LEXER','BASIC_LEXER');
 ctx_ddl.set_attribute('CAT_LEXER','MIXED_CASE','NO');
 ctx_ddl.set_attribute('CAT_LEXER','INDEX_STEMS','NONE');
 ctx_ddl.set_attribute('CAT_LEXER','ALTERNATE_SPELLING','GERMAN');
end;
/
create index tbl0100person_name1ix on tbl0100person (name1) indextype is ctxsys.ctxcat parameters ('LEXER CAT_LEXER WORDLIST CAT_WORDLIST');
create index tbl0100person_name3ix on tbl0100person (name3) indextype is ctxsys.ctxcat parameters ('LEXER CAT_LEXER WORDLIST CAT_WORDLIST');

Die Suchen dauern jetzt auch bei "beliebten" Namen wie Meier und Huber unter 3 Sekunden, beim erneuten Ausf�hren unter einer Sekunde.

Code:

select persno,name1,name3 from tbl0100person where catsearch(name1,'mei*','')>90
oder 
select persno,name1,name3 from tbl0100person where catsearch(name1,'mei*','')>90 and catsearch(name3,'manf*','')>90

Kein Problem mehr.

Announcement

Oracle Text und NDATA

Oracle Text und NDATA

Comment

Comment

Comment

Comment