Wenn dies Ihr erster Besuch hier ist,
lesen Sie bitte zuerst die Hilfe - Häufig gestellte Fragen
durch. Sie müssen sich vermutlich registrieren,
bevor Sie Beiträge verfassen können. Klicken Sie oben auf 'Registrieren', um den Registrierungsprozess zu
starten. Sie können auch jetzt schon Beiträge lesen. Suchen Sie sich einfach das Forum aus, das Sie am meisten
interessiert.
Er meint wohl volltextsuche. Das ist auch nicht nur einfach ein Stückchen Code. Im Prinzip ist das eine Art Datenbank die einen speziellen Index für Volltextsuche hat. Schau Dir z.B. mal Elasticsearch an.
Elasticsearch ist im Kern auch Lucene. Lucene skaliert aber halt nicht so ohne weiteres. Läuft ja nur innerhalb eines Prozesses. Das heisst falls Du eine größere Menge an Daten hast, dann geht dir der Arbeitsspeicher aus. Für kleinere Datenmengen kann das aber durchaus ein Option sein.
Elasticsearch ist im Kern auch Lucene. Lucene skaliert aber halt nicht so ohne weiteres. Läuft ja nur innerhalb eines Prozesses. Das heisst falls Du eine größere Menge an Daten hast, dann geht dir der Arbeitsspeicher aus. Für kleinere Datenmengen kann das aber durchaus ein Option sein.
Definiere hier "Klein".
Wir haben Volltexte bei dem die Quelldokumente im GB-Bereich sind und es funktioniert
Gut dann kenne ich mich mit Lucene an sich zu wenig aus und ziehe meine Aussage zurück wir haben Elasticsearch bei uns am Laufen und ich fand das einfach nur genial. Runterladen, starten, befüllen und schon kann man Queries abfeuern und das ganze ist sogar einigermaßen performant.
Soweit ich Lucene kenne ist das einfach nur ein Stück Code was einen Index bereitet stellt. Persistenz hat das soweit ich weiß keine. Somit musst Du alles was Du durchsuchen willst im Speicher haben. Elasticsearch baut das dann um Persistenz und Skalierbarkeit aus. Das ist aber nur mein Verständnis von Lucene. Mag sein dass das falsch ist.
Comment