@Andreas, d.h. konkret, daß falls ich diesen Index-Dienst installiert habe wird ein Such Index über ALLE Dateien erstellt der jeden beliebigen Text, sei es ASCII, WideChars oder beliebige Bytesequenzen ALLER Dateien enthält. Ich halte dies für unmöglich, da ja dann der Index bzw. die Index-Dateien kombinatorisch gesehen viel viel größer als alle Dateien zusammen sein müsste.
Angenommen ich suche viele verschiedene Bytesequenzen in allen Dateien, dann müsste ja der Such-Index alle Dateien Byteweise zerpflücken und zu jeder Bytesequenz einen Index-Eintrag besitzen.
Eine 10 Bytes große Datei hätte dann mindestens 9 Index-Einträge für jede der 10 Bytes als Sequenz betrachtet.<br>
Es stellt sich mir nun die Frage wie dieser Indexdienst genau funktioniert und ob er tatsächlich jede beliebige Bytesequenz findet ??
Angenommen dieser Indexdienst beschränkt sich auf lesbare Texte, dann stellt sich sofort die Frage was als lesbarer Text interpretiert bzw. gefiltert wird, und somit die Frage nach der Suche "hat mein Index tatsächlich ALLE findbaren Patterns aus ALLEN Dateien gefunden ??".
Auf Grund der Datenmenge glaube ich nicht das der Indexdienst tatsächlich einen Index über alle Dateien und deren kompletten Inhalt erzeugt, sondern eher nur über ausgewählte Dateien. In diesem Falle wäre eine schnelle Textsuche, wie oben gezeigt, sehr wohl von Interesse und wahrscheinlich um Längen schneller und speichereffizienter als die Erzeugung und Verwaltung eines Indexes.
Gruß Hage
Angenommen ich suche viele verschiedene Bytesequenzen in allen Dateien, dann müsste ja der Such-Index alle Dateien Byteweise zerpflücken und zu jeder Bytesequenz einen Index-Eintrag besitzen.
Eine 10 Bytes große Datei hätte dann mindestens 9 Index-Einträge für jede der 10 Bytes als Sequenz betrachtet.<br>
Es stellt sich mir nun die Frage wie dieser Indexdienst genau funktioniert und ob er tatsächlich jede beliebige Bytesequenz findet ??
Angenommen dieser Indexdienst beschränkt sich auf lesbare Texte, dann stellt sich sofort die Frage was als lesbarer Text interpretiert bzw. gefiltert wird, und somit die Frage nach der Suche "hat mein Index tatsächlich ALLE findbaren Patterns aus ALLEN Dateien gefunden ??".
Auf Grund der Datenmenge glaube ich nicht das der Indexdienst tatsächlich einen Index über alle Dateien und deren kompletten Inhalt erzeugt, sondern eher nur über ausgewählte Dateien. In diesem Falle wäre eine schnelle Textsuche, wie oben gezeigt, sehr wohl von Interesse und wahrscheinlich um Längen schneller und speichereffizienter als die Erzeugung und Verwaltung eines Indexes.
Gruß Hage
Comment