In meiner Tabelle sind Schlüsselwörter, die aus PDF Dateien generiert wurden.
Jetzt möchte ich zu jeder PDF Datei (je ca. 1000 unterschiedliche Wörter) die wichtigsten (100 oder so) Schlüsselwörter finden und natürlich die ganzen "der", "die", "das", "und" etc. entfernen. Nach meiner Theorie sind die Schlüsselwörter in einem PDF die wichtigsten oder "bezeichnendsten", die in der Gesamtheit der Wörter am seltensten auftauchen (die ganzen Artikel und Pronomen fliegen dabei natürlich mit raus).
Ich brauche also eine Query wie (ins Blaue geschrieben):
SELECT word FROM keywords WHERE pdf_id = <my_pdf_id> ORDER BY (SELECT COUNT(word) FROM keywords)
Danke für die Hilfe
Jetzt möchte ich zu jeder PDF Datei (je ca. 1000 unterschiedliche Wörter) die wichtigsten (100 oder so) Schlüsselwörter finden und natürlich die ganzen "der", "die", "das", "und" etc. entfernen. Nach meiner Theorie sind die Schlüsselwörter in einem PDF die wichtigsten oder "bezeichnendsten", die in der Gesamtheit der Wörter am seltensten auftauchen (die ganzen Artikel und Pronomen fliegen dabei natürlich mit raus).
Ich brauche also eine Query wie (ins Blaue geschrieben):
SELECT word FROM keywords WHERE pdf_id = <my_pdf_id> ORDER BY (SELECT COUNT(word) FROM keywords)
Danke für die Hilfe
Comment