Announcement

**r. geiseler** · 23.02.2010, 20:35

Hallo Falk Pr�fer,

ja dass sieht gut aus, Problem ist:

Code:

(MATCH (comp.Companyname, ind.d_kat) AGAINST ('Afro'))

, dass geht nicht, denke ich zumindest, habs eben auch Probiert .

Ergebnis:

Incorrect arguments to MATCH

Da ja die Spalte ind.d_kat nicht in der selben Tabelle ist wie die Spalte comp.Companyname, schein dass nicht zu funktionieren. Es m�sste ein vereinter Index (Fulltext) �ber beide Spalten gelegt werden. Deshalb auch die Union. Dies sind quasi zwei einzelne Abfragen, eine pr�ft ob der Suchbegriff in den Kategorien vorkommt, sucht dann anhand einer Kat_ID in einer Zuordnungstabelle die Firmen_ID`s und dann in der Haupttabelle die entsprechenden Firmen. Die zweite pr�ft gleichzeitig ob der suchbegriff in der Spalte Companyname vorkommt und mu� ja dann nicht den Umweg �ber die beiden anderen Tabellen nehmen, also ohne Joins.

Und die gefundenen werden dann �ber union zusammengef�hrt, also alle die in der kat sind+alle die den begriff im namen haben oder sogar beides.

Vieleicht geht es ja mit deinem ansatz, aber so erstmal nicht. Vieleicht hab ich ja noch nen denkfehler.

Kannst mir ja noch mal einen ansto� geben, w�r nett.

Folgende Abfrage funktioniert �brigens fast prima, hatte ich heute festgestellt, leider noch bei manchen suchbegriffen 1-2 sec. teilweise aber auch 0,5sec.

SELECT company.id, company.Companyname, company.STREET, company.ZIPCODE, company.Location
FROM company
INNER JOIN company_industry ON company.id = company_industry.company_id
INNER JOIN industry ON company_industry.industry_id = industry.id
WHERE MATCH (company.location, company.STREET)AGAINST ('Hamburg') AND (MATCH (company.Companyname)AGAINST ('Abbeizarbeiten'))
UNION
SELECT company.id, company.Companyname, company.STREET, company.ZIPCODE, company.Location
FROM company
INNER JOIN company_industry ON company.id = company_industry.company_id
INNER JOIN industry ON company_industry.industry_id = industry.id
WHERE MATCH (company.location, company.STREET)AGAINST ('Hamburg')AND (MATCH (industry.d_kat)AGAINST ('Abbeizarbeiten'))ORDER BY Companyname

Alle Indizies werden sauber genutzt, habe ich mit Explain getestet.

Wei� nicht ob hier noch was zu optimieren geht.

mfg
r.geiseler

**Falk Pr�fer** · 24.02.2010, 09:21

Hallo r.geiseler,

stimmt, dass die beiden Felder nicht aus einer Tabelle kommen, darauf habe ich nicht geachtet.
Aber trotzdem: Bevor wirklich ein Union verwendet wird, w�rde ich eine ODER-Verkn�pfung der Bedingungen bzw. eine Suche IN BOOLEAN MODE ausprobieren.
[highlight=sql]
SELECT ...
FROM company AS comp
INNER JOIN company_industry AS comp_ind ON comp.id = comp_ind.company_id
INNER JOIN industry AS ind ON comp_ind.industry_id = ind.id
WHERE MATCH (comp.location) AGAINST ('Hamburg')
AND (
MATCH (comp.Companyname) AGAINST ('Afro') OR
MATCH (ind.d_kat) AGAINST ('Afro')
)
[/highlight]

[highlight=sql]
SELECT ...
FROM company AS comp
INNER JOIN company_industry AS comp_ind ON comp.id = comp_ind.company_id
INNER JOIN industry AS ind ON comp_ind.industry_id = ind.id
WHERE MATCH (comp.location) AGAINST ('Hamburg')
AND MATCH (comp.Companyname, ind.d_kat) AGAINST ('Afro' IN BOOLEAN MODE)
[/highlight]

Wenn dann doch ein UNION verwendet wird, dann solltest du �berlegen, ob nicht vlt. ein UNION ALL auch ausreicht. Dabei wird auf das implizite DISTINCT verzichtet, es entstehen u.U. aber Dopplungen.

Wenn das alles nichts bringt, dann l��t sich wohl nur noch mit zus�tzlicher Redundanz die Abfragegeschwindigkeit verbessern.

Gru� Falk

**r. geiseler** · 24.02.2010, 20:09

Hallo Falk,

danke erstmal, habe beide ausprobiert. Funktioniert anscheinend doch mit

AND(MATCH (comp.Companyname, ind.d_kat) AGAINST ('Afro'))

Ja, also beide funktionieren, wobei ich eine Abfrage mit Oder eher nicht nutzen m�chte. In allen m�glichen Foren steht, "oder" frisst Zeit. Die Zweite Abfrage find ich allerdings nicht schlecht, zumal diese sch�n �berschaubar und nicht so aufgeplustert wirkt. Allerdings habe ich den direkten Vergleich in PHP-MY-Admin durchgef�hrt und festgestellt, dass der Vorschlag von dir etwa 1,2sec. und dagegen meine oben beschriebene Union 0,45sec. ben�tigt.

Voraussetzungen waren identisch gleicher Suchbegriff gleicher Ort, wie gesagt manche Suchbegriffe dauern mit meiner Abfrage dann leider l�nger, dass ist dass was ich nicht ganz verstehe. (erst wenn Order By hinzukommt)

In dem Vergleich habe ich beide Abfrage mit Order By durchgef�hrt. Ohne Order By �ndert sich bei deinem Vorschlag nichts, also ca. 1,2sec. bei der Union wirds dann allerdigs noch etwas schneller, so ca. 0,2sec.

Bei beiden Abfragen habe ich mit Explain gepr�ft, Indizies werden jeweils genutz, die Anzahl ROWS ist �berall 1, dass sollte erstmal alles richtig laufen.

Wie meinst du dass, mit den zus�tzlichen Redundanzen?

Vieleicht ist hier ja eine L�sung f�r dass Problem.

Gru� Ronny

**Falk Pr�fer** · 25.02.2010, 09:44

Hallo Ronny,

Originally posted by r. geiseler View Post

...wobei ich eine Abfrage mit Oder eher nicht nutzen m�chte. In allen m�glichen Foren steht, "oder" frisst Zeit.

Da haben die Foren recht

. Bei einer Oder-Abfrage ist i.a.R. die Indexnutzung sehr eingeschr�nckt und dadurch die Abfrage langsamer. Wenn die Alternative jedoch ein UNION ist, dann lohnt es aus meiner Sicht schon dar�ber nachzudenken.

Originally posted by r. geiseler View Post

...Allerdings habe ich den direkten Vergleich in PHP-MY-Admin durchgef�hrt und festgestellt, dass der Vorschlag von dir etwa 1,2sec. und dagegen meine oben beschriebene Union 0,45sec. ben�tigt.

OK, wenn sich bei Tests herausstellt, dass UNION die schnellere Variante ist, dann ist dagegen ja nichts einzuwenden.

Originally posted by r. geiseler View Post

...Wie meinst du dass, mit den zus�tzlichen Redundanzen?

Mann k�nnte z.B. den Text aus ind.d_kat zus�tzlich, also redundant, in einem Feld der Tabelle company speichern. Daf�r ist nat�rlich Aufwand zu betreiben, um es konsistent zu halten und im Sinne sauberer Relationen und Normalformen ist es nat�rlich auch nicht sch�n. Aber manchmal mu� man f�r Performance eben unpopul�re Entscheidungen treffen

Was ist mit UNION ALL statt UNION?

Gru� Falk

**r. geiseler** · 25.02.2010, 21:36

Hallo Falk,

Union All ist kein bisschen schneller und produziert, wie du schon vermutet hast, Doppelte Eintr�ge. Diese m�sste ich dann mit einem Distinct wieder ausgrenzen, dann wirds mit sicherheit noch langsamer.

Das Problem ist, die Tabelle Kategorien habe ich ja erst auf Anraten einiger Leute von der Haupttabelle aubgekoppelt. Manche Firmen haben ja mehr als eine Kategorie, dies lie�e sich dann nicht in einer Tabelle realisieren. Da m�sste ich ja entweder mehrere Spalten hinten an den Firmendatensatz anh�ngen, ich wei� nicht wie viele Kategorien der jenige m�chte. Die Tabelle w�rde sich aufbl�hen. Oder die Firma w�rde pro Zeile eine Kategorie bekommen, dass bedeutet dass diese Firma unter Umst�nden 5, 8 oder 10 mal vorhanden ist.

Ja also, ich denke ich mu� mit der Abfrage erstmal so leben. Viele Suchbegriffe werden ja recht schnell gefunden, bei manchen dauerts halt etwas. Vieleicht liegts einfach auch nur am Server, ist ja auch nicht so das teuerste was so am Markt ist.

Vieleicht hats auch was mit MySql zu tun, kennst du dich da aus?

Gru�
Ronny

**Falk Pr�fer** · 26.02.2010, 09:10

Hallo Ronny,

Originally posted by r. geiseler View Post

...Union All ist kein bisschen schneller und produziert, wie du schon vermutet hast, Doppelte Eintr�ge. Diese m�sste ich dann mit einem Distinct wieder ausgrenzen, dann wirds mit sicherheit noch langsamer.

Das normale UNION beinhalted implizit ein DISTINCT.

Originally posted by r. geiseler View Post

...Da m�sste ich ja entweder mehrere Spalten hinten an den Firmendatensatz anh�ngen, ich wei� nicht wie viele Kategorien der jenige m�chte. Die Tabelle w�rde sich aufbl�hen. Oder die Firma w�rde pro Zeile eine Kategorie bekommen, dass bedeutet dass diese Firma unter Umst�nden 5, 8 oder 10 mal vorhanden ist.

Naja, da es sich um ein "internes" Suchfeld handeln w�rde, k�nnte man das alles (z.B. kommasepariert) in ein Feld schreiben. Aber der daf�r notwendige Verwaltungsaufwand steht wohl bei deinen momentanen Antwortzeiten in keinem Verh�ltnis zum m�glichen Nutzen.

Originally posted by r. geiseler View Post

...Ja also, ich denke ich mu� mit der Abfrage erstmal so leben. Viele Suchbegriffe werden ja recht schnell gefunden, bei manchen dauerts halt etwas.

Was ich noch auf den Pr�fstand stellen w�rde, w�re die Verwendung der Volltextsuche. Da es um solche trivialen Sachen wie Namen und Kategorien geht, w�re da nicht eine Suche LIKE 'Afro%' vorstellbar statt der gro�en Keule? OK, wenn es eher LIKE '%Afro%' sein mu�, dann sind Indizes wieder hinf�llig. Da g�be es dann noch die M�glichkeit mit der Optimierung in der Anwendung bzw. beim Anwender anzufangen. Nach dem Motto: "Name beginnt mit:" => LIKE 'Afro%' - geht sehr fix oder "Suchbegriff mu� enthalten sein:" => Volltextsuche - dauert ggf. etwas l�nger.
Mir ist klar das manche "Entscheider" sowas nicht gerne sehen, aber die eierlegende Wollmilchsau gibt es eben nicht.
Wenn die Abfrage aerodynamisch ausgereizt ist, dann bleibt zur weiteren Steigerung nur mehr Hubraum - sprich ein leistungsf�higerer Server.

Originally posted by r. geiseler View Post

...Vieleicht hats auch was mit MySql zu tun, kennst du dich da aus?

Sicher hat das auch was mit der Konfiguration des MySQL-Servers zu tun, aber was Serveroptimierung angeht ist das nicht gerade mein Spezialgebiet

Gru� Falk

**r. geiseler** · 26.02.2010, 21:00

Hallo Falk,

Das normale UNION beinhalted implizit ein DISTINCT.

Das bedeutet?

Naja, da es sich um ein "internes" Suchfeld handeln w�rde, k�nnte man das alles (z.B. kommasepariert) in ein Feld schreiben. Aber der daf�r notwendige Verwaltungsaufwand steht wohl bei deinen momentanen Antwortzeiten in keinem Verh�ltnis zum m�glichen Nutzen.

Da hast du recht, ich hatte es anfangs so, mit Kommatrennung, verursacht aber beim Ausgeben Probleme, also beim trennen, die Kategorien sollen am Schlu� mit ausgegeben werden, also Firma X ist eingetragen in Kat. Y,Z,....
Au�erdem ist die Seite mehrsprachig, dass hei�t beim Eintagen wird ja nur die jeweilige Kategorienummer vergeben und somit kann sp�ter anhand der Kat.Nr. jede Kategorie in allen Sprachen welche ich bereits vergeben habe gefunden werden, deshalb auch die gesonderte Tabelle Kat.

Nach dem Motto: "Name beginnt mit:" => LIKE 'Afro%' - geht sehr fix oder "Suchbegriff mu� enthalten sein:" => Volltextsuche - dauert ggf. etwas l�nger.

Kannst du mir da mal eine Beispielabfrage basteln, w�rde ich dann umgehend probieren, dass w�r ja supi wenn dass reicht mit Like. Hatte ich anfangs ja auch mit rumgedoctert, ist mir aber irgendwie nicht so gegl�ckt. Mu� dazu sagen, da habe ich mich auch noch nicht so mit den Indexen besch�ftigt gehabt, vieleicht w�rs ja gegangen. Wenn ich mir so die Foren durchlese sagen viele dass 2.000.000 Datens�tze keine gr��e sind, da verstehe ich garnicht dass hier schon die Reizschwelle f�r den Arbeitsspeicher erreicht sein soll. Bin extra vor kurzen umgestiegen, hatte vorher 1/4 bei Domaingo und da hatte ich fast die gleichen Zeiten. hmmm.

Gru� Ronny

**Falk Pr�fer** · 01.03.2010, 09:32

Hallo Ronny,

Originally posted by r. geiseler View Post

...Das bedeutet?

UNION ALL mit DISTINCT ist gleichbedeutend mit UNION oder andersherum Wenn man kein DISTINCT ben�tigt ist UNION ALL schneller als UNION.

Originally posted by r. geiseler View Post

...
Kannst du mir da mal eine Beispielabfrage basteln, w�rde ich dann umgehend probieren, dass w�r ja supi wenn dass reicht mit Like.

Naja, halt einfach LIKE statt der Volltextsuche verwenden. Das l��t sicher nicht das UNION oder OR Problem, ist ggfs. aber schneller als die Volltextsuche.

Originally posted by r. geiseler View Post

...Wenn ich mir so die Foren durchlese sagen viele dass 2.000.000 Datens�tze keine gr��e sind, da verstehe ich garnicht dass hier schon die Reizschwelle f�r den Arbeitsspeicher erreicht sein soll. Bin extra vor kurzen umgestiegen, hatte vorher 1/4 bei Domaingo und da hatte ich fast die gleichen Zeiten. hmmm.

Wobei ja Abfragezeiten von 0,2 / 0,45 sec. nicht wirklich langsam sind. Selbst wenn du hier mit weiterer Optimierung noch 30% rauskitzelst, spielt das in einem Bereich der subjektiv kaum bemerkt wird.
Stichwort Domaingo: Das ist Shared Hosting. Hier spielen noch ganz andere - von dir nicht beeinflussbare - Faktoren eine Rolle, die noch dazu gr��eren Einfluss auf die Insgesamt-Performance haben als eine 50%ige Steigerung der Abfragegeschwindigkeit von 0,4 auf 0,2 sec!
Also wenn du nicht unbedingt den pers�nlichen Ehrgeiz (oder nichts besseres zu tun) hast, auch noch die letzte Millisekunde rauszukitzeln, dann la� es gut sein

.

Gru� Falk

**r. geiseler** · 01.03.2010, 21:32

Hallo Falk,

nein hat jetzt nichts mit persl. Ergeiz zu tun. Hatte ja geschrieben, dass einige Suchbegriffe auch 3sec. ben�tigen.

0,5 oder sogar 1sec. w�r auch absolut akzeptabel, zumal dies ja kein Dedicated Server, sondern nur ein V-Server ist. Wie gesagt diese 3sec. sind mein Problem, dass verstehe ich halt nicht, somit ging ich hier in dieses Forum um zu ergr�nden ob diese Abfrage so i.O. ist. Kann ja auch sein, dass dies anders geht. Ich hatte ja urspr�nglich auch eine neue Abfrage, welche ganz am Anfang meines Beitrages steht, benutzen wollen, diese dauerte nur 0,02 sec. (die Abfragezeit beziehe ich immer auf eine direkte Abfragezeit laut PHPMyAdmin).

Diese Abfrage stimmt leider nicht ganz, es werden nur die Ausgegeben, welche den Suchbegriff im Namen und in der Kategorie enthalten. Als du dich dann am Beitrag beteiligt hast, bin ich vom eigendlichen Pfad abgewichen und wir sind bei der vorletzten Abfrage gelandet.

Naja egal, ich bedanke mich auf jeden Fall bei dir, hast dir ja echt M�he gegeben. Bin eigendlich kein Forenmensch

mfg
Ronny

Announcement

Suchabfrage verbessern

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment