Announcement

**Christian Marquardt** · 16.05.2011, 10:56

Welche Datenbank?
Welche Hardware/Server?

**Ralf Jansen** · 16.05.2011, 11:07

Gibt es da eine Formel?

Vielleicht. Aber sicher keine die mehr als akademischen Werte h�tte da die Anzahl Parameter viel zu hoch w�ren und viele von denen nicht so einfach zu ermitteln sind. Ausprobieren und intelligent hoch rechnen ist wahrscheinlich einfacher, genauer und man hat schneller ein Ergebnis.

**Nayko** · 16.05.2011, 11:23

Danke f�r die Antworten!
Zum Modellieren habe ich nur eine Access-DB verwendet, sp�ter wird ein SQL Server die Arbeit �bernehmen.
Eine Zeitangabe muss nicht unbedingt gemacht werden, die Anzahl der Operationen w�rde erstmal schon reichen. Funktioniert es denn, einfach die Anzahl der Datens�tze aller (verkn�pften) Tabellen zu multiplizieren?
Mal als abstraktes Beispiel:
4 Tabellen (eine davon verkn�pfend):
1. Tabelle "Auto": $ID, Marke
2. Tabelle "Farben": $ID, Farbe, K�rzel
3. Tabelle "Motor": $ID, PS, Hubraum
4. Tabelle "�bersicht": $ID, Automarke, Farbe, PS

die ersten 3 Tabellen enthalten au�er der ID (Integer) nur String-Werte. Die 4. Tabelle enth�lt nur Integer-Werte, die eine referenz auf die ID der anderen 3 Tabellen verweisen.
Angenommen Tabelle 1 enth�lt: 1, Audi; 2, VW; 3, Volvo
Tabelle 2 enth�lt: 1, rot, r; 2, blau, b; 3, gr�n, g
Tabelle 3 enth�lt: 1, 75, 1400; 2, 119, 1800;
Tabelle 4 enth�lt: 1, 1, 1, 1; 2, 2, 2, 2; 3, 3, 2, 2
Tabelle 4 soll mir ja nun nicht die Zahlen sondern die Strings wiedergeben also
1, Audi, rot, 75ps; 2, VW, blau, 119ps; 3, Volvo, blau, 119ps

Kann man da jetzt berechnen, wieviele Operationen da�fr notwendig sind?

**Ralf Jansen** · 16.05.2011, 11:34

Definiere was in diesem Zusammenhang 'Operation' bedeuten soll.

**Christian Marquardt** · 16.05.2011, 11:40

Habe eigentlich auf m.E. zwei wichtige Punke hingewiesen. Es kommt darauf an, mit welcher DB und auf welcher Hardware das l�uft.

Dann erstelle eine Testversion, die 10, 100 oder xx mal die Datenbankabfrage t�tigt. Dann rechne das hoch...

**Nayko** · 16.05.2011, 12:06

Operation in dem Zusammenhang w�ren sozusagen die Vergleiche. Bei der Abfrage im Bsp. w�rde ja vereinfacht gesagt zuerst die Tabelle Autos durchlaufen und solange gesucht, bis die ID aus Tabelle �bersicht gefunden w�rde. Genau dann so mit Farbe und Motor.
H�tte jede Tabelle 1000 Datens�tze und man ginge vom Worst-Case aus (also die gesuchte ID befindet sich am Ende der Tabelle) w�ren das ja 1000*1000*1000 Operationen, oder nicht?

**Christian Marquardt** · 16.05.2011, 12:21

Das sind Gedanken, die sich die Entwickler einer DB machen m�ssen.
Des Weiteren gibt es dazu Indexfelder, die die Suche beschleunigen usw. F�r die Suche selbst werden die Entwickler wohl keine lineare Suche implementiert haben

http://de.wikipedia.org/wiki/Suchstrategie

**Ralf Jansen** · 16.05.2011, 13:03

Selbst MS Access wird man wahrscheinlich nicht so eingestellt bekommen das es so naiv vorgeht(Indizes weglassen, Primary Keys weglassen, irgendwie Verhindern das die Datenbank selbst die g�nstigste Tabelle zum anfangen ausw�hlt etc. etc.).

Wenn eine Datenbank so vorgehen w�rde w�re deine Rechnung �brigens nur dann richtig wenn du 1000 absolut identische Autos h�ttest und dann noch in den 3 anderen Tabellen jeweils 999 �berfl�ssige Datens�tze.

**Wernfried** · 20.05.2011, 17:13

Originally posted by Nayko View Post

Operation in dem Zusammenhang w�ren sozusagen die Vergleiche. Bei der Abfrage im Bsp. w�rde ja vereinfacht gesagt zuerst die Tabelle Autos durchlaufen und solange gesucht, bis die ID aus Tabelle �bersicht gefunden w�rde. Genau dann so mit Farbe und Motor.
H�tte jede Tabelle 1000 Datens�tze und man ginge vom Worst-Case aus (also die gesuchte ID befindet sich am Ende der Tabelle) w�ren das ja 1000*1000*1000 Operationen, oder nicht?

Ich beziehe mich jetzt mal auf Oracle:
Die Tabellen werden der Reihe nach verkn�pft, der Worst-Case ist nat�rlich 1000*1000*1000 aber wenn die beiden ersten Tabellen weniger als 1000*1000 Datens�tze liefern, wird die dritte Runde kleiner. Anders ausgedr�ckt: Wenn A und B nicht �bereinstimmen muss ich (A und B) und C nicht mehr �berpr�ft weil die Ergebnismenge immer leer ist.

Es kommt ausserdem darauf an wie die Datenbank die Tabellen verbindet. Bei einem "Nested-Join" wird es so gemacht wie oben von dir angedeutet. Bei einem "Hash-Join" wird es anders gemacht, da fallen bereits vorher Datens�tze raus, bzw. m�ssen nicht mehr verglichen werden weil klar ist, dass es keine �bereinstimmung geben kann.

Man kann nicht pauschal sagen wie die Tabellen verbunden werden weil es nicht nur durch deren Aufbau bestimmt wird (es sei denn du verwendest den Rule Based Optimizer RBO, der ist aber veraltet), sondern auch durch die Daten in den Tabellen. Es gibt durchaus Situationen in denen es schneller ist, einen Index nicht zu lesen.

Deine Frage ist nicht so einfach zu beantworten, das Buch Cost-Based Oracle Fundamentals hat �ber 500 Seiten und besch�ftigt sich nur mit diesem einem Thema.

Gruss

Announcement

Dauer einer SQL-Abfrage

Dauer einer SQL-Abfrage

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment