Announcement

**defo** · 12.02.2014, 09:31

Das Spannende w�re das Statement zu sehen, das in der SPUpdate l�uft.
Und dazu "for i := 0 to PDruckliste.Count"
Ist PDruckliste die Liste mit 1,8 Millionen Eintr�gen?
Laufen also hier 1,8 Millionen Aufrufe der SPUpdate durch?
Wenn ein SPAufruf 3 Sekunden dauert: Sind die Where Kriterien des Update auf indizierte Felder gesetzt?
Ein einzelnes Update sollte dann schneller laufen, zumindest wenn der Index auch verwendet wird und einer bis eine Handvoll DS betroffen sind.
Grunds�tzlich sehe ich keinen gro�en Sinn darin, 1,8 Mio Datens�tze auf den Client zu ziehen und dort durchzuackern, um wiederum auf dem Server 1,8 Mio Updates zu fahren.
Au�erdem ist fraglich, ob das Datenmodell ok ist, falls dieser Vorgang zum Tagesgesch�ft geh�rt. Worum geht's da? DWH?

**Uwe Merckens** · 12.02.2014, 13:20

Das Statement steht doch ganz oben :-)
Die 'WHERE'-Clause betrifft den PK.

Zwei L�sungsm�glichkeiten habe ich jetzt:
1. eine UDF. Diese berechnet den gew�nschten Wert. Problem sind hier wiederum zweierlei: es stehen nicht in jedem DS die ben�tigten Parameter, das m�sste man in der dll abfangen und vllt. '0' ausgeben. Ist aber nicht optimal. Das zweite ist, dass die UDF nicht funktioniert. Lokal auf einer 32 bit Maschine bricht die Connection ab. Hat sicher was mit der Speicherzuweisung zu tun. Da mu� ich noch mal bei. Auf dem Server l�uft die 32 bit dll nat�rlich nicht.

2. neue Tabelle angelegt. Felder ID und DRUCK. Aus der Liste habe ich die beiden Werte in die neue Tabelle gepumpt (ging rucki zucki) und frage die Daten per View ab. Das geht gut.

Dennoch bleibt die grunds�tzliche Frage, warum ein Bulk Update so qu�lend langsam l�uft. Stimmt es, dass beim UPDATE der DS gel�scht wird und ein neuer mit den aktualisierten Werten als INSERT eingef�gt wird.?

Uwe

**defo** · 12.02.2014, 16:46

Originally posted by Uwe Merckens View Post

Das Statement steht doch ganz oben :-)
Die 'WHERE'-Clause betrifft den PK.

Zwei L�sungsm�glichkeiten habe ich jetzt:
1. eine UDF. Diese berechnet den gew�nschten Wert. Problem sind hier wiederum zweierlei: es stehen nicht in jedem DS die ben�tigten Parameter, das m�sste man in der dll abfangen und vllt. '0' ausgeben. Ist aber nicht optimal. Das zweite ist, dass die UDF nicht funktioniert. Lokal auf einer 32 bit Maschine bricht die Connection ab. Hat sicher was mit der Speicherzuweisung zu tun. Da mu� ich noch mal bei. Auf dem Server l�uft die 32 bit dll nat�rlich nicht.

2. neue Tabelle angelegt. Felder ID und DRUCK. Aus der Liste habe ich die beiden Werte in die neue Tabelle gepumpt (ging rucki zucki) und frage die Daten per View ab. Das geht gut.

Dennoch bleibt die grunds�tzliche Frage, warum ein Bulk Update so qu�lend langsam l�uft. Stimmt es, dass beim UPDATE der DS gel�scht wird und ein neuer mit den aktualisierten Werten als INSERT eingef�gt wird.?

Uwe

Sorry, das hab ich falsch verstanden.
Zu der UDF kann ich nichts sagen.
Die neue Tabelle soll dann ein Puffer f�r die Updates sein oder dauerhaft?
Beim n�chsten Update dann wieder ne neue Tabelle?

Ja, angeblich macht FB ein Insert statt ein Update. Kenne ich aber nicht sehr gut.

Was ist denn mit der Indizierung? Ein Update, selbst wenn es durch Delete/insert ersetzt wird, braucht keine 2-3 Sekunden.
Wenn Du eh eine SP f�r das einzelne Update verwendest, wieso nicht gleich den gesamten Updatevorgang in der SP?

**Uwe Merckens** · 12.02.2014, 17:11

Originally posted by defo View Post

Die neue Tabelle soll dann ein Puffer f�r die Updates sein oder dauerhaft?
Beim n�chsten Update dann wieder ne neue Tabelle?

Die neue Tabelle soll bis eine bessere L�sung gefunden ist, erst mal dauerhaft bleiben und wird entsprechend erweitert.

Originally posted by defo View Post

Ja, angeblich macht FB ein Insert statt ein Update. Kenne ich aber nicht sehr gut.

Dennoch verstehe ich nicht, warum das so langsam geht. Das INSERT in die neue Tabelle hat bei 1,6 Mio DS irgendwas mit 5 Minuten gedauert. Meine irgendwo gelesen zu haben, dass das Problem im Erstellen der Log-datei liegt. Habe es aber noch nicht pr�fen k�nnen. Vllt. kann man das ja unterbinden.

Originally posted by defo View Post

Was ist denn mit der Indizierung? Ein Update, selbst wenn es durch Delete/insert ersetzt wird, braucht keine 2-3 Sekunden.

Nochmal: die WHERE-Clause bezieht sich auf den PK (ein Integer-Wert). 2-3 Sekunden sind vllt. etwas �bertrieben. Aber wenn man den UPDATE-Vorgang im Debugger verfolgt, vergeht sp�rbar Zeit. Kann sein, dass es nur eine Sekunde ist - muss ich mal messen.

Originally posted by defo View Post

Wenn Du eh eine SP f�r das einzelne Update verwendest, wieso nicht gleich den gesamten Updatevorgang in der SP?

Weil es unterschiedliche Werte sind. Es handelt sich um langj�hrige Klimadaten aus ganz Europa. Alleine die von D beinhalten die 1.8 Mio DS. Es geht um den Luftdruck, der immer f�r die Stationsh�he angegeben wird. Das kommt daher, dass bis zur Einf�hrung elektronischer Messstationen keine ad hoc-Umrechnung auf Meeresh�he durchgef�hrt werden konnte. Um fl�chigen Bodendruck zu ermitteln, brauche ich aber den Druck, wie er auf Meeresh�he sein w�rde (Stichwort barmetrische H�henformel).

Dabei handelt es bei diesen Daten um den 24-st�ndigen Mittelwert. Das gleiche steht mir noch f�r die st�ndlichen Werte bevor, die z.T. bis 1950 zur�ckreichen. Und dann habe ich erst die f�r D. Danach sollen die f�r Europa drankommen.

Ist vllt. die Einrichtung einer RAM-Disk auf dem Server und die Auslagerung der DB darauf eine Option?

Uwe

**Ralf Jansen** · 12.02.2014, 17:19

Stimmt es, dass beim UPDATE der DS gel�scht wird und ein neuer mit den aktualisierten Werten als INSERT eingef�gt wird.?

Insert, Update sind logische SQL Befehle Datenbank intern haben die aber kaum eine genaue Entsprechung.
Ein Snapshot/Multiversions- oder wie auch immer genanntes System einer Datenbank h�lt potentiel mehrere Versionen eines Datensatzes vor. Denn solange du obigen Update nicht commited hast wollen andere Leser ja die Originaldaten sehen(keine Dirty Reads!). Oder je nach Isolation Level sogar genau den Zustand zu Begin der Lesetransaktion auch wenn der Datensatz zwischenzeitlich schon anders commited wurde. Das geht am einfachsten (und vermutlich f�r Leser am schnellsten) mit multiplen Versionen einer Row.

So wie dann Transaktionen abgeschlossen werden l�scht die DB irgendwann mal alte Versionen der Rows wenn garantiert keine laufende Transaktion die noch interessant finden k�nnte.

**defo** · 12.02.2014, 17:43

Originally posted by Uwe Merckens View Post

Nochmal: die WHERE-Clause bezieht sich auf den PK (ein Integer-Wert). 2-3 Sekunden sind vllt. etwas �bertrieben. Aber wenn man den UPDATE-Vorgang im Debugger verfolgt, vergeht sp�rbar Zeit. Kann sein, dass es nur eine Sekunde ist - muss ich mal messen.

Ok, ich bin glaub ich etwas begriffsstutzig heute. Oben hast Du von "neuem Wert" in "leeres Feld " geschrieben. Ergebnis langsam.
Sp�ter hast Du von neuer Tabelle mit 2Feldern geschrieben. Ergebnis schnell.

Wurde das "leere Feld" nachtr�glich angelegt (alter table add mynewcolumn..)?
Wenn ja, k�nnte das die Ursache sein. Die Interna von Firebird sind mir nicht bekannt-ich kenne sowas �hnliches von Oracle-, aber es ist einfach gesagt denkbar, das die neue Spalte nie dort liegt, wo sie per PK zun�chst gesucht wird. Da steht dann nur der Verweis auf eine neue Location f�r die neue Spalte. Die Festplatte f�hrt also Achterbahn.
Dieses Problem kann man mit Reorganisation der Tabellenstruktur beheben. Wei� aber nicht, was FB da alles kann.
Zu Fu� ungef�hr so :
Create Table NewWetterdaten <mit entg�ltiger Struktur>
insert into NewWetterdaten ()
Select * from Wetterdaten

**Thomas Steinmaurer** · 14.02.2014, 23:06

Hallo,

solltest du Firebird 2.5 verwenden, dann w�rde ich an deiner Stelle mal die Trace API anwerfen und f�r einen Bruchteil, z.b. 1000 Datens�tze (damit das erste Commit mal greift), das Ganze verfolgen.

Btw, ist auf Wetterdaten.DRUCK_MEERESHOEHE auch ein Index?

LG

Announcement

Update extrem langsam

Update extrem langsam

Comment

Comment

Comment

Comment

Comment

Comment

Comment