Announcement

**dimitri** · 08.10.2010, 12:22

Committest Du denn auch die �nderung in dieser tempor�ren Tabelle? Ansonsten warten die anderen nat�rlich darauf, dass die Transaktion beendet wird.

Ganz gl�cklich finde ich die Mthode allerdings nicht. Hast Du die M�glichkeit die Segmente schon vorher festzulegen? Wir verwenden dazu z.B. immer eine Ziffer in einer Nummer die die Menge in etwa gleich gro�e Teile aufteilt.
Z.B. SELECT * from tab where einenummer like '%1_' w�ren alle Daten, die an der Vorletzten Stelle eine 1 haben.
Das ganze durchnummeriert von 0-9 ergibt wieder die Komplette Menge. Damit hast Du vor dem Start der Jobs schon festgelegt, wer was machen soll.

Dim

**Biggreuda** · 08.10.2010, 12:32

Wow, die Antwort kam schnell!

Ja, ein Commit h�ngt immer hinten dran.

Die von dir erw�hnte Methode hatte ich zuerst auch ausprobiert. Das Problem dabei ist aber, dass ich damit das ganze in h�chstens 10 Segmente zerlegen k�nnte. Damit dauert die �berpr�fung bei den sehr gro�en Tabellen auch noch sehr lange. Au�erdem w�rden sie die Tabelle auch komplett �berpr�fen, wenn irgendwo ein Fehler/Unterschied gefunden werden sollte. Bei mir habe ich halt in der Tempor�ren Tabelle auch ein Feld f�r die gefundenen Fehler. Findet ein Job Fehler, so werden diese gleich in die Spalte eingetragen und alle anderen Jobs starten sich nicht mehr neu, falls sie dort einen Wert finden, sondern schicken gleich eine Mail an den Verantwortlichen (bzw. der erste davon).

Hmm, es ist schon schwierig zu erkl�ren was mein Package alles macht und Datenbanken kommen in der Schule auch erst im n�chsten Jahr... :/

**dimitri** · 08.10.2010, 13:39

Das Problem dabei ist aber, dass ich damit das ganze in h�chstens 10 Segmente zerlegen k�nnte

Nein Du kannst das in beliebig viele Teile zerlegen, wenn Du pro Blockmehr Ziffern in die Abfrage nimmst. Also ...LIKE '%00', ...LIKE '%10' etc.

Da ich selbst hier seit vielen Jahren Daten verteile und das ganze auch parallel ablaufen muss, kann ich Dir nur raten das Aufteilen der Bl�cke und das Abarbeiten zu trennen. Fehler k�nnen ebenfalls �ber diese Tabelle mitgeteilt werden.

Zu Deinem aktuellen Problem: Wenn danach ein Commit kommt, muss anschlie�end eine andere Session dran kommen bis alle durch sind. Warten denn alle Sessions oder l�uft eine weiter? Falls alle warten, dann hat jemand ganz anderes noch eine offene Transaktion und blockiert das Update.

Dim

**Biggreuda** · 08.10.2010, 15:35

Okay, am besten fasse ich noch mal kurz zusammen.
Die zu �berpr�fenden Tabellen werden erst mal zusammen mit allen ben�tigten Daten ermittelt.

Dann werden diese einzeln nacheinander abgearbeitet.
Sollten sie unter einer bestimmten Gr��e liegen, dann wird ein einfaches MINUS ausgef�hrt. Bei zu gro�en Tabellen wird normalerweise der h�chstfavourisierte Primary Key der auf einer Spalte mit NUMBER-Werten liegt ermittelt und anhand dessen werden die erw�hnten Segmente sowie auch gleich deren Gr��e erstellt.

Danach wird eine Procedure aufgerufen, welche zuerst die tempor�re Tabelle erstellt und mit Werten f�llt, bevor sie per dbms_job.submit leicht verz�gert die einzelnen Jobs startet. Diese einzelnen Jobs gucken zuerst in die tempor�re Tabelle, was sie zu tun haben und ob evtl. schon Differenzen gefunden werden. Wenn keine Differenzen in der Tabelle vorhanden sind, dann �berpr�fen sie ihren Teil.
Wenn sie Differenzen finden, dann schreiben sie dies entsprechend in die Tabelle und schicken dann eine Mail raus. Finden sie keine, so schauen sie in der temp-Tabelle nach, an welcher Stelle die �berpr�fung gerade ist und ob noch was �ber ist. Falls ja, so starten sie sich praktisch selber wieder neu.

Damit ist halt haupts�chlich geplant Performance zu sparen, besonders wenn es Fehler gab.
Man kann es sich so vorstellen, dass 8 Prozesse unabh�ngig voneinander sich die ganze Tabelle st�ck f�r St�ck vornehmen. Sollte einer was finden, so schreit er und alle anderen machen ihr Segment fertig, h�ren danach aber auf.
So schlecht finde ich meinen Plan gar nicht, das einzige Problem ist halt nur der erw�hnte Lock. Der kommt �brigens auch nicht immer, aber sicher reproduzieren konnte ich den Fehler leider noch nicht.

**dimitri** · 08.10.2010, 16:06

Hast Du dir schon mal �berlegt, Trigger auf die Tabellen zu setzen, die in einer Logtabelle den Namen der Tabelle, den PK und die Art der �nderung protokolieren?
Damit brauchst Du nicht zig GB abzugleichen, sondern hast direkt eine �nderungshistorie und wei�t welche S�tze betroffen sind.

Wegen den Locks m�sste man sich wohl den Code ansehen, das scheint mir irgendein Problem im Ablauf zu sein.

Dim

**Biggreuda** · 08.10.2010, 16:32

Sorry, aber mit Triggern kenne ich mich nocht gar nicht aus.
AU�erdem geh�rte es zur Auflage des Projektes, dass keine zus�tzliche Tabelle mehr angelegt werden sollte. Mit der tempor�ren Tabelle bin ich da schon an der Grenze.
Das Script soll auch nur sehr selten und unter verschiedenen Bedingungen ausgef�hrt werden.

Das Package habe ich auch geschrieben w�hrend ich PL/SQL gelernt habe, daher ist es evtl. etwas chaotisch, auch wenn ich daran arbeite es aufzur�umen und zu optimieren. Bin trotzdem noch bei �ber 1600 Zeilen...
Aber ich schaue mal, dass ich die entsprechenden Stellen aus dem Code kopiere.

Vielen Dank auf jeden Fall schon mal f�r die Hilfe!

Code:

PROCEDURE SEGMENT_CHECK (p_temp_schema   IN VARCHAR2,
                            p_temp_table    IN VARCHAR2,
                            p_run_schema    IN VARCHAR2)
   IS
   
   BEGIN
      DECLARE
         v_differences     NUMBER := 0;
         v_already_found   NUMBER := 0;
         v_where           VARCHAR2 (512);
         v_max             NUMBER := 0;
         num_job           NUMBER := 0;
         v_job             VARCHAR2 (1024);
         send              EXCEPTION;
         no_table          EXCEPTION;
         v_subject         VARCHAR2 (70) := NULL;
         v_message         VARCHAR2 (4098) := NULL;
         new_pk            NUMBER := 0;
         v_table_there     NUMBER := 0;
         v_schema          VARCHAR2 (32);
         v_name            VARCHAR2 (40);
         v_min             NUMBER;
         v_recipient       VARCHAR2 (128);
         v_segment         NUMBER;
         v_pk_complete     NUMBER;
         v_column          VARCHAR2 (64);
         v_columns         VARCHAR2 (2048);
         v_size            VARCHAR2 (32);
         v_rows            VARCHAR2 (32);
         a_protocol        VARCHAR2 (4096) := NULL;
         v_percent         VARCHAR2 (32) := NULL;
      BEGIN
         -- The procedures are tending to synchronize, so that they sooner or later all scan the same segments at a time. To avoid that, I included a random delay
         DBMS_LOCK.SLEEP (DBMS_RANDOM.VALUE);

         a_protocol :=
            a_protocol
            || '<ul><li><div border="3">SEGMENT_CHECK started</li>';

         EXECUTE IMMEDIATE 'SELECT NVL(COUNT(*),0) FROM all_tables WHERE owner = '''
                          || p_temp_schema
                          || ''' AND table_name = '''
                          || p_temp_table
                          || ''''
            INTO v_table_there;

         IF v_table_there > 0
         THEN
            EXECUTE IMMEDIATE 'SELECT NVL(SUM(differences),0) FROM '
                             || p_temp_table
               INTO v_already_found;
         ELSE
            RAISE no_table;
         END IF;

         EXECUTE IMMEDIATE   'SELECT T_SCHEMA'
                          || ',T_NAME'
                          || ',PK_MIN'
                          || ',E_MAIL'
                          || ',SEGMENT_SIZE'
                          || ',MAX_PK'
                          || ',CONDITION'
                          || ',PK_COLUMN'
                          || ',T_COLUMNS'
                          || ',T_SIZE'
                          || ',T_ROWS'
                          || ' FROM '
                          || p_temp_schema
                          || '.'
                          || p_temp_table
            INTO v_schema,
                 v_name,
                 v_min,
                 v_recipient,
                 v_segment,
                 v_pk_complete,
                 v_where,
                 v_column,
                 v_columns,
                 v_size,
                 v_rows;

         new_pk := v_min + v_segment + 1;
         v_percent := ROUND (v_min / (v_pk_complete / 100), 2);

         IF v_percent > 100
         THEN
            v_percent := 'Nearly 100%, scanning last block.';
         ELSE
            v_percent := 'ca. ' || TO_CHAR (v_percent) || ' Percent done';
         END IF;

         a_protocol := a_protocol || '<br />Prozent erreicht= ' || v_percent;

         EXECUTE IMMEDIATE   'BEGIN UPDATE '
                          || p_temp_schema
                          || '.'
                          || p_temp_table
                          || ' set pk_min = '
                          || new_pk
                          || ', last_checked = sysdate, COMNT = '''
                          || v_percent
                          || '''; COMMIT; END;';

         v_where := REPLACE (v_where, '''''', '''');

         v_max := v_min + v_segment;

         EXECUTE IMMEDIATE   '    SELECT  case  '
                          || '    FROM ('
                          || ' SELECT  CASE WHEN COUNT(*) < 0 THEN '
                          || '              0 '
                          || '          ELSE '
                          || '           count(1) '
                          || '         END CASE'
                          || '          FROM( '
                          || '        SELECT '
                          || v_columns
                          || '        FROM '
                          || v_schema
                          || '.'
                          || v_name
                          || '         '
                          || v_where
                          || v_column
                          || ' BETWEEN '
                          || v_min
                          || ' AND '
                          || v_max
                          || '        MINUS'
                          || '        SELECT '
                          || v_columns
                          || '        FROM '
                          || '**Hier Steht das Schema der Repliaktion **.'
                          || v_name
                          || '         '
                          || v_where
                          || v_column
                          || ' BETWEEN '
                          || v_min
                          || ' AND '
                          || v_max
                          || '        )) '
            INTO v_differences;

         IF     v_differences = 0
            AND v_min < v_pk_complete
            AND v_max < v_pk_complete
            AND v_already_found = 0
         THEN
            EXECUTE IMMEDIATE   'SELECT PK_MIN FROM '
                             || p_temp_schema
                             || '.'
                             || p_temp_table
               INTO v_max;

            IF v_max < v_pk_complete
            THEN
               v_job :=
                     'BEGIN '
                  || p_run_schema
                  || '.**PACKAGE_NAME**.SEGMENT_CHECK('''
                  || p_temp_schema
                  || ''', '''
                  || p_temp_table
                  || ''', '''
                  || p_run_schema
                  || '''); END;';
               a_protocol := a_protocol || '<br />' || v_job || '<hr />';
               DBMS_JOB.SUBMIT (num_job, v_job, SYSDATE);
            END IF;
         ELSIF v_max >= v_pk_complete
         THEN
            DBMS_LOCK.SLEEP (90);

            EXECUTE IMMEDIATE   'SELECT NVL(SUM(differences),0) FROM '
                             || p_temp_schema
                             || '.'
                             || p_temp_table
               INTO v_already_found;

            v_differences := v_differences + v_already_found;

            RAISE send;
         ELSIF v_differences > 0
         THEN
            EXECUTE IMMEDIATE   'SELECT NVL(SUM(differences),0) FROM '
                             || p_temp_schema
                             || '.'
                             || p_temp_table
               INTO v_already_found;

            IF v_already_found = 0
            THEN
               EXECUTE IMMEDIATE   'BEGIN UPDATE '
                                || p_temp_schema
                                || '.'
                                || p_temp_table
                                || ' SET differences = '
                                || v_differences
                                || ', last_checked = sysdate; END;';

               DBMS_LOCK.SLEEP (90);

               RAISE send;
            ELSE NULL;
            END IF;
         ELSIF v_already_found > 0
         THEN
         NULL;
         END IF;

         a_protocol := a_protocol || '<li>Segment_Check succesfull</li></ul>';

      END;
   END SEGMENT_CHECK;

P.S.: Ich hatte noch ne Menge Exceptions drin, aber die passten nicht mehr rein...

**Biggreuda** · 01.12.2010, 17:10

Hallo nochmal,

sorry f�r den Doppelpost, aber ich denke mal, nach 2 Monaten darf ich

Das ganze Projekt hat sich weiter entwickelt und l�uft nun mittlerweile recht gut.
Das Problem mit den Locks habe ich jetzt so l�sen k�nnen, dass in der tempor�ren Tabelle eine Zeile f�r jeden parallelen Prozess angelegt wird.

Die einzelnen Jobs haben jetzt eine ID, welche als Parameter mitgegeben wird.
Zus�tzlich habe ich noch einen Debugging-Modus mit eingebaut, in welchem die einzelnen Jobs jeweils eintragen, was sie getan haben.
Eigentlich war dies eher dazu da, um zu sehen, ob auch wirklich alle Segmente der Tabelle gepr�ft wurden.
Nun mein neues Problem, aus dem eventuell auch mein letztes Problem entstanden ist.

In der Debugging-Tabelle konnte ich sehen, dass trotz genau hundert zu �berpr�fenden Segmenten, 119 Zeilen eingef�gt wurden. Obwohl die ersten Jobs mit jeweils meheren Sekunden Abstand gestartet werden, sind sie sehr oft genau gleichzeitig fertig. Dabei scheint die Reihenfolge egal zu sein, Job 1 ist oft gleichzeitig mit Job 3 fertig, Job 16 und 17 treffen auch auf die gleiche Sekunde, etc.
Jetzt gucken diese nat�rlich gleichzeitig in die tempor�re Tabelle, welches Segment als n�chstes dran ist, und schnappen sich deshalb das gleiche. Teilweise sind es sogar 3 oder 4 auf einmal, welche das gleiche tun.

Es w�re ja nicht schlimm, wenn diese Jobs nicht teilweise 1/2h und l�nger brauchen w�rden und ihnen nur ein begrenztes Zeitfenster zur Verf�gung steht.
Gibt es da irgend etwas, was die Jobs der Datenbank irgendwie synchronisiert?

Ein kleines Beispiel aus der Debugging-Tabelle:
JOB_ID | TIME_STARTED | TIME_READY
4 15:52:02 16:03:29
8 15:51:27 16:03:29

Zuerst habe ich es f�r Zufall gehalten, aber bei einer Trefferquote von 20% behaupte ich einfach mal, dass es selbst f�r einen Pechvogel wie mich zu viel ist^^

Edit:
Hier mal eine Grafik, wie der aktuelle Job l�uft:

Announcement

Parallele Updates Locken sich gegenseitig

Parallele Updates Locken sich gegenseitig

Comment

Comment

Comment

Comment

Comment

Comment

Comment