Announcement

**Falk Pr�fer** · 01.10.2009, 08:17

Hallo,

Originally posted by Alexander_ View Post

...wie kann ich in einer laufenden Abfrage sicherstellen, dass nur neue ID�s hinzugenommen werden die NOCH NICHT in der neuen Tabelle vorhanden sind.

War das verst�ndlich???

Nein, nicht wirklich.

Originally posted by Alexander_ View Post

...
NOT IN ((SELECT apn_id FROM Tab1) AND (SELECT refID FROM Tab3))

Das ist syntaktischer Unsinn! Wenn, dann m��te das so hei�en:
[highlight=sql]
...
NOT IN (
SELECT apn_id FROM Tab1)
AND NOT IN (
SELECT refID FROM Tab3)
[/highlight]
Im Zusammenhang mit einem CREATE TABLE AS SELECT ist es jedoch auch logischer Unsinn. Da die Tabelle gerade erstellt wird (CREATE), kann auf sie auch noch nicht zugegriffen werden, geschweige denn das sie Daten enth�lt.

Deshalb das obige Nein, da mir nicht ganz klar ist was du bezweckst.

Gru� Falk

**Alexander_** · 01.10.2009, 10:06

Hallo Falk,

Im Zusammenhang mit einem CREATE TABLE AS SELECT ist es jedoch auch logischer Unsinn. Da die Tabelle gerade erstellt wird (CREATE), kann auf sie auch noch nicht zugegriffen werden, geschweige denn das sie Daten enth�lt.

... genau das ist das Problem ... ich hab auch den syntaktischen Fehler behoben und bekomme dann immer den Fehler #1093 - (Verwendung der sich aktualisierende Zieltabelle ist in einer FROM-Klausel nicht zul�ssig)

Aber genau das brauche ich!!
Ich m�chte im Prinzip sicherstellen, dass nur neue Datens�tze aus einer Tab2 geholt werden die bisher noch nicht (bis zum jetzigen Zeitpunkt in der Anfrage) aus dieser Tab2 geholt wurden. Also an sich m��te meiner Meinung nach die Tabelle auf sich selber zugreifen ...

Ist das verst�ndlicher?
Kann man das irgendwie anders verwirklichen?

Viele Gr��e
Alex

**Alexander_** · 01.10.2009, 12:52

Hi,

ich nochmal ...

ein kleines Bsp um es zu verdeutlichen:
ID ist die Augangsid aus Tab1 - die refID wird nun aus Tab2 geholt:

Tab3

ID - refID
1 - 5
2 - 7
3 - 2
4 - 9
5 - 7 <----- Fehler ... da 7 schon als refID aus Tab2 geholt wurde!!!! stattdessen mu� eine refID genommen werden die noch nicht in der sich aufbauenden Tabelle vorhanden ist! Hier also alle au�er 2,5,7,9 ...

Wie kann ich das sicherstellen???

Gr��e
Alex

**Falk Pr�fer** · 02.10.2009, 08:24

Hallo,

Originally posted by Alexander_ View Post

...Wie kann ich das sicherstellen???

indem du die Basis also die SELECT-Abfrage so formulierst das sie eindeutige Werte liefert. (z.B. �ber ein Distinct)

Gru� Falk

**Alexander_** · 03.10.2009, 11:29

Hi Falk,

also hab es mal mit DISTINCT versucht - klappt aber (zumindest so) nicht:

CREATE TABLE Tab3
SELECT
(SELECT DISTINCT s.ID
FROM Tab2 s
WHERE s.ID NOT IN (SELECT apn_id FROM Tab1)
ORDER BY rand(10)
LIMIT 1) refID
FROM Tab1;

Da bekomme ich genau das gleiche Ergebnis wie davor ... Oder meinstest du das anders?

Gr��e
Alex

**Falk Pr�fer** · 05.10.2009, 08:15

Hallo Alex,

mir ist nachwievor nicht ganz klar, was du bezweckst.

In der Select-Anweisung f�r dein Create-Statement hast du ein LIMIT 1 drin, damit wird die Tabelle immer mit genau EINEM Datensatz gef�llt - Logisch das da ein Distinct keine Ver�nderung bringt.
Du willst eine Tabelle erstellen und gleichzeitig mit Werten bef�llen, die "BISHER (w�hrend die Abfrage l�uft) noch nicht in der neuen Tab enthalten sind. ". Du f�gst jedoch nur EINEN Datensatz ein (wg. LIMIT 1). Also entweder hast du einen grunds�tzlichen Denkfehler oder wir reden aneinander vorbei.

Gru� Falk

**fanderlf** · 05.10.2009, 08:38

Das Problem ist doch, dass er die Tabelle die er updaten m�chte nicht im Subselect verwenden kann.
Du k�nntest mal versuchen eine View auf die Tabelle anzulegen und diese dann im Subselect zu verwenden

Ist zwar nicht wirklich sch�n, aber es sollte funktionieren.

**Falk Pr�fer** · 05.10.2009, 09:11

Hallo,

Originally posted by fanderlf View Post

Das Problem ist doch, dass er die Tabelle die er updaten m�chte nicht im Subselect verwenden kann.

Genau, weil es um ein Create-Statement geht und dort kann man in keinem mir bekannten DBMS auf die gerade erstellte Tabelle zugreifen.

Originally posted by fanderlf View Post

...Du k�nntest mal versuchen eine View auf die Tabelle anzulegen und diese dann im Subselect zu verwenden

Ist zwar nicht wirklich sch�n, aber es sollte funktionieren.

Na dann versuch mal auf eine nicht existente Tabelle eine View anzulegen... Da kenn ich auch kein DBMS bei dem das m�glich ist.

Gru� Falk

**Alexander_** · 05.10.2009, 09:44

Hi,

ja genau was fanderlf sagte ist mein Problem und funktioniert so nicht...

Das limit 1 kommt daher, dass ich aus einer gr��eren Tab2 zu jedem einzelnen Datensatz aus einer kleineren Tab1 genau EINEN EINZIGEN zuf�llig ausgew�hlten Datensatz holen m�chte der in Tab3 geschrieben wird.

Dabei soll aber sicher gestellt werden, dass nicht 2 mal der gleiche Datensatz zuf�llig aus Tab2 geholt wird. Und genau das ist mein Problem, dass zu bewerkstelligen.

Zur Erkl�rung:
Was f�r einen Datensatz ich jetzt aus Tab2 zu dem jeweiligen Datensatz in Tab1 hole wird �berpr�ft u.a. durch gleiches Anmeldejahr, gleiches Geburtsland etc ...
Es geht darum eine gleich aufgebaute Kontrollgruppe aufzubauen f�r statistische Auswertungen.

**Falk Pr�fer** · 05.10.2009, 10:03

Vlt. hab ich ja eine lange Leitung aber

Originally posted by Alexander_ View Post

...dass ich aus einer gr��eren Tab2 zu jedem einzelnen Datensatz aus einer kleineren Tab1 genau EINEN EINZIGEN zuf�llig ausgew�hlten Datensatz holen m�chte der in Tab3 geschrieben wird.

Dabei soll aber sicher gestellt werden, dass nicht 2 mal der gleiche Datensatz zuf�llig aus Tab2 geholt wird.

Ist f�r mich in sich widerspr�chlich wieso mu�t du Eindeutigkeit sicherstellen wenn eh nur EIN EINZIGER Datensatz ausgew�hlt werden soll

.
Du erstellst eine Tabelle mit einem einzigen Datensatz und eine Tabelle kann nur EINMAL erstellt werden. Wie passt hier bitte: "dass nicht 2 mal der gleiche Datensatz zuf�llig aus Tab2 geholt wird"

Gru� Falk

**Alexander_** · 05.10.2009, 10:47

Hi,

ja aber ich w�hle einen einzigen Datensatz aus Tab2 f�r JEDEN vorkommenden Datensatz in Tab1 aus und nicht absolut.

Ein Bsp.:
Ich habe Tab1 mit 1.000 Datens�tzen und Tab2 mit 1.000.000 Datens�tzen - jeweils mit ID, Anmeldejahr, Geburtsort und weiterer Daten ...
Dann m�chte ich jetzt eine Tab3 erstellen mit genau 1.000 Datens�tzen die aus Tab2 kommen, die jeweils das gleiche Anmeldejahr und gleichen Geburtsort wie die Datens�tze in Tab1 besitzen.
Ich will also f�r jeden Datensatz in Tab1 ein 'Beispieldatensatz' aus Tab2 haben. Gibt es jetzt in Tab1 mehrmals die gleiche Kombination von Anmeldejahr und Geburtsort - dann k�nnte theoretisch auch zuf�llig der gleiche Datensatz NOCH EINMAL aus Tab2 ausgew�hlt werden - und genau das darf nicht passieren. Die 'Beispieldatens�tze' m�ssen einzigartig sein!

Besser zu verstehen?

Hab das mal mit einem VIEW versucht (theoretisch ja ganz logisch) ... also mit CREATE OR REPLACE VIEW ...
Aber komme da mit der Syntax nicht klar - Kann man einen VIEW innerhalb einer Query anlegen und abfragen???

Gr��e
Alex

**frauwue** · 05.10.2009, 13:42

Select distinct tab2.id where tab2.id in (select tab1.id from tab1)

**Alexander_** · 05.10.2009, 14:39

Hallo frauwue,

leider klappt dieser Ansatz nicht - da ich nicht die ID�s vergleichen kann ... D.h. die ID�s aus Tab1 sind nat�rlich nicht in Tab2 enthalten. Ich vergleiche die Datens�tze anhand von Anmeldejahr und Geburtsort und hole mir dann einen mit diesen gleichen Attributen nach Tab3.

Vielleicht nochmal ein ausf�hrlicheres Bsp:

Komplette Tab1:

ID Anmeldejahr Geburtsort
1 1990 Berlin
2 2001 M�nchen
3 2005 Frankfurt

Auszug aus Tab2:

ID Anmeldjahr Geburtsort
34 1990 Berlin
579 2001 M�nchen
9 2005 Frankfurt
24 2001 M�nchen

Tab3:

ID Anmeldejahr Geburtsort
34 ...
579 oder 24
9

Tab2 ist nat�rlich um ein Vielfaches gr��er und die ID`s sind nicht vergleichbar.

Die Anfrage zu Tab3 geht also jetzt jeden Datensatz in Tab1 Zeilenweise durch und schaut welche Datens�tze in Tab2 das gleiche Anmeldejahr und Geburtsort haben. Von denen nimmt er zuf�llig eines und schreibt es in Tab3 ... In diesem Fall also bei 2001 und M�nchen die 579 oder 24.

Soweit klappt ja auch alles und ist kein Problem.

Das Problem entsteht wenn jetzt in Tab1 ein weiterer Datensatz mit 4, 2005, Frankfurt enthalten w�re. Das gleiche Tupel (2005, Frankfurt) ist n�mlich schon im Datensatz mit 3, 2005, Frankfurt enthalten.
In diesem Fall k�nnte wiederrum der Datensatz 9, 2005, Frankfurt aus Tab2 geholt - ergo ist dieser Datensatz dann 2mal in Tab3 enthalten <- das darf nicht passieren!

Die Tupel in Tab2 sind aufgrund der Gr��e der Tabelle nat�rlich alle mehrmals enthalten...

Ich wei� jetzt nicht ob das zur Erkl�rung beigetragen hat oder verwirrt!

**frauwue** · 05.10.2009, 15:04

Wie w�re es hiermit?

Select min(tab2.id),tab2.anmeldejahr,tab2.geburtsort
where exists (select * from tab1
where tab1.anmeldejahr=tab2.anmeldejahr
and tab1.geburtsort=tab2.geburtsort)
group by tab2.anmeldejahr,tab2.geburtsort

Announcement

Abfrage gesucht...

Abfrage gesucht...

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment