Announcement

**defo** · 07.04.2014, 13:18

SQL kann nur Werte gruppieren, die auch als Merkmal vorliegen. In deinem Fall w�re das die 5 Minuten L�cke.
Du musst Dir also �berlegen, wie Du an diese Werte kommst.

Gedankenexperiment: Schaffe in Deinen Beispieldaten eine neue Spalte, die diese 5 minuten L�cke als "Datum" liefert. Dies w�re bspw. durch eine eindeutige oder alternierende Zahl m�glich. Diese Zahl tr�gst Du in die neue Spalte ein, also immer eine andere Zahl, wenn die L�cke gr��er als 5 Minuten ist.

Diese Daten kannst Du ganz leicht gem�� der Vorgaben gruppieren.
Frage ist nun, wie kann man diesen Wert per SQL dynamisch erzeugen?

Du brauchst eine Abfrage, die die L�cken gem�� Grenzwert findet, also alle Wechsel mit mehr als 5 Minuten "erkennt".
Hier ist es leider so, dass die mengenbasierte Arbeitsweise von SQL das nicht besonders einfach macht. Die Datenbankanbieter kochen da idR alle Ihr eigenes S�ppchen und nennen es Window Functions oder Analytic Functions. Manche Systeme beherrschen das auch gar nicht mittels direkter Funktionen. Mit diesen Funktionen bekommt man jedenfalls in SQL die M�glichkeit, Operationen duchzuf�hren wie man sie ganz normal aus Spreadsheet Anwendungen kennt, also z.B. "gib die Differenz zwischen Zelle A5 und B5 aus".

**SehraGuta** · 08.04.2014, 11:11

danke f�r den schnellen Antwort. Ja, genaue ist es. Was ich seit Tagen suche ist ja was Sie als neue Spalte gennant haben.
Im diesem Fall ist das die Spalte 'interval'. Die Spalte ist in dem Beispiel mit dem Wert '00:13:00' gef�llt.
Mit dem Befehl TIMEDIFF(max(Timestamp), min(Timestamp)) as interval hat es geklappt, und zwar f�r die ganze ZEitspanne des Lagerarbeiters.
Was jetzt fehlt ist, die L�cken oder Zeitabst�nde die mehr als 5 Minute sind auch zu bef�llen.
Ich habe heute gegoogelt und gelesen, dass man mit Selfjoin oder Subquery machen kann.
Habe probiert aber hat nicht geklappt. Haben Sie schon mal mit Selfjoin oder Subqueries gearbeitet?
Die Frage ist nur wie kriege ich die Selfjoin oder Subqueries da rein? Very tricky problem#
Danke im Voraus.

**defo** · 08.04.2014, 19:56

Falls es um mySQL geht, k�nnte man es wie unten machen. Vielleicht hat ein richtiger mySQL Kenner einen besseren Vorschlag. Die Nutzung von Variablen ist mit Vorsicht zu genie�en. Das finale Statement sollte jedenfalls gut gepr�ft werden.
Ich hab das Statement in mehreren Schichten aufgebaut, so kann man besser sehen, was passiert, ist aber unkompakt. Das Subselect f�r das TimeDiff ist bei gro�en Datenmenge wahrscheinlich nicht so performant.
[highlight=SQL]
select UserID, min(pTime) as pickStart, sum(pickNr) as UserPicks
from (select z.*,
case -- aus dem Intervall gr��er 5 Minuten einen eindeutigen Wert pro Gruppe bilden
when pInterval > 300
then @pickSet := @pickSet + 1
else @pickSet := @pickSet
end as pPickSet
from (select y.*,
timediff(y.ptime, y.priorptime) as pInterval -- Intervallberechnung
from (select p.*, -- Kern: alle picks mit subselect vorg�ngerzeit
(select max(ptime)
from pick x
where x.ptime < p.ptime
and x.userid = p.userid) as priorptime
from pick p
order by userid, ptime) y) z,
(SELECT @pickSet := 0) r -- Variableninitialisierung
) grp
group by UserId,
pPickSet -- eine der seltenen Gelegenheiten, nach einem Wert zu gruppieren, den man nicht ausgibt
[/highlight]

**SehraGuta** · 09.04.2014, 12:53

Ich bedanke mich bei Ihnen sehr herzlich f�r die Info!

**defo** · 09.04.2014, 16:24

Es w�rde mich interessieren, ob das wirklich performant und robust funktioniert, vor allem mit vielen Daten. Ist es wirklich ein mySQL System? Ansonsten wird es nicht funktionieren.
F�r analytic functions oder window functions, partition over usw. gibt es ansonsten zumindest unter mySQL nach aktuellem Stand (soweit ich wei�) auch weitere Emulationsm�glichkeiten via Group_Concat und verst�rkter Nutzung von sql @ variables.

Announcement

SQL Abfrage

SQL Abfrage

Comment

Comment

Comment

Comment

Comment