Announcement

**Compufreak** · 10.11.2011, 14:48

Update : Habe gerade von einem Kollegen das Schlagwort der "Linq Extensions" bekommen - werde mich mal darüber belesen. Bin weiterhin offen für weitere Ideen.

**fanderlf** · 10.11.2011, 15:40

Mh vielleicht wäre es auch eine Idee die Daten in eine DB zu stopfen die sowas von Hause aus kann. Und die kann das wahrscheinlich auch performanter als selbst geschriebener Code.

**Compufreak** · 10.11.2011, 16:27

Danke für den Vorschlag, die Idee hatte ich auch schon (Sorry, vergessen zu erwähnen :0) - Ich war nur nicht so sicher, ob ich unsere produktive Oracle-Datenbank, die sowieso schon teilweise recht umfangreiche Queries zu bearbeiten hat, damit einmal die Woche belasten will... Zumal das wahrscheinlich Montags wäre, wo sie eh schon mit neuen Daten befüttert wird und alle auf sie "losrennen", um sich den aktuellen Stand zu holen. Vielleicht ist der Rechenaufwand dafür auch vernachlässigbar klein, ist glaube ich sogar ein Cluster...

Ich glaube, ich werde mich mal an der verschachtelten Dictionary-Variante probieren und wenn mir das zu nervig oder unperformant wird, doch auf die Oracle-Idee umsteigen.

Danke & Grüße,
Compu

**fanderlf** · 10.11.2011, 17:31

Wenn ihr Oracle habt könntest Du es auch mit einer Materialized View probieren. Das ist ein View die in einem bestimmten (ich denke auch konfigurierbaren) Zeitraum geupdatet wird. Dann müsstest Du das Query praktisch nur einmal die Woche gegen die DB laufen lassen. Das ganze könnte auch in der Nacht passieren, da ist sowas ja meist weniger kritisch.

**Compufreak** · 10.11.2011, 17:47

Das Problem ist, dass der Report auf einem anderen Report basiert - der wird Montags über den Tag generiert und direkt danach muss der Vergleich angefertigt werden. Das Ergebnis wird sowieso als Excel-File hinterlegt, also da würde auch ein normaler View für reichen... Büßt aber an Konfigurationsoptionen ein. Ist leider Gang und Gäbe, dass sich Requirements von einem Tag auf den anderen ändern...

Ich habe jetzt schonmal einen schön verwirrenden 50-Zeiler geschrieben, der mir aus meinen Schlüsselspalten (natürlich generisch als params übergeben) und der Tabelle ein paar schick verschachtelte Dictionaries macht. Die sind binnen weniger Sekunden(bruchteile) erzeugt. Die Dictionaries bilden im Prinzip nichts anderes als einen Baum ab, der ganz am Ende Zeilen-IDs stehen hat.

Jetzt muss ich nur noch das Gegenstück basteln, das durch die Basis-Tabelle wandert und in den Dictionaries nach den passenden Schlüsseln sucht. Ich bin guter Dinge, dass das tatsächlich performanter wird als erst 100.000e von Zeilen nach Oracle zu schaufeln

(Selbst mit dem tollen Oracle.DataAccess.BulkCopy, was mir schon sehr geholfen hat.)

Vielen Dank auf jeden Fall für den Input!

**derOptimist** · 11.11.2011, 09:10

Hallo Compufreak,

es muss doch nicht unbedingt der bestehende Datenbankserver sein oder?

Hast du nicht die Möglichkeit auf einen bestehenden Server SQL-Exress o. ä. zu installieren und diesen dann verwenden?
Solche Sachen würde ich auch eher einer Datenbank überlassen.

Gruß
derOptimist

**fanderlf** · 11.11.2011, 09:53

Eine NoSQL Datenbank könnte auch einen Index bauen. Oder auch eine ganze kleine wie SQLite.

**Compufreak** · 11.11.2011, 09:58

Hallo,

leider müsste ich für eine Installation erst unsere IT-Abteilung beauftragen, und denen das Vorhaben zu begründen und auf die Umsetzung zu warten würde meinen Zeitrahmen sprengen...

Danke & Grüße,

Compu

**fanderlf** · 11.11.2011, 10:13

Das ist ja der Punkt

dafür brauchst Du keine IT Abteilung. RavendDB kannst Du lokal starten, dafür braucht man keinen riesen Server. Ich glaub für SQLite braucht man nicht mal einen Server, die kann man auch einfach per Code im Arbeitsspeicher erzeugen.

Siehe hier:
http://www.sqlite.org/about.html

**Compufreak** · 11.11.2011, 10:30

Wow, das klingt echt nach dem, was ich suche - ich werde mich mal an SQLite versuchen und berichten - danke

Dafür gibt's sogar gleich einen ADO.NET-Adapter

**Compufreak** · 22.12.2011, 15:43

Ich wollte mich nur mal zurückmelden und bedanken. Ich habe es jetzt tatsächlich mit SQLite gelöst.

Stolpersteine dabei waren vor allem :
SQLite kann keine FULL OUTER JOINs. Ich musste dazu einen LEFT mit einem RIGHT Join verknüpfen (siehe Wikipedia etc.

).
Wenn man die Datenbank auf der Festplatte schreibt, ist das EXTREM langsam. Ich schreibe jetzt direkt in den RAM, mit DataSource :memory:. Auch dort ist es wichtig, in welcher Größe die einzelnen INSERTS erfolgen - ich habe mit einem commit alle 10 Zeilen die beste Performance erreicht. Nachteil dabei ist natürlich die hohe RAM-Auslastung.

Announcement

Joinen von mehreren großen DataTables mit verschiedenen Kriterien

Joinen von mehreren großen DataTables mit verschiedenen Kriterien

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment