Announcement

**dimitri** · 24.01.2009, 19:25

Ist es denn richtig mehrere Datenbanken f�r ein Programm zu verwenden?

Kommt drauf an, welchen Datenbankhersteller du verwendest. Bei Oracle ist es das definitiv nicht, dort w�rde man mehrere Schemata verwenden, um logisch voneinander unabh�ngige ER Modelle voneinander zu trennen. Bei mysql z.B. gibt es keine Schemata dort w�rde man dann eben eine neue Datenbank anlegen.

Ich hatte eigentlich vor, die Material und Zeitvorgaben jeweils in eine eigene Datenbank zu packen, weil jede f�r sich ja aus mehreren Tabellen besteht. So h�tte ich schonmal 2 Datenbanken.

Aus welchen Gr�nden m�chtest Du das denn trennen? Deiner Argumentation kann ich nicht ganz folgen. Ein zusammengeh�riges ER-Modell geh�rt in ein Schema (oder auch Datenbank je nachdem welche DB Du verwendest).

Dim

**Christian Marquardt** · 24.01.2009, 19:53

Des Weiteren muss man dann auch entsprechend viele DB-Verbindungen in der Anwendung verwalten. Auch kann es schwierig sein, gew�nschte �bergreifende Abfragen an u.U. mehrere DBs zu richten

**Lemontee** · 25.01.2009, 11:35

Als Datenbanksystem verwende ich Firebird SQL.

Die Datenbankverbindungen seh ich weniger als Problem an, da die Anwendung in NET entwickelt wird und da Verbindungen nur so lang offengehalten werden wie sie ben�tigt werden. K�nnte h�chstens etwas overhead im Arbeitsspeicher erzeugen..

Der Grund f�r die Trennung ist, das das doch mit der Zeit sehr Un�bersichtlich wird, oder? Ich geh vom Extremfall aus - wenn der Anwender in einem Jahr bis zu ein paar Hundert Angebote schreibt.

Wird denn die Datenbank nicht auch irgendwann langsam wenn alles in eine gro�e Datei gequetscht wird?

Au�erdem soll das Programm erweiterungsf�hig sein, zB. sp�ter eine Kunden- und Projektverwaltung bekommen. Usw.. Usf..

Um die Daten logischer Trennen zu k�nnen wollte ich sie so auseinander halten.
Das gr��te Problem w�re aus einer Datenbank auf eine andere, �bergeordnete zuzugreifen, oder?

**dimitri** · 25.01.2009, 12:52

und da Verbindungen nur so lang offengehalten werden wie sie ben�tigt werden.

Davon w�rd ich dringendst abraten. Datenbankenverbindungen werden im allgemeinen so lange offen gehalten bis das Programm wieder beendet wird. Ansonsten wartet der User bei jeder Aktion erst mal bis �berhaupt die Verbindung steht.

Ich geh vom Extremfall aus - wenn der Anwender in einem Jahr bis zu ein paar Hundert Angebote schreibt.

Versteh ich nicht. Du legst aber nicht f�r jedes Angebot eine Tabelle an oder? Ansonsten sind Datenbanken daf�r gemacht zig Milliarden von Datens�tzen zu verwalten. Deine paar hundert Eintr�ge sollten also grade noch so gehen

Wird denn die Datenbank nicht auch irgendwann langsam wenn alles in eine gro�e Datei gequetscht wird?

Ich w�rde Dir dringendst raten dich mit Datenbanken im allgemeinen und deiner Firebird im speziellen zu besch�ftigen. Frei nach dem Motto: Verstehe was Du nutzen m�chtest.

Au�erdem soll das Programm erweiterungsf�hig sein, zB. sp�ter eine Kunden- und Projektverwaltung bekommen. Usw.. Usf..

Stop. Gro�er Fehler. Nicht das Programm muss erweiterungsf�hig sein, sondern dein ER-Modell. D.h. wir sprechen jetzt noch nicht mal von physikalischen Tabellen, sondern von Entit�ten die sich in der 3. NF befinden und dann ggf. aus performancegr�nden noch etwas De-Normalisiert wurden.

Du darfst nie die Daten an einem Programm ausrichten - das Programm hat sich immer nach den Daten zu richten (Bedeutet auch Finger weg von diversen objektrelationalen Erweiterungen und den ganzen Mappern die das zeugs generieren!). In 5 jahren wird deine .Net Anwendung vielleicht nicht mehr existieren und die Daten m�ssen dann vielleicht von einer Webanwendung gelesen und geschrieben werden die in einer komplett anderen Sprache entwickelt wurde.

Um die Daten logischer Trennen zu k�nnen wollte ich sie so auseinander halten.

Das macht wenn �berhaupt aber auch nur dann Sinn, wenn sie auch fachlich und technisch nichts miteinander zu tun haben.

Mein Rat: Erstelle dir auf dem Papier ein ER-Modell, denk noch nicht mal an eine Datenbank o.�. und mach das vern�nftig so das es deinen fachlichen Anforderungen gerecht wird. Wenn das steht kann man mal dran denken �berhaupt einen Create Table Befehl abzusetzen - vorher nicht.

Dim

PS: Ich w�rd mir auch mal �berlegen, ob Du nicht PostgeSQL oder gleich die Oracle XE verwendest. Sind beide deutlich leistungsf�higer als Firebird und auch die Doku ist erheblich besser (vor allem bei Oracle).

**O. Helper** · 25.01.2009, 13:29

und da Verbindungen nur so lang offengehalten werden wie sie ben�tigt werden.

Davon w�rd ich dringendst abraten. Datenbankenverbindungen werden im allgemeinen so lange offen gehalten bis das Programm wieder beendet wird

Alle aktuellen Datenzugriffskomponenten wie ADO / ADO.NET verwenden "Connection Pooling", d.h. wenn eine Applikation eine Connection zu einem SQL Server beendet, wird diese im Pool eine Zeit lang vorgehalten und f�r andere Verbindungen wieder recyceld. Von daher ist es kein Performanceproblem, die Verbindung zwischenzeit wieder zu trennen.
Bei Web-Applikation ist das sogar der Normalfall, das f�r jede Aktion eine Verbindung aufgebaut, Daten selektiert o.�. und die Verbindung gleich wieder geschlossen wird.

**dimitri** · 25.01.2009, 13:31

Alle aktuellen Datenzugriffskomponenten wie ADO / ADO.NET verwenden "Connection Pooling", [...]
Bei Web-Applikation ist das sogar der Normalfall, das f�r jede Aktion eine Verbindung aufgebaut, Daten selektiert o.�. und die Verbindung gleich wieder geschlossen wird.

Ok dann ist es ja auch kein schlie�en der Connection, sondern ein zur�ckgeben in den Pool.

Dim

**Lemontee** · 25.01.2009, 13:48

Davon w�rd ich dringendst abraten. Datenbankenverbindungen werden im allgemeinen so lange offen gehalten bis das Programm wieder beendet wird. Ansonsten wartet der User bei jeder Aktion erst mal bis �berhaupt die Verbindung steht.

Net, insebesondere die ADO-Komponente verwendet das "disconnected data set". Die Verbindung zur Datenbank wird nicht offengehalten, sondern es wird eine tempor�re Datenbank erzeugt, mit der gearbeitet, und erst bei Bedarf wieder in die originale Datenbank zur�ckgeschrieben (meist nach einem festen Zeitintervall, oder nach mehreren �nderungen).

Ich speziell werde die Daten in Zeitintervallen tempor�r abspeichern um Datenverluste zu minimieren. Und erst richtig speichern wenn der Benutzer sein ok gibt. (also auf Speichern dr�ckt...)

Du legst aber nicht f�r jedes Angebot eine Tabelle an oder?

Doch, f�r jedes Angebot hab ich immer eine neue Tabelle die in etwa so aussieht:

Pos.Nr.
Beschreibung
+
-
Berechnung
...

Die Tabelle arbeitet mit Material und Zeitvorgaben..
Diese Tabellen wiederum werden in Projekte geordnet, und diese Projekte werden Kunden zugeordnet. Also das ist wirklich schon ein komplexeres Programm.

Stop. Gro�er Fehler. Nicht das Programm muss erweiterungsf�hig sein, sondern dein ER-Modell. D.h. wir sprechen jetzt noch nicht mal von physikalischen Tabellen, sondern von Entit�ten die sich in der 3. NF befinden und dann ggf. aus performancegr�nden noch etwas De-Normalisiert wurden.

Genau aus dem Grund bestehem Material und Zeitdaten allein schon aus mehreren Tabellen.

Nicht das Programm muss erweiterungsf�hig sein, sondern dein ER-Modell.

Vollkommen richtig.. Die vorliegenden Tabellen bilden auch das Grundmodell. Das ganze Modell soll nur bei Bedarf noch erweitert werden, in Prinzip auf einer h�heren abstrakten Ebene...

Also ich hab jetzt die 1. Ebene:
Materialdatenbank - Zeitdatenbank - Kundendatenbank

Darauf baut die Ebene 2. Ebene auf:
Angebotsdatenbank - Verkaufsdatenbank

Auf dieser wiederum zu einem sp�teren Zeitpunkt eine weitere 3. Ebene:
Projektverwaltung

Jede dieser Ebenen kann immer nur aus Elementen der Ebene darunter bestehen.. Also die 2te Ebene zB. nur aus Elementen der 1. Es handelt sich also um ein Schichtenmodell. Kann es sein das meine teils noch Objektorientierte Sicht auf diese Dinge falsch ist? Vielleicht versteht man jetzt weshalb ich die Datenbanken zum Teil trennen wollte..

Dazu ist vielleicht noch zu sagen das die Datenbank embedded ist. Das Programm wird eine Einzelplatzanwendung, ohne Vernetzung oder mehrere Benutzer. Externe Daten werden �ber Import / Export Schnittstellen verwaltet.

Danke erstmal f�r die ausf�hrlichen Informationen..

**dimitri** · 25.01.2009, 14:11

Doch, f�r jedes Angebot hab ich immer eine neue Tabelle die in etwa so aussieht:

Oh je bitte nicht. Mach das besser so:
Angebot (Beschreibung, Erstellungsdatum, Ersteller und weitere Kopfdaten)
Angebotspunkt(FK auf Angebot, Beschreibung aus Materialtabelle, Mengenangabe,Einzelpreis, etc.)

Es handelt sich also um ein Schichtenmodell. Kann es sein das meine teils noch Objektorientierte Sicht auf diese Dinge falsch ist?

Absolut. In einer relationalen Datenbank gibt es keine Schichten, keine Vererbung und auch keine Objekte.
Allerdings ist deine Sicht auch nicht objektorientiert, denn w�rde man deine Angebotslogik auf OOP umm�nzen, dann w�re jedes neue Angebot eine neue Klasse die zur Laufzeit generiert, kompiliert und von der anschlie�end genau ein Objekt instanziiert wird.

Also weg von Schichten und dem ganzen Zeugs. Mach dein ER-Modell in der 3 NF und dann mach deine Anwendung, welche aus den Schichten Datenbank, sowie Logik und Oberfl�che (MVC Pattern) besteht.

Dim

**Lemontee** · 25.01.2009, 14:33

Angebot (Beschreibung, Erstellungsdatum, Ersteller und weitere Kopfdaten)
Angebotspunkt(FK auf Angebot, Verweis auf die Materialtabelle, Mengenangabe)

Wie soll das gehen?
Also genauer im Detail:

Es gibt Kopfdaten, die hab ich noch nichtmal erw�hnt..
Angebot: M�ller & Co.. Bauvorhaben 1
Datum:
letzte �nderung:
Bearbeitung:

Dazu gibt es dann aber eine Tabelle mit den zugeh�rigen Positionspunkten. Diese Punkte sind f�r jedes Angebot anders, da sie sich aus �rtlichen Gegebenheiten berechnen:

Pos | Bennenung | Abstiche | Gr��e | verwendetes Material | Arbeitszeit

Allerdings ist deine Sicht auch nicht f�r objektorientiert, denn w�rde man deine Angebotslogik auf OOP umm�nzen, dann w�re jedes neue Angebot eine neue Klasse die zur Laufzeit generiert, kompiliert wird und von der anschlie�end genau ein Objekt instanziiert wird.

Autsch.. Genauso hatte ich mir das gedacht. Ich arbeite ja mit einer MDI-Anwendung. Ich hab mir gedacht f�r jedes Form einfach ein neues DataSet anzulegen. Also sollte ich nur ein Globales verwenden? Die Tabellen werden sogar �ber Programmcode angelegt. Bis zum ersten mal speichern erfolgt nicht ein Datenbankzugriff (beim erstellen einer neuen Tabelle).

Also gut.. ich arbeite das ganze er-modell jetzt nochmal aus..
Programmlogic, Daten und GUI trenne ich allerdings schon seit Jahren.. xD

**dimitri** · 25.01.2009, 14:49

Diese Punkte sind f�r jedes Angebot anders, da sie sich aus �rtlichen Gegebenheiten berechnen:

Ja und? �ber einen FK Constraint werden sie mit dem Angebotskopf verbunden.

Ach ja: Wie machst das eigentlich bei der Datensicherung? Embedded bedeutet ja, dass die DB mit ins Programm eingebunden wird. Aber was pasiert, wenn Du z.B. eine neue Version auslieferst? Angebote sind rechtsverpflichtend und d�rfen nicht einfach weggeworfen werden.

Dim

**Lemontee** · 25.01.2009, 15:10

Ja und? �ber einen FK Constraint werden sie mit dem Angebotskopf verbunden.

mhm.. die Tabelle f�r ein Angebot ist auch immer indiziert, da die einzelnen Punkte in weiteren Tabellen weiter verwendet werden..

Ich wollts gar nicht so ausf�hrlich schreiben.. Aber es handelt sich um eine Tabelle mit den Aufma�en f�r ein bestimmtes Bauprojekt. Dazu dann eine Tabelle welche die erechneten Werte f�r Zeitvorgaben verwendet, eine Tabelle welche die Aufma�daten f�r Materialberechnung verwendet. Und diese ganzen Daten werden dann zentral in der Projektverwaltung f�r Angebotsschreiben verwendet. Mit einem klick auf Drucken soll sich dann das ganze Angebot drucken lassen ohne das man l�stig nochmal alle Daten zusammensuchen m�sste..

Die Materialien hingegen sind wieder in einer extra globalen Tabelle, welche �ber l�ngere Zeitr�ume konstant bleibt.

Naja.. da steckt wohl noch ne Menge Ausarbeitungszeit drin.. Denn ich hab mir das wohl etwas falsch vorgestellt. Mit Datenbanken hatte ich noch nicht so viel zu tun, besch�ftige mich erst seit diesem Monat damit und muss erstmal meine ganzen Objektorientierten Gedanken beiseite lassen... frrr ^^

Noch eine Anmerkung: Die globalen Datenbanken mit den Vorgaben f�r Zeit und Material dienen mehr als eine Art Bibliothek auf die man bei der Angebotsberechnung zugreifen kann - aber nicht muss..
Bei der Erstellung eines Angebots verwende ich eine Listenansicht, und �ber Comboboxen werden aus den Material und Zeitvorgaben Vorschl�ge gemacht. Aber eben nur Vorschl�ge, keine Verbindlichkeiten. Weswegen Angebote und Stammdaten immer voneinander getrennt sind.

Wie machst das eigentlich bei der Datensicherung?

Embedded bedeutet hier das das dbms ins programm eingebunden ist.
Die Datenbankdateien werden jedoch einzeln gespeichert.

Ganz grob gesagt gibts einige Dateien:

-exe | Programmdatei
-DLLs | f�r das DBMS
-FDB | Dateien welche die Daten repr�sentieren (Datenbank)

Bei einer neuen Programmversion werden nach M�glichkeit nur die DLLs und die Exe-Datei aktualisiert. Die Daten bleiben allerdings wie sie sind. Falls es doch mal �nderungen an der FDB-Datei geben sollte wird ein Converter geschrieben.

Der Converter verwendet ganze einfach die Import / Export Funktionalit�t weil diese sowieso ben�tigt wird. Richtig?

**dimitri** · 25.01.2009, 15:26

Mit Datenbanken hatte ich noch nicht so viel zu tun, besch�ftige mich erst seit diesem Monat damit und muss erstmal meine ganzen Objektorientierten Gedanken beiseite lassen... frrr ^^

Allerdings. Es gibt �brigends auch keine globalen Tabellen

und ein FK Constraint kann, muss aber nicht indiziert sein.

Dim

**Lemontee** · 27.01.2009, 00:27

So, ich mal wieder.. Ich habe in der Zwischenzeit viel gelernt und jetzt den Teilbereich "Material" normalisiert. Vielleicht k�nnt ihr es einmal kurz �bersehen und mir mal sagen ob das wirklich die richtige Richtung ist..

Ich hab die K�rzel verwendet:
PS = Prim�rschl�ssel
FS = Fremdschl�ssel
VT = Verkn�pfungstabelle

Die Tabellennamen sind fett.. unter ihnen immer die Attribute..

Material
ID (PS), Name, Beschreibung, Verbrauch, VerbrauchseinheitsID (FS)

Verbrauchseinheit
ID(PS), Name

Lagereinheit
ID(PS), MaterialID (FS), EinzelmengentypID (FS), Einzelmenge, LiefermengentypID (FS), Liefermenge, PreiseinheitsID (FS), Preis, Anmerkung

Die Fremdschl�ssel aus der Lagereinheit sind immer verweise auf weitere Tabellen..

Dann hab ich noch ein paar Tabellen zur Kategorisierung...
Zum Beispiel eine f�r Hersteller.

Hersteller
ID(PS), ...weitere Attribute

Und diese dann �ber Verkn�pfungstabellen mit den Materialdaten verkn�pft:

VTHerstellerMaterial
HerstellerID(FS), MaterialID(FS)

Das ist nur ein Teilausschnitt von allen Tabellen, aber der Rest funktioniert im Prinzip genauso.. Ich hoffe das ist wirklich eine Normalisierung und nicht einfach nur Zeitverschwendung gewesen.

Announcement

Komplexe Datenbanken

Komplexe Datenbanken

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment