Announcement

**defo** · 25.11.2015, 18:37

kommt auf die Lizensierung bei Oracle an und vielleicht auf das Datenvolumen.
Oracle auf Linux oder auf Windows? (wg Connectivity ODBC & Co)
ASE Export > Oracle sql loader
client export ASE > client import Oracle
Oracle Heterogenous Services > ASE transparent auslesen
irgendein ETL tool
irgendein DWH tool

Zu den Oracle Lizenzen. Eine Express Edition ginge ja bis 10 oder 11 Gb Volumen-wei� nicht genau-, reicht vielleicht f�r eine Woche. Ob die HS dabei hat wei� ich nicht, ist glaube ich in den gro�en Editions eine Option (Zukauf).

**kuemmelchen** · 26.11.2015, 14:27

Zu Oracle 11g Express sagt Oracle:

Oracle Database XE can be installed on any size host machine with any number of CPUs (one database per machine), but XE will store up to 11GB of user data, use up to 1GB of memory, and use one CPU on the host machine.

**defo** · 26.11.2015, 15:34

Ich habe auch irgendwo einen Kommentar gesehen, dass HS bei der Express Edition enthalten sind. War aber von einem Anwender nicht von Oracle selbst diese Aussage.

**Wursel** · 27.11.2015, 16:42

Vielen Dank f�r die Antworten!

Ich versuche mich nun an folgendem Vorgehen: Unter Windows (wegen ODBC) habe ich eine Oracle XE Datenbank aufgesetzt und werde aus einer eigenen kleinen Anwendung heraus die ben�tigten Tabellen von Sybase zu Oracle �bertragen. Da ich nur bestimmte Teile daraus brauche, liegen die Daten sch�tzungsweise bei unter 2 GB, sodass noch Luft nach oben ist.

Es gibt wohl noch die "Oracle Standard Personal Edition" die mit Enterprise vergleichbar sein soll, aber Singleuser. Evtl. w�re das auch interessant, da die Auswertung nur einer (i.d.R. ich selbst) gleichzeitig verwendet. Was meint ihr dazu? Ist das eine gleichzeitige Connection zur DB oder eine Person an sich, die das nutzt?

Meint ihr mit "HS" das Einbinden von Fremddatenbanken in Oracle, sodass ich dann direkt innerhalb einer Query auf beide Datenbanken zugreifen k�nnte? Falls ja, dann w�re das definitiv interessant. Evtl. k�nnte man dann sogar ziemlich schnell feststellen, welche Teile ge�ndert wurden und dann nur speziell diese erneut zum Ziel �bertragen bzw. am Ziel l�schen.

**defo** · 27.11.2015, 21:09

Originally posted by Wursel View Post

Es gibt wohl noch die "Oracle Standard Personal Edition" die mit Enterprise vergleichbar sein soll, aber Singleuser. Evtl. w�re das auch interessant, da die Auswertung nur einer (i.d.R. ich selbst) gleichzeitig verwendet. Was meint ihr dazu? Ist das eine gleichzeitige Connection zur DB oder eine Person an sich, die das nutzt?

Ich hab keine Ahnung, w�rde eher auf eine Person tippen (anhand der Benennung).

Originally posted by Wursel View Post

Meint ihr mit "HS" das Einbinden von Fremddatenbanken in Oracle, sodass ich dann direkt innerhalb einer Query auf beide Datenbanken zugreifen k�nnte? Falls ja, dann w�re das definitiv interessant. Evtl. k�nnte man dann sogar ziemlich schnell feststellen, welche Teile ge�ndert wurden und dann nur speziell diese erneut zum Ziel �bertragen bzw. am Ziel l�schen.

Ja, Oracle Heterogeneous Services ist daf�r gemacht. Ich w�rde nicht schw�ren, dass es in der Edition drin ist.
Wie das so ist bei Oracle, die Konfiguration zu Anfang macht nicht unbedingt Spa�, ich kann mich erinnern, dass ich mal ziemlich Schwierigkeiten mit Informix Anbindung hatte. Das lag aber vermutlich daran, das die Informixverison uralt war.
Aber wenn es l�uft ist es nett. Ich w�rde nicht unbedingt wilde Sachen damit machen, (gezielt) Daten absaugen und den Rest nativ auf Oracle. Das sollte gut funktionieren.

P.S.: Sowas �hnliches gibt es auch von MS, da f�llt mir grad der Name nicht ein. Vielleicht geht das sogar besser, aus historischen Gr�nden. Wenn die Datenlage �bersichtlich und die Struktur halbwegs stabil ist, kann man den reinen Transport von DB A zu DB B aber evtl auch mit einem kleinen Eigenbauprogramm machen. Dann k�nnen Dir die DB Editionen und Lizenzkosten egal sein, die Server m�ssen sich nicht sehen usw usw.

**Wursel** · 04.12.2015, 11:44

Ich habe mittlerweile ein Skript geschrieben, um die Daten zu kopieren, h�nge aber gerade an einem ziemlich bl�den Problem fest: Die Quelltabellen haben teilweise Spaltennamen mit �ber 30 Zeichen d.h. ich kann diese so nicht anlegen, sonst laufe ich in ein ORA-00972: identifier is too long.
Au�er die Namen nach dem 30. Zeichen einfach abzuschneiden, f�llt mir gerade nichts ein. Oder eine Datenbank nehmen, die dieses "Feature" unterst�tzt... Habt ihr noch eine Idee?

Bei den "Heterogeneous Services" w�rde ich mit diesen langen Namen vermutlich ebenfalls auf die Nase fallen. Es gibt einen Eintrag dazu, der lediglich empfiehlt, die Namen via View zu k�rzen und diese View dann einzubinden. Das k�nnte ich insofern nicht machen, da ich die Finger von der Quelldatenbank lasse. Die wird fremdsupportet und da halte ich mich raus. Abgesehen davon will man solche Workarounds eigentlich auch nicht machen (m�ssen)...
http://knowledgebase.progress.com/articles/Article/5753

Gr��e,
Wursel

**defo** · 04.12.2015, 12:30

Welcher Art ist denn Dein Script? Wie greifst Du die Daten darin ab?
Es spricht ja nichts gegen Abschneiden, wenn die Feldnamen dabei eindeutig bleiben.
eine Option:
Schritt a) Daten irgendwie exportieren > CSV, ..
Schritt b) Daten per External Table in Oracle einlesen, dabei kann man Feldnamen mappen.

Meines Wissens nach gibt es selbst unter Oracle12 keine l�ngeren Feldnamen und auch keine direkten Workarounds.

Und wie oben irgendwo gesagt, das Prinzip von HS gibt es alternatiiv auch unter MS SQL Server, wei� immer noch nicht, wie die das nennen.

**Wursel** · 04.12.2015, 17:07

Ich habe ein PHP-Skript geschrieben, welches via ODBC auf die beiden Datenbanken zugreift und die Tabellen von A nach B kopiert. Dort habe ich nun das Abschneiden der Spaltennamen auf max. 30 Zeichen reingebaut und das funktioniert jetzt (am Ziel wurden die Tabellen nat�rlich auch mit gek�rzten Spaltennamen angelegt). Aktuell bin ich testweise am r�berziehen der kompletten Daten und schaue, ob und falls ja wo es noch knallt und wie lange das unterm Strich dauern wird.

Eigentlich h�tte ich mir auch mal eine MS-SQL DB anschauen k�nnen - die ist ja von der Struktur und historisch her am �hnlichsten zur Sybase DB.

**defo** · 04.12.2015, 17:18

Originally posted by Wursel View Post

Ich habe ein PHP-Skript geschrieben, ..

Das stelle ich mir nicht ganz so schnell vor oder zumindest nicht so schnell, wie m�glich. Liegt PHP auf dem gleichen System wie Oracle?
Dann w�rde ich External Tables einsetzen (also im Prinzip, wenn man die CSV Quellen problemlos auf den Oracle Server bekommt):
- CSV aus Quellsystem auf Oracle Server bereitstellen,
- ExternalTable(s) definieren und
- transpranet abfragen, nicht laden.

ETL:
Aus den external Tables alles extrahieren, transformieren was notwendig ist f�r die Auswertung, wenn m�glich schon mit gr��t m�glicher Aggregation und die Daten dann in separaten Reportingtabellen bereitstellen.
Bei Bedarf Auswertung der .bad und .log files
Ab da hast Du alles mit Oracle im Griff (auch Importfehler) und es ist recht flott.

**Wursel** · 09.12.2015, 17:33

Das stelle ich mir nicht ganz so schnell vor oder zumindest nicht so schnell, wie m�glich.

Ja das stimmt allerdings - das ginge mit Sicherheit sehr viel schneller, wenn ich das anders machen w�rde. F�r meinen Bedarf reicht es, da ich das nur am Wochenende aktualisieren brauche. Die Auswertungen werden immer �ber l�nger zur�ckliegende Zeitr�ume gezogen. D.h. bis zum letzten Monatsende innerhalb des laufenden Monats. F�r ganz aktuelle Sachen gibts ja nach wie vor den aktuellen Datenbestand wie bislang auch. Aber... schneller ist nat�rlich immer besser.

Liegt PHP auf dem gleichen System wie Oracle?

Nein das liegt alles verteilt im Netzwerk. Sybase ASE liegt auf einem Server, PHP auf einem anderen und die Oracle XE auf einem dritten. D.h. die Daten wandern aktuell �ber drei Server hinweg (ASE-Server => PHP-Server => XE-Server).

Die Haupttabellen sind in ca. 15 Minuten �berspielt (Holzhammer: DELETE FROM tableX und dann mit INSERT INTO tableX alles neu rein). Die Faktentabellen brauchen jedoch ~4h 10Min. Insgesamt liege ich also bei etwa ~4 1/2 Stunden. Das ist alles nat�rlich vollkommen unoptimiert. Sozusagen Proof-of-Concept und das was ich wollte, ist erreicht. Der Flaschenhals in der Kette ist ganz klar der Platten I/O vom Oracle XE Server. Da k�nnte man sicherlich noch was rausholen (kein Transaktionslog und mehr cachen?).

Jedoch �berlege ich nat�rlich schon, ob ich da noch was beschleunigen k�nnte. Beispielsweise k�nnte ich den Zeitstempel der Quelldatens�tze pr�fen (wird mitgef�hrt) und nur die Zeilen selektieren, die neu (also nach dem Exportzeitpunkt) sind und ausschlie�lich diese �bertragen. Wobei dann das gewohnte Spiel los geht: INSERT oder UPDATE und zudem extra �berpr�fen was ggf. DELETEd werden muss...

Wegen External Tables: Wie sieht es da mit der Abfrageperformance aus, wenn die nicht rein geladen werden? Werden dann extra Indices aufgebaut?

**defo** · 09.12.2015, 19:40

Originally posted by Wursel View Post

Wegen External Tables: Wie sieht es da mit der Abfrageperformance aus, wenn die nicht rein geladen werden? Werden dann extra Indices aufgebaut?

Das ist ein direkter Zugriff auf die CSV oder was auch immer, meines Wissens nach, gibt es da keine Indizierung.
Aber apropos Indizierung: Du solltest die auf den Zieltabellen erst nach dem Bef�llen der Tabellen aktivieren. Das spart die Indexverwaltung w�hrend des Ladens.

Ich w�rde nur einmal auf die CSV zugreifen, eben zum Laden. Wenn Du auf PHP verzichtest, kannst Du auch den Oracle Loader einsetzen. Ich wei� allerdings nicht, wieviel das bringt im Vergleich zu CSV external Tables.

**dimitri** · 11.12.2015, 16:55

Originally posted by Wursel View Post

(Holzhammer: DELETE FROM tableX und dann mit INSERT INTO tableX alles neu rein).

Statt DELETE FROM ein TRUNCATE TABLE xyz verwenden. Den Insert als direct path load durchf�hren: INSERT /*+APPEND*/ INTO ...
Dann brauchst du dir auch keine Gedanken wegen der Indices zu machen, die werden beim direct path load separat aufgebaut und dann hinzugef�gt.

Die Tabelle mit NOLOGGING definieren: alter table xyz nologging; Damit werden beim direct path load keine Redo Logs geschrieben.

Externe Tabellen sollten nur zum Laden von echten Tabellen verwendet werden, f�r normale ad hoc Abfragen ist das viel zu langsam.

@defo: SQLLoader und external tables sind gleichwertig zu sehen. Jedes Tool hat Vor- und Nachteile bei der Benutzung, die Performance ist identisch.

**defo** · 12.12.2015, 10:00

Originally posted by dimitri View Post

Den Insert als direct path load durchf�hren: INSERT /*+APPEND*/ INTO ...
Dann brauchst du dir auch keine Gedanken wegen der Indices zu machen, die werden beim direct path load separat aufgebaut und dann hinzugef�gt.

Die Tabelle mit NOLOGGING definieren: alter table xyz nologging; Damit werden beim direct path load keine Redo Logs geschrieben.

@defo: SQLLoader und external tables sind gleichwertig zu sehen. ..die Performance ist identisch.

Direct path mit auto indexing, das wusste ich nicht, prima.
Ist f�r nologging nicht auch ein extra nologging tablespace notwendig?

Ich hab immer "das Gef�hl", dass die External Tables eh �ber den Loader realisiert sind. Also andere Feature, gleiche Engine.

**dimitri** · 21.12.2015, 09:40

Originally posted by defo View Post

Ist f�r nologging nicht auch ein extra nologging tablespace notwendig?

Nein brauchst nicht. Ein TS der mit NOLOGGING angelegt wird, vererbt diesen Parameter an "seine" Tabellen.
Wichtig ist zu wissen, dass solche Tabellen nicht durch ein RMAN Backup wiederherstellbar sind, wenn nicht nach dem Direct Load mit NOLOGGING ein Full Backup gefahren wird.

Originally posted by defo View Post

Ich hab immer "das Gef�hl", dass die External Tables eh �ber den Loader realisiert sind. Also andere Feature, gleiche Engine.

Das ist vermutlich auch so. :-)

Announcement

Zwei verschiedene (=> anderer Hersteller) Datenbanken synchronisieren?

Zwei verschiedene (=> anderer Hersteller) Datenbanken synchronisieren?

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment