Announcement

**Andreas Kosch** · 17.01.2007, 14:46

Hallo,

das Thema Data Mining ist sehr "gro�", so dass es schwierig ist, eine kompakte Antwort zu finden. Das Mining hat generell zwei verschiedene Auspr�gungen:

1. Die Report Analyse betrachtet die Vergangenheit, indem r�ckwirkend die "alten" Daten ausgewertet werden. Das Ergebnis k�nnte auch mit dem klassischen SQL einer relationalen Datenbank erzielt werden (nur mit dem Unterschied, dass dort der Aufwand h�her und die Abfrageleistung schlechter ist).

2. Das Data Mining versucht einen Blick in die Zukunft, indem Vorhersagen basierend auf den "alten" Daten erstellt werden. Da es darum geht, neue Erkenntnisse ans Tageslicht zu bringen, die es in dieser Form gar nicht in den Daten gibt, wurde der treffende Begriff Data Mining gew�hlt. Mit dem klassischen SQL einer relationalen Datenbank k�nnen diese Informationen nicht gewonnen werden, da es vor allem um das halb-automatische Erkennen von Beziehungen, Mustern und Anomalien in gro�en Datenmengen geht (alias "maschinelles Lernen"). Beim Data Mining stehen die folgenden Fragestellungen im Vordergrund:

- Classification (einsortieren in einen Schubkasten)
- Segmentation (Unterscheidungsmerkmals und Ausrei�er erkennen)
- Estimation (Vorhersage, Wahrscheinlichkeiten erkennen)
- Association (Beziehungen zwischen Merkmalen erkennen)
- Forecasting (Zeitliche Vorhersage)

Die OLAP Cubes speichern die Daten bereits vorberechnet in mehreren Dimensionen so ab, dass bei typischen Auswertungen sofort die fertigen Ergebnisse vorliegen (eine konventionelle, normalisierte Datenbank w�rde im Unterschied dazu die Berechnungen erst zur Laufzeit �ber SQL ausf�hren). Sogar im Fall von dynamischen Ad-Hoc-Auswertungen (d.h. es wurde vorher kein Cube definiert) kann OLAP die Ergebnisse schneller liefern, da der verwendete Datenspeicher (d.h. die Datenbank) nach anderen Gesichtspunkten aufgebaut wurde und somit bestimmte ressourcenintensive Aufgaben (Verwalten von Index-Eintr�gen, Ergebnismengenaufbau �ber JOINs, Datensatzsperren etc.) entfallen.

Welche Probleme ...

Der Entwicklungsprozess einer Data Mining-L�sung ist komplizierter als bei einer normalen Datenbankanwendung. Der Erfolg (oder Misserfolg) h�ngt entscheidend vom Verst�ndnis des Gesch�ftsprozesses ab. Anscheinend ist es normal, dass mehrere (iterative) Abstimmungsl�ufe notwendig sind, bis am Ende die "richtigen" Fakt- und Dimensionstabellen zusammengestellt sind.

Announcement

Mining OLAP Cubes

Mining OLAP Cubes

Comment