Announcement

Collapse
No announcement yet.

Anonymisierung der Daten

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Anonymisierung der Daten

    Hallo zusammen,

    ich soll im Rahmen meiner Studienarbeit eine Softwarelösung zur Anonymisierung der Daten in der DB entwickeln. Ich weiß, dass Oracle seine Data Masking dafür anbietet aber die Lösung ist auch für anderen DB gedacht. Also das soll eine eigenentwickelte SW-Lösung sein.

    Funktionieren soll es ungefähr so:
    Die Daten in der DB werden einmal verschlüsselt.
    Wenn sie über ein Programm abgerufen werden, sollen sie wieder als Klartext erscheinen.
    Werden neue Daten über das Programm eingefügt, sollen diese verschlüsselt werden.
    Dabei sollen die Änderungen des Quellcodes des bestehenden Programm vermieden werden, ich meine etwas wie:
    ...
    wenn insert,
    dann verschlüsseln --> insert
    ...
    im Quellcode ist praktisch unmöglich.
    Die Lösung kann als Modul in das Programm integriert werden, damit es keine stand alone-Lösung ist.

    Ich habe mir das überlegt, wie ich das realisieren kann. Ob ich die Daten per Schlüssel verschlüssele (den Schlüssel könnte ich dann im Registry ablegen) oder ich diese durch Pseudonyme ersetze, die ich in einer Referenzliste speichern könnte und bei Umwandlung in Klartext mit Daten zusammenführe (das Verfahren finde ich einfacher, weil ich mich nicht mehr um Datenformate kümmern muss).
    Wie ich praktisch die Aufgabe lösen könnte, hab ich bis jetzt keine Idee.

    Hatte jemand von euch irgendwann sich mit vergleichbaren Problem beschäftigen müssen? Kennt ihr Beispiele dazu?
    Ich freue mich über jeden Vorschlag.

    Gruß

  • #2
    Zur Begriffsklärung. Willst du jetzt anonymisieren oder verschlüsseln?

    Comment


    • #3
      ich will die personenbezogenen Daten in der DB anonymisieren, sodass sie keinen Personenbezug mehr aufweisen....
      dieser soll aber beim Abruf über das Programm wieder hergestellt werden und der Bearbeiter soll Namen, Adresse usw. eines Kunden ganz normal sehen....
      über die Verschlüsselung geht der Personenbezug verloren, man sieht keine echten Namen wenn man eine SQL-Abfrage startet oder?

      Comment


      • #4
        Ich würde mal sagen, beim Anonymisieren wird ein Klartext einmalig in einen (zufälligen) Text umgewandelt, eine Rückwandlung in Klartext ist nicht möglich. Was du möchtest ist ver- und entschlüsseln, da sollte es grundsätzlich diverse Möglichkeiten geben ohne das Rad neu zu erfinden.

        Gruss

        Comment


        • #5
          So sehe ich das auch. Anonymisieren sollte unumkehrbar sein (zum Beispiel einwegverschlüsselt so das es nicht zu entschlüsseln ist). Zumindest würde ich einem System meine anonymen Daten nicht anvertrauen das die Deanonymisieren kann. Auch wenn diejenigen die das Deanonymisieren können nur eine ausgewählte Gruppe ist (die die im Besitz des Schlüssels) sind. Das was du beschreibst ist einfach eine Verschlüsselung die nur von einem Teil der Benutzer entschlüsselt werden kann.

          So wie ich das verstehe möchtest du das eine bestimmte Usergruppe die Daten zwar sehen darf aber eben nur anonymisiert eine andere Usergruppe auch personenbezogen. Ohne sowas schonmal gemacht zu haben würde ich vermutlich am ehesten 2 Datenbanken aufziehen. Die anonymen Daten werden dabei aus der ~normalen~ Datenbank gewonnen und auf die ~anonyme~ Datenbank repliziert und in dem Vorgang halt irgendwie anonymisiert (z.B durch ein unumkehrbare Verschlüsselung o.ä ). Die DB mit den anonymisierten Daten würde ich dann für Benutzer auf ReadOnly setzen. Es macht ja vermutlich wenig Sinn die anonymisierten Daten von einem User ändern lassen zu können. Je nach Userrecht (anonym, nicht anonym) werden dann die User auf eine der beiden DBs gelenkt. Die DB mit den personenbezogenen Daten darfst du dann von mir aus auch noch irgendwie verschlüsseln (umnabhängig vom Gedanken der Anonymisierung) wenn diese Form der erhöhten Sicherheit gewünscht ist.

          Comment


          • #6
            wenn insert,
            dann verschlüsseln --> insert
            ...
            im Quellcode ist praktisch unmöglich.
            Die Lösung kann als Modul in das Programm integriert werden, damit es keine stand alone-Lösung ist.
            Wie soll dann eine Lösung aussehen? Was sollte das zusätzliche Modul machen? Wie sollte es Daten verschlüsseln oder wie sollte ein gesonderter Zugriff aud Read_Only Daten erfolgen?
            Christian

            Comment


            • #7
              mein Thema lautet Anonymisierung, aber mein Dozent hat von Verschlüsselung gesprochen.....dank euch sehe ich nun den Unterschied....die anonymisierten sind unumkehrbar.....aber das Problem ist, "dass eine Verschlüsselung der Daten nicht reicht um sie zu anonymisieren" und diese dürfen nicht an Dritte übermittelt werden....ich spreche über die Aufgabenstellung noch einmal mit dem Dozent, weil dies dann überhaupt zwei verschiedene Dinge sind....

              ich danke euch für eure Hilfe und wünsche einen schönen Rest der Woche
              Gruß

              Comment

              Working...
              X