DSGVO · Art. 32 · Datenminimierung

Produktionsdaten anonymisieren — für Entwicklung, Staging und Demos.

Echte Kundendaten haben auf Entwickler-Laptops und Staging-Servern nichts verloren. SeedBase erkennt personenbezogene Daten automatisch und maskiert sie formatwahrend und konsistent — oder erzeugt gleich vollsynthetische Testdaten, hinter denen nachweislich keine echten Personen stehen.

Komplett self-service: registrieren, Datenbank verbinden, anonymisieren. Kein Vertriebsgespräch, keine Demo-Termine — EU-gehostet, ohne Dritt-CDNs.

Das Problem kennt jedes Team.

„Zieh dir mal schnell einen Prod-Dump" — und schon liegen E-Mail-Adressen, IBANs und Gesundheitsdaten echter Kunden auf Laptops, bei Freelancern und auf schwach gesicherten Staging-Servern.

Jede Kopie ist ein Verarbeitungsvorgang

Dev- und Staging-Kopien unterliegen denselben DSGVO-Pflichten wie das Produktivsystem — bei meist deutlich schwächerer Absicherung und mehr Zugriffsberechtigten.

Externe Dienstleister & Freelancer

Sobald Agenturen oder Freelancer mit Prod-Daten arbeiten, braucht es Auftragsverarbeitungsverträge — und das Risiko wandert mit jedem Dump nach draußen.

Art. 32 verlangt angemessene Maßnahmen

Die DSGVO nennt Pseudonymisierung ausdrücklich als Sicherheitsmaßnahme. „Wir haben es halt immer so gemacht" ist keine.

So löst SeedBase das.

Zwei Wege, je nach Bedarf — kombinierbar.

PII-Erkennung

Personenbezogene Spalten automatisch finden

Erkennung über Spaltennamen und Wertemuster (E-Mail, IBAN, Telefon, Adresse …), optional KI-gestützt. Ergebnis ist ein Report mit Vorschlägen, den Sie fachlich prüfen und übersteuern können.

Maskierung

Formatwahrend & konsistent ersetzen

Eine E-Mail bleibt eine E-Mail, eine IBAN behält Präfix und Länge. Derselbe Originalwert wird projektweit auf denselben Ersatzwert abgebildet — Joins, Gruppierungen und Tests funktionieren weiter. Auf Wunsch direkt in der Datenbank (in-place) — ohne dass eine Kopie bei SeedBase gespeichert wird.

Subsetting

Datenminimierung eingebaut

Statt der vollen Datenbank ein referenziell konsistenter Ausschnitt — realistische 1 % für lokale Entwicklung und CI, alle Fremdschlüssel intakt. Weniger Daten, weniger Risiko, kleinere Dumps.

Synthetisch

Oder: gar keine echten Daten

SeedBase erzeugt aus Ihrem Schema vollsynthetische, FK-konsistente Testdaten mit realistischen Verteilungen. Wo nie echte Personendaten drin waren, kann auch nichts re-identifiziert werden.

Ehrlichkeit statt Marketing: Heuristische PII-Erkennung ist nicht vollständig — Freitextfelder mit eingestreuten Namen kann sie übersehen. Maskierung ist je nach Ausgestaltung Pseudonymisierung, nicht automatisch Anonymisierung im Rechtssinn. SeedBase erzeugt deshalb pro Lauf einen Privacy-Report als Arbeitsgrundlage für Ihre/n Datenschutzbeauftragte/n. Details: Anonymisierung & DSGVO in der Doku.

In drei Schritten zur sauberen Staging-Umgebung.

Self-Service in der Web-App, per CLI oder direkt aus PyCharm/VS Code.

Datenbank verbinden oder Schema importieren

PostgreSQL, MySQL u. a. — oder Schema aus SQL-Dump, Django-Models, Prisma. Zugangsdaten werden verschlüsselt gespeichert.

PII-Report prüfen

SeedBase schlägt erkannte personenbezogene Spalten samt Transform vor. Sie bestätigen, ergänzen oder schließen Spalten aus.

Maskieren oder generieren

In-place in der Ziel-DB maskieren, einen maskierten Subset-Dump ziehen — oder vollsynthetische Daten generieren und per CLI/Plugin in Dev & CI laden.

Einordnung in die DSGVO.

Welche Maßnahme wohin gehört — als Orientierung, nicht als Rechtsberatung.

MaßnahmeDSGVO-Bezug
Formatwahrende, konsistente MaskierungArt. 32 — Sicherheit der Verarbeitung; ausdrücklich genannte Pseudonymisierung. Originalwerte werden deterministisch ersetzt, ohne den Originalwert preiszugeben.
SubsettingArt. 5 Abs. 1 lit. c — Datenminimierung: nur der für den Zweck nötige Ausschnitt verlässt das Produktivsystem.
Vollsynthetische DatenKein Personenbezug ab Erzeugung — die DSGVO ist auf diese Daten nicht anwendbar, da keine echten Personen dahinterstehen.
Privacy-ReportArt. 5 Abs. 2 — Rechenschaftspflicht: dokumentiert pro Lauf, was maskiert wurde und wie sich Werteverteilungen verändert haben.
EU-Hosting, keine Dritt-CDNsKap. V — keine Drittlandübermittlung durch die Plattform selbst; die Web-App lädt keinerlei Ressourcen von Drittanbietern.

Kein Sales-Call. Einfach machen.

Bei uns gibt es keine „Demo buchen"-Schranke und kein Vertriebsgespräch: Konto anlegen, Datenbank verbinden oder Schema importieren, PII-Report prüfen, anonymisieren. Der Free-Plan reicht zum Ausprobieren — bezahlt wird erst, wenn es sich lohnt.

  • Start in unter 5 Minuten
  • Keine Kreditkarte für den Einstieg
  • Wiederholbar als automatisierter Job
Kostenlos starten

Häufige Fragen.

Dürfen wir Produktionsdaten überhaupt in Dev & Staging verwenden?

Auch Dev- und Staging-Kopien sind Verarbeitungsvorgänge im Sinne der DSGVO — mit mehr Kopien, mehr Zugriffsberechtigten und meist schwächerer Absicherung steigt das Risiko erheblich. Art. 32 verlangt dem Risiko angemessene technische Maßnahmen und nennt Pseudonymisierung ausdrücklich. Maskierte oder synthetische Daten sind der etablierte Weg, dieses Risiko zu reduzieren.

Ist Maskierung dasselbe wie Anonymisierung?

Nicht automatisch. Konsistente Maskierung ist je nach Ausgestaltung Pseudonymisierung oder Anonymisierung — das hängt vom Datenbestand und Restrisiko der Re-Identifizierung ab und gehört in die Bewertung Ihres Datenschutzbeauftragten. SeedBase liefert dafür den Privacy-Report. Wer Personenbezug sicher ausschließen will, nutzt vollsynthetische Daten.

Bleiben die Daten für Tests brauchbar?

Ja — das ist der Sinn der formatwahrenden Maskierung: E-Mails bleiben gültige E-Mail-Formen, IBANs behalten Präfix und Länge, gleiche Originalwerte ergeben projektweit gleiche Ersatzwerte (Joins funktionieren). Auf Wunsch wird die Häufigkeitsverteilung kategorialer Werte nachgebildet.

Verlassen unsere Daten dabei das Haus?

Ehrliche Antwort: vorübergehend ja. Beim In-place-Masking liest SeedBase die Werte batchweise ein, berechnet die Maskierung im Arbeitsspeicher unserer EU-gehosteten Server und schreibt sie direkt in Ihre Datenbank zurück — eine Kopie Ihrer Datenbank wird bei SeedBase nicht gespeichert. Die Originalwerte durchlaufen die Plattform also transient zur Verarbeitung (Auftragsverarbeitung), bleiben aber nicht dort. Es gibt keine Dritt-CDNs und keine Drittlandübermittlung. Wer auch die transiente Verarbeitung ausschließen will, erzeugt vollsynthetische Daten direkt aus dem Schema — dafür braucht SeedBase Ihre echten Daten gar nicht.

Was kostet das?

Self-Service: ab kostenlos, Pro/Team-Pläne siehe Preise. Alles self-service — kein Vertriebskontakt nötig.