Testdaten generieren — realistisch, konsistent, in Minuten.
SeedBase liest dein Datenbankschema (SQL, Django, Prisma oder direkt aus Postgres/MySQL) und generiert synthetische Testdaten, bei denen jeder Fremdschlüssel auflöst und die Verteilungen wie echtes Leben aussehen. Für Entwicklung, Staging, CI und Demos.
Free-Tier · keine Kreditkarte · EU-Hosting · keine Tracker
Das Problem mit handgemachten Testdaten
Jedes Projekt kennt die zwei schlechten Optionen: drei handgetippte Fixture-Zeilen, die nichts testen — oder eine Kopie der Produktionsdatenbank mit echten Kundendaten auf jedem Entwickler-Laptop.
Fixtures veralten
Jede Migration bricht die handgepflegten Testdaten. Neue Spalten bleiben leer, neue Tabellen fehlen ganz.
Leere Datenbanken verstecken Bugs
Pagination, N+1-Queries, Performance-Probleme und volle Dashboards zeigen sich erst mit realistischen Datenmengen und Verteilungen.
Prod-Dumps sind ein DSGVO-Risiko
Echte E-Mails, IBANs und Adressen auf Dev-Rechnern, in CI-Volumes und alten Backups — jede Kopie ist Angriffsfläche.
So funktioniert's
Schema importieren
SQL-Dump einfügen, models.py pushen (VS-Code- oder JetBrains-Plugin), Prisma-Schema hochladen oder direkt die Datenbank verbinden.
Generieren
Zeilenzahlen pro Tabelle festlegen oder die Heuristik entscheiden lassen. Verteilungen konfigurierbar: Long-Tail, Normal, Zeilen pro Eltern-Datensatz.
Exportieren oder pushen
SQL, CSV oder JSON herunterladen — oder direkt in Postgres/MySQL schreiben. Deterministisch pro Seed, also reproduzierbar in CI.
Was die generierten Daten können
Jeder Fremdschlüssel löst auf
Kind-Datensätze referenzieren existierende Eltern — auch über Self-References (parent_id) und 1:1-Beziehungen hinweg. Inserts in topologischer Reihenfolge.
Verteilungen wie im echten Leben
Nicht jeder User hat exakt 5 Bestellungen: Long-Tail- und Normalverteilungen sorgen für realistische Streuung — dort zeigen sich Pagination- und Performance-Bugs.
Datumswerte wandern mit
Timestamps werden relativ zu heute generiert. „Letzte 30 Tage“-Dashboards bleiben gefüllt, statt mit jedem Monat leerer zu werden.
Spalten verstehen sich von selbst
email wird eine E-Mail, city eine Stadt, price ein plausibler Betrag — erkannt aus Spaltennamen, Typen und (optional) Beispieldaten.
Reproduzierbar in CI
Generierungs-Konfiguration als JSON exportieren, neben den Migrationen committen, in der Pipeline anwenden. CLI für Python, SDKs für Node und PHP.
Oder: echte Daten maskieren
Wenn es Produktionsdaten sein müssen: PII automatisch erkennen, formatwahrend und join-konsistent maskieren. Mehr zur DSGVO-konformen Anonymisierung →
Häufige Fragen
Wie generiere ich Testdaten aus meinem Datenbankschema?
Schema importieren (SQL-Dump, Django models.py, Prisma-Schema oder direkte Postgres/MySQL-Verbindung), Zeilenzahlen festlegen oder die Heuristik entscheiden lassen, generieren. Jeder Fremdschlüssel zeigt auf einen existierenden Datensatz — Export als SQL, CSV oder JSON, oder direkt in die Ziel-Datenbank.
Was unterscheidet SeedBase von Faker oder Zufallsdaten?
Bibliotheken wie Faker erzeugen einzelne realistische Werte, aber keine konsistente Datenbank: Fremdschlüssel, Verteilungen und Abhängigkeiten muss man selbst verdrahten. SeedBase liest das Schema und übernimmt genau das. Ausführlicher Vergleich →
Sind die generierten Testdaten DSGVO-konform?
Vollsynthetische Daten enthalten keine personenbezogenen Daten — hinter den Werten stehen keine echten Personen. Wer echte Produktionsdaten braucht, maskiert sie formatwahrend und konsistent. Details zur Anonymisierung →
Kann ich die Generierung in CI/CD einbinden?
Ja — deterministisch pro Seed, Konfiguration als JSON neben den Migrationen, CLI (pip install seedbase) und SDKs für Node und PHP.
In zwei Minuten zur vollen Test-Datenbank
Registrieren, Schema einfügen, generieren. Kein Vertriebsgespräch, keine Kreditkarte — der Free-Tier reicht für den ersten echten Eindruck.
- FK-konsistent
- Realistische Verteilungen
- SQL / CSV / JSON
- EU-Hosting