Données de test · cohérentes avec les FK · depuis le schéma

Générateur de données de test : réaliste, cohérent avec les clés étrangères, en quelques minutes.

SeedBase lit votre schéma de base de données (SQL, Django, Prisma ou directement depuis Postgres/MySQL) et génère des données de test synthétiques dont chaque clé étrangère déclarée se résout, avec des distributions proches de la production. Pour le développement, la pré-production, la CI et les démos.

Offre gratuite · sans carte bancaire · hébergement UE · sans traqueurs

Le problème des données de test faites à la main

Chaque projet connaît les deux mauvaises options : trois lignes de fixtures tapées à la main qui ne testent rien, ou une copie de la base de production avec de vraies données clients sur le portable de chaque développeur.

Les fixtures se périment

Chaque migration casse les données de test maintenues à la main. Les nouvelles colonnes restent vides, les nouvelles tables manquent complètement.

Les bases vides cachent les bugs

La pagination, les requêtes N+1, les soucis de performance et les tableaux de bord bien remplis n'apparaissent qu'avec des volumes et des distributions réalistes.

Les dumps de prod sont un risque RGPD

De vrais e-mails, IBAN et adresses sur les postes de dev, dans les volumes de CI et les vieilles sauvegardes : chaque copie est une surface d'attaque.

Comment ça marche

Importez le schéma

Collez un dump SQL, poussez votre models.py (plugin VS Code ou JetBrains), téléversez un schéma Prisma ou connectez directement la base.

Générez

Fixez le nombre de lignes par table ou laissez l'heuristique décider. Distributions configurables : longue traîne, normale, lignes par enregistrement parent.

Exportez ou poussez

Téléchargez en SQL, CSV ou JSON, ou écrivez directement dans Postgres/MySQL. Déterministe par graine, donc reproductible en CI.

Ce que les données générées savent faire

cohérence FK

Chaque clé étrangère se résout

Les enregistrements enfants référencent des parents existants, y compris à travers les auto-références (parent_id) et les relations 1:1. Insertions dans l'ordre topologique.

réaliste

Des distributions proches de la production

Tous les utilisateurs n'ont pas exactement 5 commandes : des distributions en longue traîne et normales donnent une dispersion réaliste, là où se cachent les bugs de pagination et de performance.

à jour

Les dates suivent le temps

Les horodatages sont générés relativement à aujourd'hui. Les tableaux de bord « 30 derniers jours » restent remplis au lieu de se vider mois après mois.

détecté

Les colonnes se comprennent toutes seules

email devient un e-mail, city une ville, price un montant plausible, détecté à partir des noms de colonnes, des types et (en option) de données d'exemple.

config-as-code

Reproductible en CI

Exportez la configuration de génération en JSON, versionnez-la à côté des migrations, appliquez-la dans le pipeline. CLI pour Python, SDK pour Node et PHP.

RGPD

Ou : masquer de vraies données

S'il faut absolument des données de production : détection automatique des PII, masquage en préservant le format et la cohérence des jointures. En savoir plus sur l'anonymisation conforme au RGPD →

Soyons honnêtes : pour un projet de 5 tables avec deux fixtures, Faker ou factory_boy suffisent largement. SeedBase vaut le coup quand les bases doivent être pleines et cohérentes, avec beaucoup de tables, en équipe, en CI, ou quand des services non-Python utilisent la même base. Testé sur un vrai projet Django de 20 apps et 226 tables, exactement le cas pour lequel il est conçu.

Questions fréquentes

Comment générer des données de test à partir de mon schéma de base de données ?

Importez votre schéma (dump SQL, models.py Django, schéma Prisma ou connexion directe à Postgres/MySQL), fixez le nombre de lignes ou laissez l'heuristique décider, puis générez. Chaque clé étrangère pointe vers un enregistrement existant, export en SQL, CSV ou JSON, ou directement dans la base cible.

Qu'est-ce qui distingue SeedBase de Faker ou de données aléatoires ?

Des bibliothèques comme Faker produisent des valeurs réalistes isolées, mais pas une base cohérente : les clés étrangères, les distributions et les dépendances, c'est à vous de les câbler. SeedBase lit le schéma et s'en charge précisément à votre place. Comparatif détaillé →

Les données de test générées sont-elles conformes au RGPD ?

Des données entièrement synthétiques ne contiennent aucune donnée personnelle, aucune personne réelle ne se cache derrière les valeurs. Si vous devez partir de vraies données de production, masquez-les en préservant le format et la cohérence des jointures. Détails sur l'anonymisation →

Puis-je intégrer la génération dans une CI/CD ?

Oui, déterministe par graine, configuration en JSON à côté des migrations, CLI (pip install seedbase) et SDK pour Node et PHP.

Une base de test complète en deux minutes

Inscrivez-vous, collez votre schéma, générez. Pas d'appel commercial, pas de carte bancaire, l'offre gratuite suffit pour une vraie première impression.

  • Cohérence des FK
  • Distributions réalistes
  • SQL / CSV / JSON
  • Hébergement UE
Démarrer gratuitement

Pour votre stack : Django · Prisma · SQL  ·  Comparatif : vs Mockaroo · vs Faker