Datos de prueba · coherentes con las FK · desde el esquema

Generador de datos de prueba: realistas, coherentes con las claves foráneas, en minutos.

SeedBase lee el esquema de tu base de datos (SQL, Django, Prisma o directamente desde Postgres/MySQL) y genera datos de prueba sintéticos en los que cada clave foránea declarada resuelve y las distribuciones se ven cercanas a producción. Para desarrollo, staging, CI y demos.

Plan gratuito · sin tarjeta de crédito · alojamiento en la UE · sin rastreadores

El problema de los datos de prueba hechos a mano

Todo proyecto conoce las dos malas opciones: tres filas de fixtures escritas a mano que no prueban nada, o una copia de la base de datos de producción con datos de clientes reales en cada portátil de desarrollo.

Los fixtures se quedan obsoletos

Cada migración rompe los datos de prueba mantenidos a mano. Las columnas nuevas quedan vacías y las tablas nuevas faltan por completo.

Las bases de datos vacías ocultan bugs

La paginación, las consultas N+1, los problemas de rendimiento y los paneles llenos solo aparecen con volúmenes y distribuciones de datos realistas.

Los volcados de producción son un riesgo para el RGPD

Correos, IBAN y direcciones reales en máquinas de desarrollo, en volúmenes de CI y en copias de seguridad antiguas: cada copia es superficie de ataque.

Cómo funciona

Importa el esquema

Pega un volcado SQL, envía tu models.py (plugin de VS Code o JetBrains), sube el esquema de Prisma o conecta la base de datos directamente.

Genera

Define el número de filas por tabla o deja que la heurística decida. Distribuciones configurables: cola larga, normal, filas por registro padre.

Exporta o envía

Descarga SQL, CSV o JSON, o escribe directamente en Postgres/MySQL. Determinista por semilla, así que es reproducible en CI.

Qué hacen los datos generados

coherente-FK

Cada clave foránea resuelve

Los registros hijos referencian a padres existentes, también en autorreferencias (parent_id) y relaciones 1:1. Los inserts van en orden topológico.

realista

Distribuciones cercanas a producción

No todos los usuarios tienen exactamente 5 pedidos: las distribuciones de cola larga y normal dan una dispersión realista, ahí es donde aparecen los bugs de paginación y rendimiento.

al día

Las fechas se mueven contigo

Las marcas de tiempo se generan en relación con hoy. Los paneles de «últimos 30 días» siguen llenos en lugar de vaciarse mes a mes.

detectado

Las columnas se entienden solas

email se convierte en un correo, city en una ciudad, price en un importe plausible, detectado a partir del nombre de la columna, del tipo y (opcionalmente) de datos de ejemplo.

config-as-code

Reproducible en CI

Exporta la configuración de generación como JSON, súbela junto a las migraciones y aplícala en el pipeline. CLI para Python, SDK para Node y PHP.

RGPD

O bien: enmascara datos reales

Si tienen que ser datos de producción: detecta la PII automáticamente y enmascáralo preservando el formato y coherente en los joins. Más sobre la anonimización conforme al RGPD →

Para ser honestos: para un proyecto de 5 tablas con un par de fixtures, Faker o factory_boy son más que suficientes. SeedBase merece la pena cuando las bases de datos tienen que estar llenas y coherentes: con muchas tablas, en equipos, en CI o cuando servicios que no son de Python comparten la misma base de datos. Probado en un proyecto Django real con 20 apps y 226 tablas, justo el caso para el que está hecho.

Preguntas frecuentes

¿Cómo genero datos de prueba a partir del esquema de mi base de datos?

Importa el esquema (volcado SQL, models.py de Django, esquema de Prisma o conexión directa a Postgres/MySQL), define el número de filas o deja que la heurística decida, y genera. Cada clave foránea apunta a un registro existente, con exportación a SQL, CSV o JSON, o directamente en tu base de datos de destino.

¿Qué diferencia a SeedBase de Faker o de los datos aleatorios?

Librerías como Faker generan valores realistas sueltos, pero no una base de datos coherente: las claves foráneas, las distribuciones y las dependencias tienes que cablearlas a mano. SeedBase lee el esquema y se encarga justo de eso. Comparativa detallada →

¿Los datos de prueba generados cumplen el RGPD?

Los datos totalmente sintéticos no contienen datos personales: detrás de los valores no hay personas reales. Quien necesite datos de producción reales puede enmascararlos de forma coherente y preservando el formato. Detalles sobre la anonimización →

¿Puedo integrar la generación en CI/CD?

Sí, determinista por semilla, configuración como JSON junto a las migraciones, CLI (pip install seedbase) y SDK para Node y PHP.

En dos minutos, una base de datos de prueba completa

Regístrate, pega el esquema y genera. Sin llamadas comerciales, sin tarjeta de crédito; el plan gratuito basta para una primera impresión de verdad.

  • Coherente con las FK
  • Distribuciones realistas
  • SQL / CSV / JSON
  • Alojamiento en la UE
Empezar gratis ahora

Para tu stack: Django · Prisma · SQL  ·  Comparativa: vs Mockaroo · vs Faker