Laravel如何利用Seed生成数万级测试数据？（批量性能）

2次阅读

使用 db::table()->insert() 批量插入可提速 5–10 倍，需控制每批 ≤1000 行、关闭事件与外键检查、禁用事务日志、预生成 faker 数据、避免 factory()->create() 隐式开销。

用 `DB::table()->insert()` 替代模型 `save()` 或 `create()`

模型逐条写入在生成数万条数据时会明显变慢，因为每条记录都触发了 Eloquent 的事件、类型转换、验证（即使没显式写）、属性赋值等开销。直接走查询构造器批量插入，能跳过这些，速度通常快 5–10 倍。

实操建议：

在 Seeder 中用 DB::table('users')->insert($rows)，其中 $rows 是二维数组，每项是字段名 => 值的关联数组
单次 insert() 最好控制在 1000 行以内（mysql 默认 max_allowed_packet 可能限制大批次）
避免在循环里反复调用 insert()，应攒够一批再插，比如每 500 条 flush 一次
记得提前关闭模型事件：在 Seeder 开头加 Model::unsetEventDispatcher()，否则即使不用模型，某些全局监听仍可能被触发

禁用外键检查和事务自动提交

默认 laravel Seeder 在事务中运行，对数万条数据来说，事务日志膨胀、锁持有时间长、内存占用高，容易超时或 OOM。同时外键约束也会拖慢插入速度。

实操建议：

在 Seeder 开头执行 DB::statement('SET forEIGN_KEY_CHECKS = 0')，结尾再设回 1
显式关闭事务：在 run() 方法开头加 DB::disableQueryLog()（防内存爆）和 DB::beginTransaction() 不要加；如果真要用事务，务必分段 commit()，而不是包整个 Seeder
MySQL 下可临时调大 innodb_log_file_size 和 bulk_insert_buffer_size，但生产环境慎改，仅限本地/CI 环境

用 `Faker` 配合数组预生成，别在循环里实时调用

Faker 实例每次生成字符串、日期等都有一定开销，嵌套在万级循环里会累积成可观延迟，尤其用了 unique() 或复杂 provider 时更明显。

实操建议：

先用 $faker->name() 等生成一个含 1000 个名字的数组，再按需 slice 分配，而不是每次循环都调一次
避免在 insert() 数据前用 $faker->unique()->numberBetween()——它内部维护哈希表，大数据量下内存和查找成本陡增；改用数据库层去重（如先插再 delete 重复）或应用层布隆过滤
对固定枚举字段（如 status），直接用 ['active', 'inactive'][array_rand(['active', 'inactive'])]，比 $faker->randomElement() 轻量得多

小心 `factory()->count()->create()` 的隐式开销

Laravel 8+ 的工厂默认走 Eloquent create()，哪怕你只想要原始数据，它仍会实例化模型、调用 make()、处理 for() 关系、触发 creating 事件——这对批量场景完全是冗余负担。

实操建议：

不要用 UserFactory::new()->count(10000)->create()，改用 UserFactory::new()->count(10000)->make()->toArray() 得到纯数组，再喂给 DB::table()->insert()
如果工厂里定义了 for() 关系，make() 仍会 eager 加载关联模型，导致 N+1；此时应拆解：先批量生成主表数据，再单独批量生成从表，并用外键数组对齐
工厂的 definition() 中避免调用 DB 查询（如 User::inRandomOrder()->first()），这类操作在万次循环里会直接拖垮 Seeder

真正卡住的往往不是“怎么生成”，而是“谁在悄悄拦路”——比如某个被遗忘的 Observer、一条没关的 Query Log、或是 MySQL 的 autocommit=1 在大批量时反复刷盘。跑之前先 php artisan tinker 里试 100 条，看 DB::enableQueryLog() 输出里有没有意外语句，比硬扛超时更省时间。

发表于：php框架

近一天内

复制链接

如何使用 Open3D 实时可视化多帧点云序列并生成流畅视频流

php模拟post请求重试机制_phppost失败重试教程【技巧】

thinkphp数据库事务如何正确使用

PHP获取域名后如何加密存储_PHP域名加密保存技巧【技巧】

composer怎么锁定依赖版本_composer怎么同步lock文件【实操】

Laravel如何利用Seed生成数万级测试数据？（批量性能）

用 `DB::table()->insert()` 替代模型 `save()` 或 `create()`

禁用外键检查和事务自动提交

用 `Faker` 配合数组预生成，别在循环里实时调用

小心 `factory()->count()->create()` 的隐式开销

CSS如何实现自适应内容的网格布局_利用auto-fill与auto-fit自动填充css

如何修改mysql默认端口_mysql端口配置方法

Web.config appSettings配置 .NET应用程序键值对设置

如何把html转换成另一个页面

css如何实现flex元素间等距排列_使用justify-content: space-between

composer如何更新特定的插件_管理composer自身功能扩展【实操】

Linux服务依赖异常处理_依赖关系排查

LaravelAPI如何验证用户_LaravelAPI用户验证实现方法【指南】

如何在 Windows 上实现 Go 语言文件独占锁

Linux巡检自动化方案_自动巡检架构

Laravel如何利用Seed生成数万级测试数据？（批量性能）

用 DB::table()->insert() 替代模型 save() 或 create()

禁用外键检查和事务自动提交

用 Faker 配合数组预生成，别在循环里实时调用

小心 factory()->count()->create() 的隐式开销

用 `DB::table()->insert()` 替代模型 `save()` 或 `create()`

用 `Faker` 配合数组预生成，别在循环里实时调用

小心 `factory()->count()->create()` 的隐式开销