Laravel模型时间序列？时间序列怎样查询？

38次阅读

Laravel通过Eloquent模型结合日期字段和查询构建器可高效处理时间序列数据，核心是利用Carbon对象进行时间范围筛选、排序及分组聚合；为提升性能，需在时间字段建立索引、使用复合索引、避免在WHERE中对时间列使用函数导致索引失效，并通过预加载关联模型防止N+1查询；针对大数据量，应采用分页、chunk分块处理或创建汇总表实现预聚合，减少实时计算开销；同时建议统一使用UTC时区存储时间，确保查询一致性。

Laravel模型本身并没有内置的“时间序列”概念，但你完全可以通过Eloquent的日期字段和强大的查询构建器，轻松地模拟和处理这类数据。说白了，时间序列就是按时间顺序排列的数据点集合，在Laravel里，这通常意味着你的模型会有一个或多个

datetime

类型的字段来记录事件发生的时间。至于怎么查询，核心思路就是利用这些日期字段进行筛选、排序和聚合。

解决方案

要处理时间序列数据，首先得确保你的模型和数据库表设计得当。一个典型的场景是，你的数据表里会有一个

timestamp

或

datetime

类型的列，比如

recorded_at

、

event_time

等，用来精确记录每个数据点的时间。

在Laravel模型中，通常我们会将这个时间字段配置为日期类型，确保Eloquent能正确地将其转换为

Carbon

实例，方便后续操作。例如：

// app/Models/SensorReading.php namespace AppModels;  use IlluminateDatabaseEloquentFactoriesHasFactory; use IlluminateDatabaseEloquentModel;  class SensorReading extends Model {     use HasFactory;      protected $fillable = [         'device_id',         'value',         'recorded_at', // 核心时间字段     ];      protected $casts = [         'recorded_at' => 'datetime', // 确保Laravel将其视为日期时间对象     ]; }

有了这样的基础，查询就变得直接起来。

基本查询操作：

按时间范围筛选： 这是最常见的需求。你可以用

whereBetween

来获取某个时间段内的数据。

use AppModelsSensorReading; use CarbonCarbon;  $startDate = Carbon::now()->subDays(7); // 过去7天 $endDate = Carbon::now();  $readings = SensorReading::whereBetween('recorded_at', [$startDate, $endDate])                          ->orderBy('recorded_at', 'asc') // 按时间升序排列                          ->get();

聚合数据： 时间序列数据往往需要进行聚合，比如计算某个时间段内的平均值、总和、最大最小值等。结合

groupBy

和聚合函数就能实现。

// 获取过去24小时内每小时的平均值 $hourlyAverages = SensorReading::selectRaw('DATE_FORMAT(recorded_at, "%Y-%m-%d %H:00:00") as hour, AVG(value) as average_value')                                 ->where('recorded_at', '>=', Carbon::now()->subHours(24))                                 ->groupBy('hour')                                 ->orderBy('hour', 'asc')                                 ->get();

这里

DATE_FORMAT

是MySQL的函数，PostgreSQL或SQLite会有对应的函数，例如PostgreSQL的

TO_CHAR(recorded_at, 'YYYY-MM-DD HH24:00:00')

。我个人在处理跨数据库兼容性时，更倾向于用

DB::raw

或

selectRaw

直接写SQL片段，或者在应用层进行更细致的日期处理。

按时间间隔分组： 除了小时，你可能还需要按天、按周、按月分组。

// 按天分组，计算每日总和 $dailyTotals = SensorReading::selectRaw('DATE(recorded_at) as day, SUM(value) as total_value')                             ->whereBetween('recorded_at', [$startDate, $endDate])                             ->groupBy('day')                             ->orderBy('day', 'asc')                             ->get();  // 按月分组，计算每月最大值 $monthlyMax = SensorReading::selectRaw('DATE_FORMAT(recorded_at, "%Y-%m") as month, MAX(value) as max_value')                            ->where('recorded_at', '>=', Carbon::now()->subMonths(6))                            ->groupBy('month')                            ->orderBy('month', 'asc')                            ->get();

这些都是基础，但足以覆盖大部分时间序列查询的需求了。关键在于灵活运用

where

、

whereBetween

、

orderBy

以及

groupBy

配合

selectRaw

或

DB::raw

。

如何利用Laravel Eloquent对时间序列数据进行聚合分析，例如按天、按月求平均值？

在Laravel中，对时间序列数据进行聚合分析是家常便饭。我的经验是，大部分时候，Eloquent的查询构建器配合数据库的日期函数就足够强大了。核心思路是先确定你的聚合粒度（天、小时、月等），然后用数据库函数将时间戳截断到这个粒度，再用

groupBy

进行分组，最后应用聚合函数。

举个例子，假设我们有一个

page_views

表，记录了用户访问页面的时间和数量。

按天计算每日总访问量：

use AppModelsPageView; use CarbonCarbon;  $startDate = Carbon::parse('2023-01-01'); $endDate = Carbon::parse('2023-01-31');  $dailyViews = PageView::selectRaw('DATE(created_at) as view_date, COUNT(*) as total_views')                       ->whereBetween('created_at', [$startDate, $endDate])                       ->groupBy('view_date')                       ->orderBy('view_date')                       ->get();  // 结果大概是这样： // [ //     { "view_date": "2023-01-01", "total_views": 1200 }, //     { "view_date": "2023-01-02", "total_views": 1500 }, //     // ... // ]

这里

DATE(created_at)

是数据库函数，它会提取

created_at

字段的日期部分，忽略时间。

按月计算每月平均页面加载时间：

AlibabaWOOD

阿里巴巴打造的多元电商视频智能创作平台

37

查看详情

假设

PageView

模型还有一个

load_time_ms

字段。

use AppModelsPageView; use CarbonCarbon;  $startDate = Carbon::now()->subMonths(6)->startOfMonth(); // 过去6个月的月初 $endDate = Carbon::now()->endOfMonth(); // 到当前月的月末  $monthlyAvgLoadTime = PageView::selectRaw('DATE_FORMAT(created_at, "%Y-%m") as view_month, AVG(load_time_ms) as average_load_time')                               ->whereBetween('created_at', [$startDate, $endDate])                               ->groupBy('view_month')                               ->orderBy('view_month')                               ->get();  // 结果可能： // [ //     { "view_month": "2023-08", "average_load_time": 350.2 }, //     { "view_month": "2023-09", "average_load_time": 320.5 }, //     // ... // ]

DATE_FORMAT(created_at, "%Y-%m")

会把日期格式化成“年-月”的形式，这样就能按月分组了。

更细粒度的聚合，比如按小时或分钟：

// 按小时计算某个设备在特定日期的平均温度 $hourlyTemps = SensorReading::selectRaw('DATE_FORMAT(recorded_at, "%Y-%m-%d %H:00:00") as hour_slot, AVG(temperature) as avg_temp')                             ->where('device_id', 123)                             ->whereDate('recorded_at', '2023-10-26') // 筛选特定日期                             ->groupBy('hour_slot')                             ->orderBy('hour_slot')                             ->get();

这里我用了

whereDate

这个方便的Eloquent方法来筛选特定日期，它比

whereRaw('DATE(recorded_at) = ?', ['2023-10-26'])

更具可读性。

在使用这些方法时，需要注意数据库的兼容性。

DATE()

,

DATE_FORMAT()

是MySQL的常见函数。如果你用的是PostgreSQL，可能需要用

TO_CHAR(created_at, 'YYYY-MM-DD')

或

DATE_TRUNC('day', created_at)

等。我的做法是，如果项目确定数据库类型，就直接用对应数据库的函数；如果需要跨数据库兼容，可能就需要抽象一层，或者用

Carbon

在PHP层面做一些日期处理，但这通常意味着从数据库取出更多数据，再在应用层处理，效率会低一些。

处理时间序列数据时，Laravel模型有哪些常见的性能瓶颈和优化策略？

处理时间序列数据，尤其当数据量庞大时，性能问题很快就会浮现。我曾经在项目里遇到过几十亿条记录的日志数据，每次查询都像在跑马拉松。以下是一些常见的性能瓶颈和我的优化策略：

索引缺失或不当：
- 瓶颈： 这是最常见也是最致命的问题。如果你对
```
recorded_at
```
  字段没有建立索引，或者索引不合适，那么每次时间范围查询或排序都会导致全表扫描，性能会急剧下降。
- 优化： 确保时间戳字段（如
```
recorded_at
```
  ）有B-tree索引。如果你的查询经常涉及其他字段（如
```
device_id
```
  和
```
recorded_at
```
  ），考虑建立复合索引，例如
```
INDEX (device_id, recorded_at)
```
  。索引的顺序很重要，通常把筛选频率高的字段放在前面。
聚合查询效率低下：
- 瓶颈：
```
GROUP BY
```
  操作在处理大量数据时非常耗资源，尤其是当你需要聚合非常细粒度的数据（如每分钟）时。
- 优化：
  - 缩小查询范围： 尽量在
```
where
```
    子句中限制数据量，只查询必要的时间段。
  - 预聚合/汇总表： 对于频繁访问的聚合数据（如每日、每周、每月报告），可以创建一个单独的“汇总表”（
```
summary_table
```
    ）。通过定时任务（如Laravel的调度器）每天或每小时运行一次聚合查询，将结果存储到汇总表中。用户查询时直接从汇总表读取，这样就避免了每次都重新计算。
  - 数据库原生函数优化： 确保你使用的数据库日期函数是高效的。例如，MySQL的
```
DATE()
```
    函数在某些情况下可能不如
```
DATE_FORMAT()
```
    配合索引优化。
  - 避免在
    
    where
    
    子句中对索引列使用函数： 例如，
```
WHERE DATE(recorded_at) = '...'
```
    可能会导致索引失效。更好的做法是
```
WHERE recorded_at BETWEEN '...' AND '...'
```
    。
N+1 查询问题（当关联数据时）：
- 瓶颈： 虽然时间序列本身通常是扁平数据，但如果你在查询时间序列数据时，还通过Eloquent加载了每个时间点对应的关联模型（例如，每个传感器读数关联的传感器信息），那么就可能出现N+1问题。
- 优化： 使用
```
with()
```
  进行预加载。例如，
```
SensorReading::with('sensor')->whereBetween(...)
```
  。
数据量过大，内存溢出：
- 瓶颈： 一次性从数据库中取出数百万条记录，即使不进行聚合，也可能导致PHP应用内存溢出。
- 优化：
  - 分页（Pagination）： 如果你需要展示原始数据，使用
```
paginate()
```
    方法。
  - 游标/分块（Cursor/Chunking）： 如果你需要处理所有数据（例如导出CSV），但又不能一次性加载，可以使用
```
cursor()
```
    或
```
chunk()
```
    方法，它们会分批处理数据，显著减少内存占用。
```
SensorReading::whereBetween('recorded_at', [$startDate, $endDate])              ->orderBy('recorded_at')              ->chunk(1000, function ($readings) {                  foreach ($readings as $reading) {                      // 处理每批1000条数据                  }              });
```
时区问题：
- 瓶颈： 虽然不直接是性能问题，但时区不一致会导致数据查询结果不准确，进而引发逻辑错误和重复查询。
- 优化：
  - 统一时区： 推荐数据库、应用服务器和Laravel应用都使用UTC时区存储和处理时间。在展示给用户时再转换为用户所在时区。
  - Laravel配置： 在
```
config/app.php
```
    中设置
```
'timezone' => 'UTC'
```
    。
  - 数据库配置： 确保数据库的时区设置是UTC。