
本文详解如何基于时间序列数据,用 matplotlib 绘制一条连续的累计距离-时间曲线,准确反映行驶(斜线)、停驶(水平线)和行程衔接(阶梯式累积),支持字符串时间解析与自动分段建模。
要绘制符合真实行车逻辑的“累计距离 vs 时间”图(即:行程中匀速/近似匀速行驶 → 斜线;停车等待 → 水平线;行程间无运动 → 距离保持不变),关键在于将每段行程建模为两个端点(起点时间、起点累计距离)→(终点时间、终点累计距离),并确保相邻行程首尾自然衔接——后一段的起点累计距离等于前一段的终点累计距离。
原始尝试失败的根本原因在于:plt.plot() 直接连接离散点,但未显式构造完整的分段时间-距离坐标序列,导致无法表达“停驶期距离恒定”这一核心语义。正确做法是显式构建一个时间轴数组 time 和对应的累计距离数组 distance,二者长度一致、一一对应,且包含所有状态变化节点(启程、到站、再出发)。
以下为优化后的完整实现(兼容 pandas 数据结构,增强鲁棒性与可读性):
import matplotlib.pyplot as plt import pandas as pd import numpy as np # 原始数据(转为 DataFrame 便于处理) df = pd.DataFrame({ 'veh_ID': [102, 102], 'Trip_ID': [1, 2], 'Trip_Start': ['08:00', '11:00'], 'Trip_end': ['10:00', '11:10'], 'Travel distance': [12, 1] }) def plot_cumulative_journey(df, time_col_start='Trip_Start', time_col_end='Trip_end', dist_col='Travel distance', title='Journey Plot'): """ 绘制单辆车的累计距离-时间行程图,自动处理停驶段(水平线) Parameters: - df: 包含行程起止时间与单程距离的DataFrame - time_col_start: 起始时间列名(格式如 'HH:MM') - time_col_end: 结束时间列名 - dist_col: 单程行驶距离列名 """ # 步骤1:解析时间字符串为小时制浮点数(例:'08:00' → 8.0,'10:30' → 10.5) def parse_time(t_str): h, m = map(int, t_str.split(':')) return h + m / 60.0 df = df.copy() df['Start_Hour'] = df[time_col_start].apply(parse_time) df['End_Hour'] = df[time_col_end].apply(parse_time) # 步骤2:构建分段时间点与对应累计距离 times = [] distances = [] cumulative = 0.0 for idx, row in df.iterrows(): # 当前行程起点:时间 = Start_Hour,距离 = 当前累计值 times.append(row['Start_Hour']) distances.append(cumulative) # 当前行程终点:时间 = End_Hour,距离 = 累计值 + 本段距离 cumulative += row[dist_col] times.append(row['End_Hour']) distances.append(cumulative) # 步骤3:绘图(使用 line plot 自动连接所有点,天然形成“行驶斜线+停驶水平线”) plt.figure(figsize=(8, 5)) plt.plot(times, distances, marker='o', linestyle='-', linewidth=2, markersize=6, color='#1f77b4', label='Cumulative Distance') # 可选:标注各行程段 for i, (t_start, t_end, dist) in enumerate(zip(df['Start_Hour'], df['End_Hour'], df[dist_col])): mid_t = (t_start + t_end) / 2 plt.text(mid_t, distances[2*i+1] - 0.3, f'Trip {i+1}', ha='center', va='top', fontsize=9, color='darkblue') # 设置坐标轴 plt.xlabel('Time (Hour)', fontsize=11) plt.ylabel('Cumulative Distance (km)', fontsize=11) plt.title(title, fontsize=13, fontweight='bold') plt.grid(True, alpha=0.3) plt.legend() # 优化 x 轴显示(转换回 HH:MM 格式刻度) def hour_to_hm(x, _): h = int(x) m = int((x - h) * 60) return f'{h:02d}:{m:02d}' plt.gca().xaxis.set_major_formatter(plt.FuncFormatter(hour_to_hm)) plt.xticks(rotation=0) plt.tight_layout() plt.show() # 调用绘图函数 plot_cumulative_journey(df)
✅ 输出效果说明:
立即学习“Python免费学习笔记(深入)”;
- 图中呈现一条连续折线:从 08:00(0 km)→ 10:00(12 km)斜上升(第一段行驶),接着 10:00→11:00 水平线(停驶 1 小时),再 11:00→11:10 斜上升至 13 km(第二段行驶)。
- 所有停驶时段自动表现为零斜率水平线,无需额外插值或手动拼接。
⚠️ 注意事项:
- 时间字符串必须严格为 ‘HH:MM’ 格式(24 小时制),否则 split(‘:’) 会报错;生产环境建议添加异常捕获与格式校验。
- 若存在跨天行程(如 ’23:50′ → ’00:20’),需转换为 datetime 类型并处理日期偏移,本例假设单日内行程。
- 如需多车对比,可按 veh_ID 分组后循环调用该函数,并用不同颜色/线型区分。
此方法本质是将业务逻辑(行程状态机)映射为数学序列,比强行用 shift() 或 repeat() 拼接更清晰、可维护性更高,也易于扩展(如加入速度计算、停留时长统计等)。