如何用 Python 绘制车辆行程累计距离-时间折线图(含停驶段平直线)

6次阅读

如何用 Python 绘制车辆行程累计距离-时间折线图(含停驶段平直线)

本文详解如何基于时间序列数据,用 matplotlib 绘制一条连续的累计距离-时间曲线,准确反映行驶(斜线)、停驶(水平线)和行程衔接(阶梯式累积),支持字符串时间解析与自动分段建模。

要绘制符合真实行车逻辑的“累计距离 vs 时间”图(即:行程中匀速/近似匀速行驶 → 斜线;停车等待 → 水平线;行程间无运动 → 距离保持不变),关键在于将每段行程建模为两个端点(起点时间、起点累计距离)→(终点时间、终点累计距离),并确保相邻行程首尾自然衔接——后一段的起点累计距离等于前一段的终点累计距离。

原始尝试失败的根本原因在于:plt.plot() 直接连接离散点,但未显式构造完整的分段时间-距离坐标序列,导致无法表达“停驶期距离恒定”这一核心语义。正确做法是显式构建一个时间轴数组 time 和对应的累计距离数组 distance,二者长度一致、一一对应,且包含所有状态变化节点(启程、到站、再出发)

以下为优化后的完整实现(兼容 pandas 数据结构,增强鲁棒性与可读性):

import matplotlib.pyplot as plt import pandas as pd import numpy as np  # 原始数据(转为 DataFrame 便于处理) df = pd.DataFrame({     'veh_ID': [102, 102],     'Trip_ID': [1, 2],     'Trip_Start': ['08:00', '11:00'],     'Trip_end': ['10:00', '11:10'],     'Travel distance': [12, 1] })  def plot_cumulative_journey(df, time_col_start='Trip_Start', time_col_end='Trip_end',                             dist_col='Travel distance', title='Journey Plot'):     """     绘制单辆车的累计距离-时间行程图,自动处理停驶段(水平线)      Parameters:     - df: 包含行程起止时间与单程距离的DataFrame     - time_col_start: 起始时间列名(格式如 'HH:MM')     - time_col_end: 结束时间列名     - dist_col: 单程行驶距离列名     """     # 步骤1:解析时间字符串为小时制浮点数(例:'08:00' → 8.0,'10:30' → 10.5)     def parse_time(t_str):         h, m = map(int, t_str.split(':'))         return h + m / 60.0      df = df.copy()     df['Start_Hour'] = df[time_col_start].apply(parse_time)     df['End_Hour'] = df[time_col_end].apply(parse_time)      # 步骤2:构建分段时间点与对应累计距离     times = []     distances = []      cumulative = 0.0      for idx, row in df.iterrows():         # 当前行程起点:时间 = Start_Hour,距离 = 当前累计值         times.append(row['Start_Hour'])         distances.append(cumulative)          # 当前行程终点:时间 = End_Hour,距离 = 累计值 + 本段距离         cumulative += row[dist_col]         times.append(row['End_Hour'])         distances.append(cumulative)      # 步骤3:绘图(使用 line plot 自动连接所有点,天然形成“行驶斜线+停驶水平线”)     plt.figure(figsize=(8, 5))     plt.plot(times, distances, marker='o', linestyle='-', linewidth=2, markersize=6,               color='#1f77b4', label='Cumulative Distance')      # 可选:标注各行程段     for i, (t_start, t_end, dist) in enumerate(zip(df['Start_Hour'], df['End_Hour'], df[dist_col])):         mid_t = (t_start + t_end) / 2         plt.text(mid_t, distances[2*i+1] - 0.3, f'Trip {i+1}',                  ha='center', va='top', fontsize=9, color='darkblue')      # 设置坐标轴     plt.xlabel('Time (Hour)', fontsize=11)     plt.ylabel('Cumulative Distance (km)', fontsize=11)     plt.title(title, fontsize=13, fontweight='bold')     plt.grid(True, alpha=0.3)     plt.legend()      # 优化 x 轴显示(转换回 HH:MM 格式刻度)     def hour_to_hm(x, _):         h = int(x)         m = int((x - h) * 60)         return f'{h:02d}:{m:02d}'      plt.gca().xaxis.set_major_formatter(plt.FuncFormatter(hour_to_hm))     plt.xticks(rotation=0)      plt.tight_layout()     plt.show()  # 调用绘图函数 plot_cumulative_journey(df)

输出效果说明

立即学习Python免费学习笔记(深入)”;

  • 图中呈现一条连续折线:从 08:00(0 km)→ 10:00(12 km)斜上升(第一段行驶),接着 10:00→11:00 水平线(停驶 1 小时),再 11:00→11:10 斜上升至 13 km(第二段行驶)。
  • 所有停驶时段自动表现为零斜率水平线,无需额外插值或手动拼接。

⚠️ 注意事项

  • 时间字符串必须严格为 ‘HH:MM’ 格式(24 小时制),否则 split(‘:’) 会报错;生产环境建议添加异常捕获与格式校验。
  • 若存在跨天行程(如 ’23:50′ → ’00:20’),需转换为 datetime 类型并处理日期偏移,本例假设单日内行程。
  • 如需多车对比,可按 veh_ID 分组后循环调用该函数,并用不同颜色/线型区分。

此方法本质是将业务逻辑(行程状态机)映射为数学序列,比强行用 shift() 或 repeat() 拼接更清晰、可维护性更高,也易于扩展(如加入速度计算、停留时长统计等)。

text=ZqhQzanResources