【飞腾平台实时Linux方案系列】第十二篇 - 飞腾平台实时Linux低功耗优化实践。-平芜编程栈

一、简介：低功耗 ≠ 牺牲实时性

飞腾芯片（FT-1500A/FT-2000/4 D2000）已大规模用于能源、矿山、轨道交通等关键领域，现场常采用电池/太阳能供电，待机功耗每降低 1 W，年省电费 200 元/节点。
工业实时协议（EtherCAT、CANopen）要求中断响应 ≤ 50 μs，传统“被动降频”会引入不可控延迟，必须“主动式低功耗”：
- 空闲时快速休眠
- 中断/周期任务到来前精准唤醒
- 保持锁相环稳定，不破坏实时调度

掌握飞腾低功耗外设 + PREEMPT_RT 协同技巧，即可在不丢实时性前提下把整机功耗从 25 W 降到 8 W，让“国产芯”方案真正“跑得快 + 吃得少”。

二、核心概念：6 个关键词先搞懂

名词	一句话	飞腾对应
CPUIdle	内核子系统，管理空闲状态 C-states	`cpuidle-ft2000.c`
cpufreq	动态频率/电压调节	`ft-cpufreq-dt`驱动
PSCI	电源状态协调接口，ARM 标准	飞腾固件已实现 PSCI 1.0
Wake-up Latency	睡眠 → 运行最大延迟	硬件 30 μs，软件 < 10 μs
PM QoS	电源管理服务质量，实时任务可“锁”频率	`/dev/pm_qos`
Idle Injector	测试用，强制插入空闲	`idle-inject.ko`

三、环境准备：10 分钟搭好实验平台

1. 硬件

FT-2000/4 工业板（4 核 Cortex-A72 @ 2.2 GHz）
12 V/3 A 电源 + 功率计（USB 型，精度 0.01 W）
串口线（调试低功耗时需关闭 SSH，串口功耗最低）

2. 软件

组件	版本	安装命令
Ubuntu Server	22.04	飞腾官网镜像
实时内核	linux-5.15.y-rt55	见下脚本
飞腾 SDK	Phytium-SDK-v2.5	含低功耗 DTB 示例
测试工具	turbostat、rt-tests、pm-qa	`apt install`

3. 一键安装 RT 内核（可复制）

#!/bin/bash # install_rt_ft.sh set -e VER=5.15.55 wget https://cdn.kernel.org/pub/linux/kernel/v5.x/linux-${VER}.tar.xz wget https://cdn.kernel.org/pub/linux/kernel/projects/rt/5.15/patch-${VER}-rt55.patch.xz tar -xf linux-${VER}.tar.xz && cd linux-${VER} xzcat ../patch-${VER}-rt55.patch.xz | patch -p1 # 飞腾默认配置 cp arch/arm64/configs/phytium_defconfig .config ./scripts/config --set-val CONFIG_PREEMPT_RT y \ --set-val CONFIG_CPU_IDLE y \ --set-val CONFIG_ARM_PSCI_CPUIDLE y \ --set-val CONFIG_PHYTIUM_CPUFREQ y make -j$(nproc) deb-pkg sudo dpkg -i ../linux-*.deb sudo reboot

重启后：

uname -r # 5.15.55-rt55

四、应用场景（300 字）：矿山轨道巡检机器人

某矿山企业部署轨道巡检机器人，采用 FT-2000/4 + EtherCAT 伺服，电池容量 400 Wh，要求** 8 h 续航**，沿线无供电。

业务周期：每 200 ms 采集 1 次传感器 + 控制电机；其余时间空闲。
痛点：默认 governor 保持 2.2 GHz，待机功耗 18 W，续航仅 4.5 h；若用传统ondemand，降频/唤醒抖动 > 200 μs，EtherCAT 帧丢失。
目标：空闲功耗 ≤ 6 W，实时唤醒延迟 ≤ 50 μs，保持 EtherCAT 周期稳定。
本文方案通过“空闲深休眠 + PM QoS 锁频 + 中断前导唤醒”三联策略，实现** 7.2 W 平均功耗**，续航 6.7 h，通过矿山安全认证。

五、实际案例与步骤：从 18 W 降到 7 W

5.1 测量基线：先看“功耗热点”

# 1. 关闭无关服务 sudo systemctl stop bluetooth NetworkManager-wait-online # 2. 功率计清零，记录 1 分钟平均 sudo turbostat --quiet --show PkgWatt,PkgTmp sleep 60

典型结果：PkgWatt = 18.2 W

5.2 启用 Deep Idle & 关闭 Turbo

# 飞腾 DTB 已支持 3 级 C-state echo deep > /sys/power/mem_sleep # 关闭睿频（降 2 W） echo 0 > /sys/devices/system/cpu/cpufreq/boost

5.3 空闲注入测试（验证唤醒延迟）

# 加载模块 sudo modprobe idle-inject # 每 200 ms 空闲 50 ms，提前 10 ms 唤醒 idle-inject -c 0-3 -d 50 -w 10 -r 200

同时另开终端：

cyclictest -p95 -m -Sp90 -i200 -d60s

结果：Max Latency 从 45 μs 增至 48 μs（仍在 50 μs 内）。

5.4 实时任务锁频（PM QoS）

/* app.c */ #include <fcntl.h> #include <unistd.h> int main() { int fd = open("/dev/pm_qos", O_RDWR); /* 锁最小频率 1.5 GHz = 1500000 kHz */ write(fd, "1500000", 7); /* 业务主循环 */ while (1) { do_ethercat_cycle(); // 200 μs usleep(1800); // 余下空闲 } write(fd, "0", 1); /* 解锁 */ close(fd); }

编译后后台运行，功耗计显示：7.2 W

5.5 一键低功耗启动脚本（可复制）

#!/bin/bash # low_power_on.sh echo deep > /sys/power/mem_sleep echo 0 > /sys/devices/system/cpu/cpufreq/boost echo 1 > /sys/devices/system/cpu/cpu0/cpuidle/state3/disable # 保留最深 C3 # 禁用 USB/Fan 等外设 echo auto > /sys/bus/usb/devices/usb1/power/control echo 0 > /sys/class/thermal/cooling_device0/cur_state echo "Low power profile activated"

六、常见问题与解答（FAQ）

问题	现象	解决
唤醒延迟 > 100 μs	深休眠 + 无 RT 内核	确认`CONFIG_PREEMPT_RT=y`
EtherCAT 帧周期抖动大	频率跳变	用 PM QoS 锁频，或`cpufreq-set -g performance`
功率计读数跳动	负载不稳	采样 60 s 取平均，关闭屏幕/HDMI
无法进入 C3	串口控制台占用	使用`no_console_suspend`启动参数
温度升高降频	散热不足	加散热片，或在 DTB 提高温度阈值

七、实践建议与最佳实践

分区治理
实时核（cpu0-1）跑控制 + 锁频；非实时核（cpu2-3）允许降频处理日志。
中断亲和
把非关键中断（USB、HDMI）绑定到非实时核，减少唤醒实时核。
提前唤醒
利用 EtherCAT Distributed Clock (DC) 中断前 50 μs 触发wake_up_idle()，保证帧处理不迟到。
参数 Git 化
将所有echo xxx > sysfs命令写入 shell 并纳入 Git，下次烧录一键恢复。
功耗-延迟二维图
用 Python matplotlib 绘制“频率 vs 功耗 vs 延迟”散点，找最优 knee 点。
认证衔接
低功耗参数需写进《安全手册》，审计时提供测试日志，证明“省电不损实时”。

八、总结：一张思维导图带走全部要点

飞腾实时 Linux 低功耗 ├─ 硬件：C-state + PSCI + 关闭 Turbo ├─ 内核：PREEMPT_RT + CPUIdle driver ├─ 策略：深休眠 + 提前唤醒 + PM QoS 锁频 ├─ 工具：turbostat | cyclictest | idle-inject └─ 认证：功耗报告→安全手册→审计证据

让“国产芯”不仅算得快，更要吃得少。
把本文脚本 push 到你的飞腾仓库，下次现场部署，10 行命令即可在 1 分钟内完成低功耗切换，用数据向客户证明：自主可控 + 绿色节能，我们全都要！