Verilog三段式状态机实战：从原理到代码实现（附完整示例）-平芜编程栈

Verilog三段式状态机实战：从原理到代码实现（附完整示例）

第一次接触状态机时，我盯着那些跳来跳去的状态转换箭头完全摸不着头脑。直到在FPGA项目里被迫用Verilog实现一个串口协议解析器，才真正理解三段式状态机的精妙之处——它把复杂的时序逻辑拆解成清晰的三部分，就像把一团乱麻整理成三捆整齐的线缆。本文将带你从零开始，用工程师的视角而非教科书的理论，掌握这种既规范又实用的状态机写法。

1. 状态机基础：为什么需要三段式？

任何接触过数字电路设计的人都知道，状态机是描述系统行为的核心工具。但为什么专业工程师都推崇三段式写法？这得从实际工程中的痛点说起。

去年我参与的一个工业控制器项目里，同事用一段式状态机实现了复杂的工艺流程控制。调试时发现某个状态输出异常，但要在300多行的always块里定位问题简直是大海捞针。而改用三段式后，相同功能的代码不仅调试方便，综合后的时序性能还提升了15%。

1.1 三种状态机写法对比

让我们用实际的代码片段来感受区别：

一段式状态机示例：

always @(posedge clk) begin if(!rst_n) begin state <= IDLE; output1 <= 0; end else begin case(state) IDLE: begin output1 <= 0; if(start) state <= WORK; end WORK: begin output1 <= input1 & input2; if(done) state <= IDLE; end endcase end end

三段式状态机示例：

// 状态寄存器 always @(posedge clk or negedge rst_n) if(!rst_n) current_state <= IDLE; else current_state <= next_state; // 状态转移逻辑 always @(*) begin case(current_state) IDLE: next_state = start ? WORK : IDLE; WORK: next_state = done ? IDLE : WORK; endcase end // 输出逻辑 always @(*) begin case(current_state) IDLE: output1 = 0; WORK: output1 = input1 & input2; endcase end

对比可见，三段式将时序逻辑、状态转移和输出逻辑明确分离。这种分离带来三个关键优势：

调试友好：当输出异常时，直接检查输出逻辑always块；状态转移问题则专注第二个always块
时序优化：综合工具可以针对不同always块采用不同优化策略
代码复用：相同的状态转移逻辑可以搭配不同的输出逻辑

1.2 Moore与Mealy状态机

在深入三段式之前，需要明确两种基本状态机类型：

特性	Moore状态机	Mealy状态机
输出决定因素	仅与当前状态有关	与当前状态和输入都有关
输出时序	同步于时钟边沿	可能产生异步输出
代码实现	输出逻辑只引用state	输出逻辑引用state和输入

三段式对两种状态机都适用，但在输出逻辑always块的处理上略有不同。本文示例将聚焦更常见的Moore型状态机。

2. 三段式状态机设计方法论

设计一个健壮的状态机需要系统化的思考流程。下面是我在多个FPGA项目中总结的7步设计法。

2.1 状态机设计七步流程

明确需求：列出所有输入/输出信号及其有效电平和时序要求
绘制状态图：用图形化工具(如Visio)画出完整状态转换关系
状态编码：选择二进制、格雷码或独热码等编码方式
定义参数：用parameter声明各状态对应的编码值
信号声明：确定current_state和next_state的位宽和类型
编写三段逻辑：按顺序实现状态寄存器、转移逻辑和输出逻辑
仿真验证：编写testbench验证所有状态转换路径

2.2 状态编码策略选择

编码方式直接影响时序性能和资源利用率。以下是常用编码方式的对比：

// 二进制编码（节省触发器，但可能产生毛刺） parameter IDLE = 2'b00; parameter START = 2'b01; parameter WORK = 2'b10; parameter DONE = 2'b11; // 独热码（占用更多触发器，但转移逻辑简单） parameter IDLE = 4'b0001; parameter START = 4'b0010; parameter WORK = 4'b0100; parameter DONE = 4'b1000;

对于FPGA设计，当状态数少于5个时，二进制编码通常更高效；状态数较多时，独热码能获得更好的时序性能。Xilinx的FPGA架构文档中明确建议，在7系列及以上器件中，状态数超过8个时应优先考虑独热码。

3. 完整示例：UART接收状态机

让我们通过一个实际的UART(通用异步收发器)接收器案例，演示三段式状态机的完整实现。这个设计要完成9600bps的串行数据接收，包含起始位检测、数据位采样和停止位验证。

3.1 模块定义与状态规划

module uart_rx_fsm( output reg [7:0] rx_data, output reg data_valid, input clk, input rst_n, input rx_pin ); // 状态定义 - 使用独热码 parameter IDLE = 4'b0001; parameter START_BIT = 4'b0010; parameter DATA_BITS = 4'b0100; parameter STOP_BIT = 4'b1000; // 内部信号 reg [3:0] current_state, next_state; reg [3:0] bit_counter; reg [15:0] baud_counter;

注意：这里baud_counter的位宽根据系统时钟频率计算。例如50MHz时钟时，9600bps需要计数到5208(50e6/9600)，因此需要13位计数器。

3.2 状态寄存器实现

第一个always块实现最简单的时序逻辑：

always @(posedge clk or negedge rst_n) begin if(!rst_n) begin current_state <= IDLE; baud_counter <= 0; bit_counter <= 0; end else begin current_state <= next_state; // 波特率计数器 if(current_state != next_state) baud_counter <= 0; else if(baud_counter < 5208) baud_counter <= baud_counter + 1; // 数据位计数器 if(current_state == DATA_BITS && baud_counter == 2604) bit_counter <= bit_counter + 1; else if(current_state != DATA_BITS) bit_counter <= 0; end end

3.3 状态转移逻辑

第二个always块包含整个状态机的核心决策逻辑：

always @(*) begin case(current_state) IDLE: begin if(!rx_pin) // 检测到起始位 next_state = START_BIT; else next_state = IDLE; end START_BIT: begin if(baud_counter == 2604) // 起始位中点采样 next_state = rx_pin ? IDLE : DATA_BITS; else next_state = START_BIT; end DATA_BITS: begin if(bit_counter == 8 && baud_counter == 2604) next_state = STOP_BIT; else next_state = DATA_BITS; end STOP_BIT: begin if(baud_counter == 5208) next_state = IDLE; else next_state = STOP_BIT; end default: next_state = IDLE; endcase end

3.4 输出逻辑实现

第三个always块处理数据采样和有效信号生成：

always @(posedge clk or negedge rst_n) begin if(!rst_n) begin rx_data <= 8'h00; data_valid <= 1'b0; end else begin data_valid <= 1'b0; if(current_state == DATA_BITS && baud_counter == 2604) begin case(bit_counter) 0: rx_data[0] <= rx_pin; 1: rx_data[1] <= rx_pin; // ... 2-6省略 7: rx_data[7] <= rx_pin; endcase end if(current_state == STOP_BIT && baud_counter == 5208 && rx_pin) data_valid <= 1'b1; end end

提示：输出逻辑也可以写成组合逻辑方式(always @(*))，但时序逻辑输出能避免毛刺，在实际项目中更可靠。

4. 高级技巧与常见陷阱

经过十几个FPGA项目的锤炼，我总结出这些让状态机更健壮的经验法则。

4.1 状态机验证checklist

在 tapeout 前，请确保已完成以下验证：

[ ] 所有状态都能在仿真中覆盖到
[ ] 每个状态转移条件都经过测试
[ ] 添加了default分支处理非法状态
[ ] 输出在非法状态下处于安全值
[ ] 复位后能正确回到初始状态
[ ] 状态编码没有使用工具保留值

4.2 跨时钟域处理

当状态机需要响应异步信号时，必须进行同步处理：

// 异步信号同步化 reg async_signal_sync1, async_signal_sync2; always @(posedge clk or negedge rst_n) begin if(!rst_n) begin async_signal_sync1 <= 1'b0; async_signal_sync2 <= 1'b0; end else begin async_signal_sync1 <= async_signal; async_signal_sync2 <= async_signal_sync1; end end // 在状态转移逻辑中使用同步后的信号 always @(*) begin case(current_state) WAIT_SIGNAL: next_state = async_signal_sync2 ? RESPOND : WAIT_SIGNAL; // ... endcase end

4.3 状态机与流水线协同

在高速数据处理系统中，状态机常需要与流水线配合：

// 流水线寄存器 reg [7:0] stage1, stage2; always @(posedge clk) begin case(current_state) PROCESS: begin stage1 <= raw_data * 2; // 第一阶段处理 stage2 <= stage1 + 5; // 第二阶段处理 output_data <= stage2; // 最终输出 end // ... endcase end

这种结构在图像处理、数据包解析等场景特别常见，能同时兼顾状态控制的灵活性和流水线的高吞吐量。