当前位置：首页 > news >正文

嵌入式串口通信：中断驱动环形缓冲区设计与C语言实现

news 2026/6/8 13:43:09

1. 项目概述

在嵌入式开发里，串口通信（SCI/UART）是连接设备和外部世界的“嘴巴”和“耳朵”。但如果你直接让主程序（CPU）去伺候串口的每一个字节收发，那感觉就像让一个博士去当门卫，每次有人进出都得亲自开门关门，效率极低。硬件串口通常只有一个字节的缓冲区，发完一个字节，CPU就得干等着，直到硬件说“我好了，下一个”，这期间CPU啥也干不了，纯粹是浪费宝贵的计算资源。尤其是在处理像Modbus指令、GPS数据流或者调试信息输出这类多字节数据包时，这种阻塞式的等待会让整个系统的实时性大打折扣。

为了解决这个痛点，我们引入“软件缓冲区”的概念。你可以把它想象成快递柜：主程序（发件人）把要发送的数据包（快递）一股脑塞进柜子（发送缓冲区），然后就可以转身去忙别的事了；而串口中断服务程序（快递员）会定时来柜子里取件，逐个发出。接收过程则相反，快递员（接收中断）把收到的包裹放进柜子（接收缓冲区），主程序有空的时候再来取件处理。这样，CPU和串口硬件就实现了“解耦”，CPU的利用率大幅提升，系统的响应能力也更强。

本文将以经典的Freescale（现NXP）MC68331微控制器及其队列串行模块（QSM）中的SCI为例，手把手带你用纯C语言实现一套中断驱动的环形缓冲区（Circular Buffer/Ring Buffer）管理代码。这套方案的核心价值在于其通用性和可靠性：代码100%由C语言写成，便于移植到其他平台；通过精心设计的数据结构和原子操作，确保了在多任务或中断环境下读写缓冲区的数据一致性，避免了数据覆盖或丢失的经典难题。无论你是正在学习嵌入式实时系统的新手，还是需要优化现有串口驱动性能的老手，这套设计思路和代码细节都值得你仔细琢磨。

2. 核心设计思路与环形队列原理

2.1 为什么选择环形队列？

首先得明白，我们为什么不用一个简单的线性数组当缓冲区？假设我们开辟了一个160字节的数组buffer[160]，用两个索引write_index和read_index来指向写入和读取的位置。初始时，两者都为0。每写入一个字节，write_index加1；每读出一个字节，read_index加1。当read_index追上write_index时，缓冲区为空；当write_index到达数组末尾时，似乎就满了。

但这里有个问题：当write_index到达数组末尾（比如159）后，即使数组开头的位置（0）因为数据已被读取而空出来了，我们也无法再利用它，除非把整个缓冲区的内容往前挪动，这是一个O(n)的耗时操作，在中断服务程序里绝对不能干。这就造成了存储空间的浪费。

环形队列的精妙之处就在于它“首尾相连”。当指针到达数组末端时，不是停止，而是**回绕（Wrap Around）**到数组开头。这样，只要缓冲区未被完全填满，新的数据就可以持续写入，老的、已被读取的数据空间可以被循环利用。这就像一个圆形的跑道，读写指针可以无限循环地跑下去，极大地提高了存储空间的利用率。

2.2 数据结构设计：如何表示一个环形队列？

在C语言中，我们需要一个结构体来封装环形队列的所有状态信息。参考原始文档，其设计非常经典：

#define QSIZE 160 // 缓冲区大小，可根据实际内存和通信速率调整 typedef struct { word in; // 输入指针（写指针），指向下一个可写入的位置 word full; // 满标志，用于区分“空”和“满”的临界状态 word out; // 输出指针（读指针），指向下一个可读取的位置 byte q[QSIZE]; // 实际的字节数组缓冲区 } queue_struct;

in和out：这是两个索引，范围是0到QSIZE-1。它们标识了缓冲区中的位置。
full：这是一个关键标志。因为当in == out时，有两种可能：缓冲区全空，或者缓冲区全满。单靠两个指针无法区分这两种状态。full标志就是用来解决这个歧义的：当in == out且full == 0时，缓冲区为空；当in == out且full != 0时，缓冲区为满。
q[QSIZE]：这就是存储数据的“柜子”。

这个结构体定义了两个全局变量：rxbuff（接收缓冲区）和txbuff（发送缓冲区）。

2.3 状态判断：空、满、有数据

理解指针和标志位的组合所代表的状态，是正确操作缓冲区的基石。我们可以用下面这个逻辑表来清晰地判断：

条件 (`in`vs`out`)	`full`标志	缓冲区状态	可读？	可写？
`in != out`	无关 (Don‘t Care)	部分使用 (Partially Used)	是(有数据)	是(有空位)
`in == out`	0	空(Empty)	否	是
`in == out`	非0	满(Full)	是	否

核心判断逻辑：

是否有数据可读？(in != out) || full。只要两者不等（部分使用），或者两者相等但满标志为真（全满），就一定有数据。
是否有空位可写？(in != out) || !full。只要两者不等（部分使用），或者两者相等但满标志为假（全空），就一定有空间。

这个逻辑是整个中断驱动缓冲区得以正确运行的灵魂，后续的所有读、写函数都建立在这两个条件判断之上。

3. 关键函数实现与原子操作解析

有了清晰的数据结构和状态逻辑，我们来看具体的函数实现。这里面的每一个细节都蕴含着嵌入式编程的实战经验。

3.1 初始化函数`qinit`

任何缓冲区在使用前都必须初始化到一个已知的确定状态，通常是空状态。

void qinit (queue_struct *qvar) { qvar->in = 0x0002; // 为什么是2？历史或对齐原因，通常设为0即可。 qvar->full = 0x0000; // 满标志清零，表示空 qvar->out = 0x0002; // 读写指针置为相同值 }

注意：原代码中将in和out初始化为0x0002而非0，这可能与特定编译器或内存对齐要求有关。在大多数情况下，初始化为0是完全正确且更直观的。如果你移植代码，可以安全地改为0。关键点是让in == out且full == 0。

3.2 状态查询函数`qstat`

这个函数返回缓冲区中当前有效数据的字节数。它在主程序中非常有用，比如你可以等接收缓冲区积累了足够多的数据（例如半满）再一次性处理，提高效率。

word qstat (queue_struct *qvar) { word qin, qfull, qout; qin = qvar->in; qfull = qvar->full; qout = qvar->out; if (qin > qout) { // 写指针在读指针之后，没有发生回绕。数据量就是差值。 return (qin - qout); } if (qin < qout) { // 写指针在读指针之前，说明发生了回绕。 // 数据量 = (缓冲区总大小 - 读指针) + 写指针 return (QSIZE - qout + qin); } // qin == qout if (qfull) { // 指针相等且满标志为真，缓冲区全满。 return (QSIZE); } // 指针相等且满标志为假，缓冲区全空。 return (0); }

这个函数的实现巧妙地处理了环形回绕的情况，是计算环形缓冲区使用量的标准方法。

3.3 数据读取函数`rx_byte`

这是主程序从接收缓冲区取数据的接口。它采用非阻塞设计：有数据就取走并返回成功，没数据就立即返回失败，不会让主程序傻等。

char rx_byte(byte *rxbyte) { lword rxq_full_out; // 用于原子操作的临时长整型变量 word rxin, rxfull, rxout; // 1. 快照：将缓冲区的状态变量复制到局部变量。 rxin = rxbuff.in; rxfull = rxbuff.full; rxout = rxbuff.out; // 2. 判断是否有数据可读 if ((rxin != rxout) || rxfull) { // 3. 读取数据 *rxbyte = rxbuff.q[rxout]; // 4. 更新读指针，处理回绕 rxout++; if (rxout > (QSIZE-1)) rxout = 0; // 5. 【关键】原子更新：将新的rxout和清零的full标志一起写入 rxq_full_out = (lword)rxout; *(lword *)(&rxbuff.full) = rxq_full_out; return 1; // 读取成功 } else { return 0; // 缓冲区空，读取失败 } }

为什么需要“原子更新”？这是嵌入式并发编程中的核心挑战。注意第5步，我们需要同时做两件事：更新out指针，并将full标志清零（因为读走一个数据后，缓冲区肯定不是满的了）。想象一下，如果这两步不是原子的（不可分割的）：

中断发生，sciint函数正在向缓冲区写入数据。
rx_byte刚执行完rxout++，但还没来得及把full清零。
此时，in指针可能等于新的out指针，而full标志还是旧的“1”。
对于中断程序来说，它看到的状态是(in == out) && (full != 0)，它会误判为“缓冲区满”，从而可能丢弃新收到的数据，造成数据丢失。

原代码利用CPU32架构支持32位长字（lword）访问的特性，将两个16位的变量（full和out）在内存中连续存放，然后通过一个32位的写操作*(lword *)(&rxbuff.full) = rxq_full_out;一次性完成更新。这行C代码会被编译成一条MOVE.L指令，在总线操作上是不可中断的，从而保证了状态变更的完整性。

3.4 数据写入函数`tx_byte`

这是主程序向发送缓冲区存数据的接口。同样是非阻塞设计。

char tx_byte(byte txbyte) { word txin, txfull, txout; lword txq_in_full; txin = txbuff.in; txfull = txbuff.full; txout = txbuff.out; if ((txin != txout) || !txfull) { // 判断缓冲区是否非满 // 写入数据 txbuff.q[txin] = txbyte; txin++; if (txin > (QSIZE-1)) txin = 0; if (txin == txout) { // 写入后，写指针追上了读指针，缓冲区变满。 // 需要原子操作：更新in指针，并设置full标志。 txq_in_full = (((lword)txout) << 16) | 1; *(lword *)(&txbuff.in) = txq_in_full; } else { // 缓冲区还没满，只更新in指针即可。 txbuff.in = txin; } // 确保发送中断是开启的 QSM_SCCR1 = 0x00ac; // 设置TIE位 return 1; } else { return 0; // 缓冲区满，写入失败 } }

这里的逻辑与rx_byte对称。原子操作发生在缓冲区恰好被填满的时刻，需要同时设置in指针和full标志。另一个重要操作是QSM_SCCR1 = 0x00ac;，它确保了发送数据寄存器空中断（TDRE）是使能的。因为当中断服务程序发送完缓冲区最后一个字节后，会关闭此中断以节省功耗。tx_byte在放入新数据后，必须重新打开中断，告诉硬件：“有活干了！”

3.5 中断服务程序`sciint`

这是整个系统的引擎，由SCI硬件中断触发。它需要高效地处理三种中断源：接收完成（RDRF）、发送寄存器空（TDRE）、接收溢出（OR）。

#pragma TRAP_PROC // 编译器指令，声明此为异常处理函数 void sciint() { word status, qin, qfull, qout; word scidata; lword q_long; status = QSM_SCSR; // 读取SCI状态寄存器，判断中断源 if (status & 0x0040) { // RDRF: 收到新字节 scidata = QSM_SCDR; // 读取数据，同时清除RDRF标志 if (status & 0x0008) { // 同时发生了溢出(OR) // 溢出处理：通常意味着主程序处理太慢，数据被覆盖。 // 原代码在此处没有恢复动作，实际项目中可能需要记录错误或复位缓冲区。 } else { // 正常接收 qin = rxbuff.in; qfull = rxbuff.full; qout = rxbuff.out; if ((qin != qout) || !qfull) { // 接收缓冲区有空间吗？ rxbuff.q[qin] = (byte)scidata; qin++; if (qin > (QSIZE-1)) qin = 0; if (qin == qout) { // 缓冲区将满，原子操作设置满标志 q_long = (((lword)qout) << 16) | 1; *(lword *)(&rxbuff.in) = q_long; } else { rxbuff.in = qin; } } else { // 缓冲区已满，发生“软件溢出”，数据被迫丢弃。 // 此处应添加错误处理，例如点亮错误LED或增加计数器。 } } } else if (status & 0x0008) { // 独立的OR中断（无RDRF） // 这种情况罕见，发生在读取状态寄存器后、读数据寄存器前发生溢出。 scidata = QSM_SCDR; // 读数据以清除OR标志 // 同样需要错误处理 } else if (status & 0x0100) { // TDRE: 发送寄存器空，可以发送下一个字节 qin = txbuff.in; qfull = txbuff.full; qout = txbuff.out; if ((qin != qout) || qfull) { // 发送缓冲区有数据吗？ scidata = txbuff.q[qout]; qout++; if (qout > (QSIZE-1)) qout = 0; q_long = (lword)qout; *(lword *)(&txbuff.full) = q_long; // 原子操作：更新out，清除full QSM_SCDR = scidata; // 将数据写入SCI数据寄存器，启动发送 } else { // 发送缓冲区已空，禁用发送中断，避免无意义的中断占用CPU QSM_SCCR1 = 0x002c; // 清除TIE位 } } else { // 未知的中断源，可能是错误，最稳妥的方式是重新初始化SCI sciinit(); } }

重要提示：中断服务程序（ISR）的第一要务是快。因此，代码中大量使用了局部变量来缓存全局缓冲区的状态（qin,qfull,qout），避免多次直接访问可能被主程序修改的全局变量。同时，if-else if的结构确保了每次中断只处理一个事件源，防止在复杂中断情况下逻辑混乱。

4. 数据一致性与并发访问的深层考量

在中断驱动系统中，主程序（后台循环）和中断服务程序（前台）会并发访问共享资源——即我们的rxbuff和txbuff。如果不加控制，就会产生竞态条件（Race Condition），导致数据错乱。我们这套方案的精髓就在于通过软件设计，而非硬件锁（如关中断），来安全地实现并发访问。

4.1 访问规则与安全性分析

原文档中的表2（Data Access Types by Function）清晰地定义了各函数对缓冲区变量的访问类型（读、写、读后递增等）。其核心设计原则是：

单向数据流，单写者原则：对于每个缓冲区，写入操作只由一个实体完成。
- 接收缓冲区rxbuff：只由sciint()（响应RDRF中断）写入。
- 发送缓冲区txbuff：只由tx_byte()（主程序调用）写入。
读取操作也遵循类似原则，但允许中断。
- rxbuff由rx_byte()读取。
- txbuff由sciint()（响应TDRE中断）读取。

这个设计带来了一个巨大的好处：对于同一个缓冲区的“读”和“写”操作可以相互中断，而不会破坏数据一致性。为什么？

让我们以接收缓冲区为例，考虑最复杂的场景：sciint()正在写入一个新字节（更新in指针），此时被rx_byte()中断去读取一个字节（更新out指针）。由于它们修改的是不同的变量（invsout和full），并且各自的更新逻辑是原子的，因此无论谁先谁后，最终缓冲区都能保持逻辑一致的状态。不会出现一个函数读到另一个函数“修改到一半”的中间状态。

4.2 需要避免的并发场景

虽然读/写可以安全地相互中断，但同类型的操作相互中断则可能有问题。例如：

两个rx_byte()调用（可能来自不同的任务或中断层级）同时执行。
两个sciint()的RDRF处理流程（几乎不可能，因为SCI硬件不会同时产生两个接收中断）同时修改rxbuff。

原文档指出，如果应用场景中存在这种可能，就需要引入额外的信号量（Semaphore）或锁机制来保护。但在大多数简单的前后台系统中，主程序是单线程的，中断是嵌套的，因此tx_byte和rx_byte不会被自身中断，这就天然避免了问题。这也是此代码简洁高效的前提。

4.3 原子操作的硬件依赖性与移植性

代码中使用了*(lword *)(&rxbuff.full) = rxq_full_out;这样的技巧来实现32位原子写。这高度依赖于CPU架构和内存对齐：

CPU32/M68K：支持对32位对齐地址的原子长字访问。
ARM Cortex-M：通常也支持对32位对齐地址的原子存储（STR指令）。
8位单片机（如AVR、8051）：通常没有保证32位操作原子性的指令，需要采用关中断/开中断的方式来保护临界区。

移植建议：如果你要将此代码移植到其他平台，必须检查目标平台的原子操作支持。如果不支持，最通用的方法是使用关中断来保护临界区：

// 伪代码，以接收为例 char rx_byte(byte *rxbyte) { word rxin, rxfull, rxout; char retval = 0; DISABLE_INTERRUPTS(); // 关中断 rxin = rxbuff.in; rxfull = rxbuff.full; rxout = rxbuff.out; if ((rxin != rxout) || rxfull) { *rxbyte = rxbuff.q[rxout]; rxout++; if (rxout > (QSIZE-1)) rxout = 0; rxbuff.out = rxout; rxbuff.full = 0; // 非原子，但在关中断保护下安全 retval = 1; } ENABLE_INTERRUPTS(); // 开中断 return retval; }

关中断虽然简单可靠，但会增加中断延迟，在高速通信或实时性要求高的场合需要谨慎评估关中断的时间。

5. 实战配置、调试与性能优化

5.1 初始化流程与硬件配置

一个完整的SCI带缓冲区的驱动，其初始化流程如下：

#include “your_device_qsm.h” // 替换为你的设备头文件 queue_struct rxbuff, txbuff; // 全局缓冲区 void main(void) { // 1. 初始化缓冲区 qinit(&rxbuff); qinit(&txbuff); // 2. 设置中断向量（依赖具体编译器/IDE） // 例如，将 sciint 函数地址填入SCI中断向量表 // SET_VECTOR(SCI_VECTOR, sciint); // 3. 初始化SCI硬件（波特率、数据位、停止位等） sciinit(); // 这个函数需要根据你的芯片手册编写 // 4. 全局使能中断 asm(“MOVE.W #$2500,SR”); // CPU32特定指令，使能中断优先级6级及以下 // 对于其他平台，可能是 __enable_irq(); 或类似函数 // 5. 主循环 while(1) { // 示例：当接收缓冲区数据过半时，读取并回传（echo） if (qstat(&rxbuff) > (QSIZE/2)) { byte ch; while (rx_byte(&ch)) { // 读空接收缓冲区 while (!tx_byte(ch)); // 写入发送缓冲区，直到成功 } } // ... 执行其他任务 } }

sciinit()函数需要根据你的微控制器数据手册来编写。核心是配置波特率发生器、数据格式，以及使能接收中断（RIE）。注意，发送中断（TIE）初始时是关闭的，直到tx_byte放入第一个数据后才打开。

5.2 缓冲区大小（QSIZE）的选择

缓冲区大小没有固定答案，需要权衡：

内存占用：缓冲区越大，占用RAM越多。
实时性：缓冲区是数据管道，会引入延迟。缓冲区越大，数据从写入到被处理/发送的最坏情况延迟越长。
数据突发处理能力：缓冲区需要能吸收数据流的峰值。例如，如果主程序每100ms处理一次串口数据，而串口以115200波特率（约11.5KB/s）持续接收，那么100ms内可能收到约1150字节。你的缓冲区至少要比这个大，否则会溢出。

经验公式：QSIZE > (最大预期中断阻塞时间 * 波特率字节速度) * 安全系数(1.5~2)例如，系统最坏情况下可能关中断10ms，波特率9600（约960字节/秒），则10ms内最多收到9.6字节。考虑安全系数，选择QSIZE=32或64通常足够。对于高速通信或复杂系统，可能需要256或512字节。

5.3 常见问题与调试技巧

数据丢失（溢出）：
- 症状：发送的数据对方收不全，或接收的数据中间有丢失。
- 排查：
  - 检查tx_byte或sciint接收部分的返回值/错误处理。如果频繁返回0或进入溢出分支，说明缓冲区太小或主程序处理太慢。
  - 在sciint的溢出处理分支添加调试代码，如翻转一个GPIO引脚，用示波器或逻辑分析仪观察溢出频率。
  - 增大QSIZE。
  - 优化主程序，提高处理数据的速度，或使用更高效的算法。
系统卡死或无响应：
- 症状：程序运行一段时间后死机。
- 排查：
  - 中断风暴：检查SCI配置是否正确，特别是波特率。波特率不匹配会导致持续产生帧错误，可能引发大量中断。
  - 中断服务程序过长：确保sciint执行时间尽可能短。避免在ISR内进行浮点运算、复杂字符串处理或调用可能阻塞的函数。
  - 栈溢出：中断嵌套或ISR内局部变量过多可能导致栈溢出。检查链接脚本中的栈空间分配是否充足。
数据错乱：
- 症状：收到的数据内容不对，或顺序错乱。
- 排查：
  - 原子操作失效：在移植到新平台时，确认你的“原子操作”是否真的原子。使用调试器单步跟踪，观察在指针更新过程中是否可能被中断。
  - volatile关键字缺失：所有被ISR和主程序共享的全局变量（rxbuff,txbuff）必须用volatile关键字声明，防止编译器进行错误的优化（如将变量值缓存到寄存器）。
```
volatile queue_struct rxbuff, txbuff;
```
  - 内存对齐：确保queue_struct结构体在内存中自然对齐（通常是4字节对齐），特别是full和out这两个被一起进行32位访问的变量。编译器指令如__attribute__((packed))可能会破坏对齐，导致原子操作失败。

5.4 性能优化进阶思路

使用DMA：对于更高速度的串口（如数兆波特率），中断开销本身可能成为瓶颈。现代MCU通常提供串口DMA功能，可以直接将接收到的数据块搬运到指定的内存区域（你的环形缓冲区），或从缓冲区搬运数据到发送寄存器，完全解放CPU。此时，中断仅用于通知DMA传输完成，频率大大降低。
双缓冲区（Ping-Pong Buffer）：对于需要处理连续数据流的应用，可以设计两个缓冲区。当主程序处理缓冲区A的数据时，中断向缓冲区B填充数据；当B满时，切换角色。这可以避免在处理数据时发生缓冲区溢出。
无锁队列的进一步优化：本文的环形队列是一种经典的无锁（对读/写而言）设计。在更复杂的多核或RTOS多任务环境中，可以考虑使用更高级的无锁队列算法，但实现复杂度也会显著增加。对于大多数嵌入式串口应用，本文的方案在性能和复杂性之间取得了最佳平衡。

这套基于中断和环形队列的SCI缓冲区实现，是嵌入式串口通信的基石技术之一。它完美诠释了如何通过软件设计来弥补硬件资源的不足，提升系统整体性能。理解其每一行代码背后的设计意图和并发安全考量，对你掌握嵌入式实时编程的精髓大有裨益。在实际项目中，你可以以此为基础，根据具体芯片和需求进行裁剪和增强，例如添加超时机制、支持9位数据、集成到RTOS的消息队列中等。

查看全文

http://www.gsyq.cn/news/1486596.html