Linux 自旋锁

最新推荐文章于 2026-05-04 05:11:12 发布

原创最新推荐文章于 2026-05-04 05:11:12 发布 · 1k 阅读

25 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#java #前端 #数据库

linux 专栏收录该内容

33 篇文章

订阅专栏

在 Linux 内核的同步机制中，自旋锁是一个绕不开的“狠角色”。它不像互斥锁那样会让线程“休眠等待”，而是选择“死磕到底”——当线程拿不到锁时，会在原地循环重试，直到成功获取。这种“硬核”的特性，让它在特定场景下成为性能利器，但也藏着不少坑。今天，我们就来好好聊聊 Linux 自旋锁的那些事儿。

一、自旋锁为什么要“原地打转”？

要理解自旋锁，得先想明白一个问题：线程竞争资源时，“等待”的成本有多大？

互斥锁的思路是“惹不起就躲”：当线程获取不到锁时，会主动让出 CPU，进入休眠状态，直到锁被释放后再被唤醒。这个过程涉及到线程上下文切换（保存/恢复寄存器、调度器介入等），看似“懂事”，但如果锁被持有的时间极短（比如只有几十纳秒），上下文切换的成本（通常是微秒级）可能比“等一等”更高。

自旋锁的逻辑则截然相反：“反正你快就用完了，我就在这等着，不挪窝”。它通过一个原子操作（比如 test_and_set ）来检测锁的状态，若锁已被占用，就原地循环重试（“自旋”），直到锁被释放。这种方式省去了上下文切换的开销，在锁持有时间短、竞争不激烈的场景下，性能优势明显。

但请注意，自旋锁的“硬核”是有代价的：自旋期间，CPU 会被白白占用，无法做其他事。如果锁持有时间长，或者系统中线程数量远多于 CPU 核心数，大量线程自旋会导致 CPU 利用率飙升，反而拖慢整体性能。这也是自旋锁的核心适用原则：锁持有时间必须极短，且只能在可抢占场景受限的环境中使用（如内核态）。

二、Linux 自旋锁从简单到复杂的进化

Linux 自旋锁的实现并非一成不变，而是随着内核版本迭代不断优化，逐渐变得“智能”。

早期的自旋锁非常简单，本质上就是一个整数变量（通常是 0  表示未锁定， 1  表示锁定），配合原子操作实现：

- 加锁：通过 atomic_test_and_set  原子操作检查并设置锁状态，若成功则获取锁，否则循环重试。
- 解锁：通过 atomic_set  将锁状态重置为 0 。

但这种“裸奔”式的实现有个大问题：不支持抢占。如果持有自旋锁的线程被抢占，其他线程会一直自旋等待，导致死锁（持有锁的线程无法运行，锁永远无法释放）。

于是，现代 Linux 自旋锁引入了“抢占禁用”机制：当线程获取自旋锁时，内核会自动禁用当前 CPU 的抢占（ preempt_disable ），释放锁时再重新启用（ preempt_enable ）。这确保了持有锁的线程不会被其他线程抢占，避免了“占着锁睡觉”的尴尬。

此外，在 SMP（对称多处理器）系统中，自旋锁还会结合内存屏障（ mb() 、 rmb()  等）保证指令执行顺序，防止编译器或 CPU 乱序优化导致的同步问题；在单 CPU 系统中，自旋锁甚至会被优化为仅禁用抢占（因为此时不会有其他 CPU 上的线程竞争，自旋毫无意义）。

三、Linux 自旋锁的使用

Linux 内核提供了一套完整的自旋锁 API，核心操作如下：

#include <linux/spinlock.h>

spinlock_t my_lock;  // 定义自旋锁
spin_lock_init(&my_lock);  // 初始化

// 加锁：获取不到则自旋等待
spin_lock(&my_lock);

// 临界区：访问共享资源
...

// 解锁
spin_unlock(&my_lock);

看似简单，但使用时必须牢记以下“铁律”：

1. 临界区必须足够短
这是自旋锁的“生命线”。临界区里不能有任何可能导致阻塞的操作（如 sleep 、 msleep 、申请可能阻塞的内存分配 kmalloc(..., GFP_KERNEL)  等），否则会让其他线程长时间自旋，浪费 CPU。
2. 禁止递归加锁
自旋锁不支持递归（同一线程多次加锁会导致死锁）。因为第一次加锁后，线程已禁用抢占，再次加锁时会因锁已被自己持有而自旋，永远无法退出。
3. 区分中断上下文与进程上下文
如果临界区可能在中断处理函数中被访问，普通的 spin_lock  就不够用了。因为当线程持有锁时，若被中断打断，中断处理函数可能也会尝试获取该锁，导致死锁（线程在自旋等锁，中断在等线程释放锁，而线程被中断阻塞）。
此时需使用中断安全的自旋锁：
- spin_lock_irqsave(lock, flags) ：加锁时禁用本地中断，并保存中断状态。
- spin_unlock_irqrestore(lock, flags) ：解锁时恢复中断状态。
4. 避免在单 CPU 上滥用
单 CPU 系统中，自旋锁的“自旋”会退化为“忙等”（因为没有其他 CPU 释放锁），此时禁用抢占即可保证同步，自旋反而多余。内核会通过宏定义自动优化，单 CPU 下 spin_lock  本质上是 preempt_disable 。

四、实战：自旋锁在内核模块中的应用

#include <linux/init.h>
#include <linux/module.h>
#include <linux/spinlock.h>

static spinlock_t counter_lock;
static int shared_counter = 0;

// 模拟对共享资源的操作
static void increment_counter(void) {
    spin_lock(&counter_lock);  // 加锁
    shared_counter++;
    spin_unlock(&counter_lock);  // 解锁
}

static int __init spinlock_demo_init(void) {
    spin_lock_init(&counter_lock);  // 初始化锁
    
    // 模拟多线程（此处用内核线程简化）
    increment_counter();
    printk(KERN_INFO "Shared counter: %d\n", shared_counter);
    return 0;
}

static void __exit spinlock_demo_exit(void) {
    printk(KERN_INFO "Spinlock demo exit\n");
}

module_init(spinlock_demo_init);
module_exit(spinlock_demo_exit);
MODULE_LICENSE("GPL");

这个示例中， shared_counter 是被多线程共享的变量， increment_counter 函数通过自旋锁保证了 shared_counter++ 操作的原子性。实际开发中，若有多个内核线程同时调用 increment_counter ，自旋锁会确保每次只有一个线程修改计数器，避免数据竞争。

五、自旋锁 vs 互斥锁

最后，我们用一张表总结自旋锁与互斥锁（ mutex ）的核心区别，帮你快速决策：

特性	自旋锁（spinlock）	互斥锁（mutex）
等待方式	原地自旋（CPU 忙等）	线程休眠（释放 CPU）
适用场景	锁持有时间极短、竞争不激烈	锁持有时间较长、竞争可能激烈
上下文限制	可用于中断上下文/进程上下文	仅用于进程上下文（会休眠）
性能开销	自旋期间占用 CPU，无上下文切换	上下文切换开销大，但不浪费 CPU

简单来说：短锁用自旋，长锁用互斥。比如内核中操作硬件寄存器、更新简单数据结构（如链表头）时，自旋锁是首选；而涉及复杂逻辑（如文件操作、内存分配）时，互斥锁更合适。

写在最后

Linux 自旋锁就像一把“双刃剑”：用对了，它是提升性能的利器；用错了，就是系统的“性能杀手”。理解它的原理、特性和适用场景，是内核开发者的必备技能。

下次在代码中遇到同步问题时，不妨先问自己：“我的锁持有时间够短吗？”——这或许就是选择自旋锁的最佳判断标准。

（本文基于 Linux 5.x 内核版本，不同版本实现细节可能略有差异，实际开发中需参考对应版本的内核文档。）