引用计数器refcount_t(refcount.h)

2 Readme

3 引用计数器

3.1 设计目的

例如需要实现一个可以被多线程读写的设备(可以直接使用该章节中的设备假设:Linux驱动开发笔记 > ^qdfcky),那么则有如下基础设定:

  1. 用户态进程在尝试打开该文件后会得到一个文件描述符 fd
  2. 用户可以通过该 fd 执行对设备读写和关闭操作。
  3. 通常来说内核中的驱动需要维护一个结构体(设为 struct mdev_info )去存储与该 fd 相关的数据结构,用于完成后续的 readwrite 等操作。
  4. 用户调用 close 关闭设备之前,允许用户调用 readwrite 等操作。
  5. 用户在调用 close 完全关闭所有对该设备的打开后, f_op->release 会被执行。
  6. 当用户调用 close 关闭设备时,后续的 readwrite 等均会被拒绝,但是在调用 close 前的所有未完成的操作仍需要正常执行

那么考虑如下的场景:

8.9.4.1.1 场景一:正在处理read的过程中,close被调用并执行完毕

在内核中的驱动正在响应用户的操作请求过程中f_op->release 被调用,那么仍在处理的操作请求如何完成?

  1. 明显地,直接在 f_op->release 中释放 struct mdev_info 将无法保证正在执行的操作会被顺利完成,例如下方代码中,在完成 mdev_read 中的 do_operation1 后被下处理器,并完成 mdev_release 函数,随后 do_operation2 就会触发错误:
1
static ssize_t mdev_read(struct file *filep, char __user *buf, size_t count, loff_t *ppos)
2
{
3
// 1. 获取info数据结构
4
struct mdev_info *mdev_info_p = filep->private_data;
5

6
// 2. 执行操作1
7
do_operation1(mdev_info_p);
8

9
// 3. 执行操作2
10
do_operation2(mdev_info_p);
11

12
return ...;
13
}
14

15
static int mdev_release(struct inode *node, struct file *filep)
16
{
17
// [错误示范] 直接释放相关数据结构
18
// 1. 获取info数据结构
19
struct mdev_info *mdev_info_p = filep->private_data;
20

21
// 2. 回收数据结构
22
kfree(mdev_info_p);
23

24
return 0;
25
}
  1. 则此时可以考虑使用计数器的方式代替直接的 free 操作:
1
struct mdev_info {
2
// ...
3

4
// ref counter for mdev_info, used to complete incomplete requests.
5
atomic_t ref_counts;
6
};
7

8
/**
9
* @brief: add references to mdev_info.
10
*/
11
static void mdev_info_get(struct mdev_info *info)
12
{
13
atomic_inc(&info->ref_counts);
14
}
15

16
/**
17
* @brief: remove the reference to mpipe_info, andelease the memory space
18
* when the last reference is released.
19
*/
20
static void mdev_info_put(struct mdev_info *info)
21
{
22
if(atomic_dec_and_test(&info->ref_counts))
23
{
24
vfree(info);
25
}
26
}
27

28
static int mdev_open(struct inode *node, struct file *filep)
29
{
30
//...
31

32
// success.
33
// 增加对该结构体的引用计数
34
mdev_info_get(mdev_info);
35

36
return 0;
37
}
38

39
static ssize_t mdev_read(struct file *filep, char __user *buf, size_t count, loff_t *ppos)
40
{
41
// 1. 获取info数据结构
42
struct mdev_info *mdev_info_p = filep->private_data;
43

44
// 2. 增加引用计数器
45
mdev_info_get(mdev_info);
46

47
// 3. 执行操作1
48
do_operation1(mdev_info_p);
49

50
// 4. 执行操作2
51
do_operation2(mdev_info_p);
52

53
// 5. 解除引用奇数
54
mdev_info_put(mdev_info);
55

56
return ...;
57
}
58

59
static int mdev_release(struct inode *node, struct file *filep)
60
{
61
// [错误示范] 普通计数器
62
// 1. 获取info数据结构
63
struct mdev_info *mdev_info_p = filep->private_data;
64

65
// 2. 解除驱动对该info的引用计数
66
mdev_info_put(mdev_info_p);
67

68
return 0;
69
}
  1. 但是依旧有问题,例如:
    1. 用户发起read请求,并执行到 mdev_readstruct mdev_info *mdev_info_p = filep->private_data; 处被下处理器,此时引用计数器并未增加
    2. 随后内核处理用户的文件关闭请求,并完成 mdev_release 的执行。此时引用计数器被成功归0struct mdev_info 被成功释放
    3. mdev_read 继续执行此时计数器为-1且需要访问的 struct mdev_info 已被清空。错误发生。

针对这个问题,则可以考虑使用引用计数器管理 mdev_info 解决,详见相关API。

那么明显地,现在内核需要一个更靠谱的引用计数方式。而在事实上, refcount_t 本质也只是使用了一个原子变量,其定义如下:

/**
 * typedef refcount_t - variant of atomic_t specialized for reference counts
 * @refs: atomic_t counter field
 *
 * The counter saturates at REFCOUNT_SATURATED and will not move once
 * there. This avoids wrapping the counter and causing 'spurious'
 * use-after-free bugs.
 */
typedef struct refcount_struct {
	atomic_t refs;
} refcount_t;

3.2 操作流程及相关API

由于 refcount_t 只使用了一个原子变量,因此其操作的大致流程与原子变量几乎一致:

  1. 声明 refcount_t ,略。
  2. 定义 refcount_t ,使用 refcount_set 即可。
  3. 在非零时增加 refcount_t ,使用 refcount_inc_not_zero

3.2.1 设置引用次数refcount_set(refcount_t *r, int n)