数组形式

支持SMP的现代操作系统使用每个cpu上的数据,对于给定的处理器其数据是唯一的;一般来说,每个cpu的数据存放在一个数组中,数组总的每一项对应着系统上的一个存在的处理器;按当前处理器号确定这个数组的当前元素;使用方式如下:

1 unsigned long my_percpu[NR_CPUS];
2 
3 int cpu;
4 
5 cpu = get_cpu(); /* 获取当前处理器,并禁止抢占 */
6 my_percpu[cpu]++; /* 对变量做处理 */
7 put_cpu(); /* 激活内核抢占 */

上面代码并没有出现锁,这是因为所操作的数据对当前处理器来说是唯一的;除了当前处理器之外,没有其他处理器可接触到这个数据,不存在并发访问的问题,所以当前处理器可以再不用锁的情况下安全访问它;

现在,内核抢占成了唯一需要关注的问题了,内核抢占会引起下面的两个问题:

1. 如果代码被其他处理器抢占并重新调度,那么这时cpu变量就会无效,因为它指向的是错误的处理器;(通常,代码获得当前处理器后是不可以睡眠的);

2. 如果另一个任务抢占了代码,那么有可能在同一处理器上发生并发访问my_percpu的情况,显然属于一个竞态;

上述代码中在调用get_put()时,禁止了内核抢占;相对的调用put_cpu()时又会重新激活当前处理器号;

新的接口

2.6内核开始为了方便创建和操作每个cpu数据,而引进了新的操作接口,称为percpu,该接口归纳了前面所述的操作行为,简化了创建和操作每个cpu的数据;

但前面说的创建和访问每个cpu的方法仍然有效,不过大型对称多处理器计算机要求对每个cpu数据操作更简单,功能更强大,所以新接口应运而生;

编译时的每个cpu数据

编译期间定义每个cpu变量:

1 DEFINE_PER_CPU(type,name)

这个语句为系统中每个cpu都创建了一个类型为type,名称为name的变量实例,如果需要在别处声明变量,则应该使用下面的宏:

 
1 DECLARE_PER_CPU(type,name)

可以利用get_cpu_var()和put_cpu_var()函数来操作变量;

1 get_cpu_var(name)++; /*禁止抢占,操作cpu变量*/
2 put_cpu_var(name); /*完成,重新激活内核抢占*/

还可以通过per_cpu(name, cpu)获取别的处理器上的每个cpu数据:

1 per_cpu(name, cpu)++;/* 增加指定处理器上的数据值 */

注意:per_cpu()函数既不会禁止内核抢占,也不会提供任何形式的锁保护;如果一个处理器可以接触到其他处理器上的数据,那就必须给数据上锁;

运行时的每个cpu数据

1 #define alloc_percpu(type)                        \
2     (typeof(type) __percpu *)__alloc_percpu(sizeof(type),        \
3                         __alignof__(type))
4 
5 void __percpu *__alloc_percpu(size_t size, size_t align)
6 
7 void free_percpu(void __percpu *__pdata)

alloc_percpu()给系统中每个处理器分配一个指定类型对象的实例,它是__alloc_percpu的一个封装,原始函数接收两个参数:一个是要分配的实际字节数,一个是分配时要按多少字节对齐;而封装后的alloc_percpu()是按照字节对齐–按照给定的类型的自然边界对齐;

free_percpu()将释放所有处理器上指定的每个cpu数据;

alloc_percpu()或者是__alloc_percpu()会返回一个指针,它用来间接引用动态创建的每个cpu数据,内核提供了两个宏利用指针来获取每个cpu数据:

 1 /*
 2  * Must be an lvalue. Since @var must be a simple identifier,
 3  * we force a syntax error here if it isn't.
 4  */
 5 #define get_cpu_var(var)                        \
 6 (*({                                    \
 7     preempt_disable();                        \
 8     this_cpu_ptr(&var);                        \
 9 }))
10 
11 /*
12  * The weird & is necessary because sparse considers (void)(var) to be
13  * a direct dereference of percpu variable (var).
14  */
15 #define put_cpu_var(var)                        \
16 do {                                    \
17     (void)&(var);                            \
18     preempt_enable();                        \
19 } while (0)

get_cpu_var()返回一个指向当前处理器数据的特殊实例,它同时会禁止内核抢占;而在put_cpu_var()中会重新激活内核抢占;

每个cpu数据好处

1. 减少了数据锁定;每个处理器访问每个处理器的数据,可以不需要任何锁;

2. 大大减少了缓存失败;percpu接口缓存对齐所有数据,以便确保在访问一个处理器的数据时,不会将林我国一个处理器的数据带入同一个缓存线上;

注意:不能再访问每个cpu数据过程中睡眠,否则,醒来之后可能已经到达其他处理器上了;

 

相关文章:

  • 2021-10-19
  • 2022-03-11
  • 2021-06-10
  • 2021-07-02
  • 2022-02-02
  • 2022-01-10
  • 2021-11-20
  • 2022-03-06
猜你喜欢
  • 2022-12-23
  • 2021-07-05
  • 2021-09-26
  • 2021-06-25
  • 2021-07-16
  • 2021-07-26
  • 2021-12-22
相关资源
相似解决方案