http://www.cnblogs.com/edwardlost/archive/2010/10/25/1859152.html
http://www.cnblogs.com/edwardlost/archive/2010/10/23/1858991.html
今天仔细看了asio的性能测试项目:Linux Performance Improvements,自己也动手实践了一下,不过测试的不是asio本身不同实现机制的性能(这个比较麻烦,需要下载多个asio的实现版本),只是简单测试了一下asio example中四个不同io_service模型的HTTP Server的性能,看看谁是牛b。
测试环境
linux服务器,CPU有4个processor,详细配置为:
Linux 2.6.9-67.ELsmp #1 SMP Wed Nov 7 13:58:04 EST 2007 i686 i686 i386 GNU/Linux Intel(R) Xeon(R) CPU E5430 @2.66GHz
HTTP Server io_service模型
server 1:a simple single-threaded server. 单线程,单io_service
server 2:io_service-per-CPU design. 多线程,多io_service,每个线程处理一个io_service,采用轮询方式选择io_service (one loop per thread)
server 3:a single io_service and a thread pool. 多线程,单io_service,所有线程都运行在同一个io_service上
server 4:a single-threaded HTTP server implemented using stackless coroutines
测试方法
分别将server运行在1、2、3、4个CPUs(即processors)
taskset -c 1 ./server 127.0.0.1 55555 /home/zhongying
taskset -c 1,2 ./server 127.0.0.1 55555 /home/zhongying
taskset -c 1,2,3 ./server 127.0.0.1 55555 /home/zhongying
taskset -c 0,1,2,3 ./server 127.0.0.1 55555 /home/zhongying
在同一台服务器上运行ab进行测试,并发100连接,请求4K的数据
taskset -c 0 ab -c 100 -n 100000 \'http://127.0.0.1:55555/test.txt\'
测试结果
从测试结果可以看多线程的server2和server3的性能差别不大,server2略微胜出,个人觉得servers3使用strand机制来防止多个线程同时执行一个连接的handler会产生一些开销,可能会稍微影响性能。
=========
http://www.cnblogs.com/my_life/articles/4487719.html
我的Linode十分繁忙,在跑一些密集操作数据库的Rake任务时尤其如此。但我观察发现,Linode服务器的4核CPU,只有第1个核心(CPU#0)非常忙,其他都处于idle状态(证明调度不均)。
不了解Linux是如何调度的,但目前显然有优化的余地。除了处理正常任务,CPU#0还需要处理每秒网卡中断。因此,若能将CPU#0分担的任务摊派到其他CPU核心上,可以预见,系统的处理能力将有更大的提升。
两个名词
SMP (Symmetrical Multi-Processing):指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。 [更多...]
CPU affinity:中文唤作“CPU亲和力”,是指在CMP架构下,能够将一个或多个进程绑定到一个或多个处理器上运行。[更多...]
一、在Linux上修改进程的“CPU亲和力”
在Linux上,可以通过 taskset 命令进行修改。以Ubuntu为例,运行如下命令可以安装taskset工具。
# apt-get install schedutils
对运行中的进程,文档上说可以用下面的命令,把CPU#1 #2 #3分配给PID为2345的进程:
# taskset -cp 1,2,3 2345
但我尝试没奏效,于是我关掉了MySQL,并用taskset将它启动:
# taskset -c 1,2,3 /etc/init.d/mysql start
对于其他进程,也可如此处理(nginx除外,详见下文)。之后用top查看CPU的使用情况,原来空闲的#1 #2 #3,已经在辛勤工作了。
二、配置nginx绑定CPU
刚才说nginx除外,是因为nginx提供了更精确的控制。
在conf/nginx.conf中,有如下一行:
worker_processes 1;
这是用来配置nginx启动几个工作进程的,默认为1。而nginx还支持一个名为worker_cpu_affinity的配置项,也就是说,nginx可以为每个工作进程绑定CPU。我做了如下配置:
worker_processes 3;
worker_cpu_affinity 0010 0100 1000;
这里0010 0100 1000是掩码,分别代表第2、3、4颗cpu核心。
重启nginx后,3个工作进程就可以各自用各自的CPU了。
三、刨根问底
- 如果自己写代码,要把进程绑定到CPU,该怎么做?可以用sched_setaffinity函数。在Linux上,这会触发一次系统调用。
- 如果父进程设置了affinity,之后其创建的子进程是否会有同样的属性?我发现子进程确实继承了父进程的affinity属性。
四、Windows?
在Windows上修改“CPU亲和力”,可以通过任务管理器搞定。
* 个人感觉,Windows系统中翻译的“处理器关系”比“CPU亲和力”容易理解点儿
—————–
进行了这样的修改后,即使系统负载达到3以上,不带缓存打开blogkid.net首页(有40多次查询)依然顺畅;以前一旦负载超过了1.5,响应就很慢了。效果很明显。
linux taskset命令详解
SYNOPSIS
taskset [options] [mask | list ] [pid | command [arg]...]
OPTIONS
-p, --pid
operate on an existing PID and not launch a new task
-c, --cpu-list
specifiy a numerical list of processors instead of a bitmask.
The list may contain multiple items, separated by comma, and
ranges. For example, 0,5,7,9-11.
-h, --help
display usage information and exit
-V, --version
output version information and exit