架构高性能网站秘笈(一)——了解衡量网站性能的指标

释放双眼，带上耳机，听听看~！

服务器如何发送数据？

服务器程序将需要发送的数据写入该程序的内存空间中；
服务器程序通过操作系统的接口向内核发出系统调用；
系统内核将用户态内存空间中的数据复制到内核缓冲区中去，然后通知网卡过来取；此后CPU转而做其他处理；
网卡到CPU指定的内核缓冲区中将数据复制到网卡缓冲区中；
网卡将字节转换成二进制位，再以电信号的形式输出至网络。

**注意：**数据在计算机内部的复制是按照总线的宽度来复制的。比如在32位的操作系统中，数据每次都复制32位。
总线就像是一条32/64车道的马路，数据在计算机中是以0/1的形式存储，每次复制每条车道只能走一个0/1，因此每次只能同时复制32个0/1.

数据在网线中的速度

网络传输介质有光缆和铜缆，在光缆中电信号的传输速度为2.3×10^8m/s，在铜缆中传输速度为2.0×10^8m/s。
光的传播速度为3.0×10^8m/s，但由于光缆采用反射机制传播，并不是直射，因此电信号实际走的路程要比直线长很多，因此在光缆中的传播速度只有2.0×10^8m/s。

什么是带宽？

带宽的定义

带宽的定义：数据的发送速率。

带宽的单位

100Mbps = 100M bit per second
平时所说的100M带宽指的是100M比特每秒，
100Mbps = 12.5MBps

**注意：**我们平时所说的“100M”指的是100MB，而带宽的单位是Mb，而1MB = 8Mb。因此，运营商所说的“百兆宽带”其实是“12.5兆宽带”，呵呵。

什么影响了数据发送速度(带宽)？

数据的发送速度由接收方的接收速度决定。在数据链路层中，为了确保数据在接收过程中不发生丢失，因此接收方要告诉发送方目前发送速度是否合理。若接收方来不及收，就会告诉发送方，让它慢点发。因此，数据的发送速度(即带宽)由接收方的接收速度决定。
与传播介质的并行度有关。传输介质可以看成是多车道马路，数据由0/1组成，每股车道每次只能容纳一个0/1。因此，如果马路的车道增多，那么每次发送的0/1也就增多，从而提高了发送速度(即带宽).

运营商为什么要限制带宽？

我们的服务器会通过一个交换机连入互联网，互联网由无数个路由器和主机构成，路由器负责数据包的存储转发,将数据包根据目的地址途径一个个路由器，最终投递到目的主机中。

由于一个交换机往往有多个服务器接入，服务器们都会将需要发送的数据首先发给交换机，再由交换机发给路由器，这些数据先存储在路由器的缓存中，然后路由器根据先后顺序逐个转发。所以，如果服务器发送数据的速度过快，路由器缓存满了，那接下来的数据就会丢失，因此需要限制服务器向路由器发送数据的速度，即限制服务器的带宽。而这个限制由接入服务器的交换机完成。通过上文可知，交换机只要控制接收速度，就能限制服务器的发送速度。

什么是共享带宽？什么是独享带宽？

1.独享带宽
如果一个路由器的出口带宽为100Mbps，并且同一个广播域内有10台主机，交换机只要将每台主机的最大出口带宽限制为10Mbps，那么不管在任何情况下每台主机的最大出口带宽为10Mbps。这就是独享带宽。独享带宽不会受到同一个广播域内其他主机的影响，任何时候最大出口带宽均为10Mbps。

2.共享带宽
假设一个路由器的出口带宽仍为100Mbps，但运营商为了挣更多钱，使同一个广播域内有多于10个主机接入，那么每台主机的平均最大带宽就小于10Mbps，此时即使交换机仍然将每台主机的最大出口带宽限制为10Mbps，但当主机都有较大的网络通信时，就无法保证每台主机都有10Mbps的最大带宽，此时就会相互竞争带宽。

综上所述，独享10M带宽能保证服务器的最大出口带宽在任何情况下都为10Mbps，不会受到同一广播域内的其他主机影响；而共享10M带宽只能保证在同一广播域内的其他主机通信空闲时，才能达到最大10Mbps的出口带宽。

什么是响应时间？

响应时间是指从数据包的第一个0/1离开服务器开始，到最后一个0/1被客户端接收为止的这段时间。

响应时间＝发送时间＋传输时间＋处理时间

发送时间：从发送数据包的第一个0/1开始，到发完最后一个0/1为止的这段时间。

发送时间＝数据包比特数/带宽

传输时间：数据在通信线路中的传输时间。

传输时间＝传输距离/传输速度
(传输速度近似为2×10^8m/s)

处理时间：数据在各个路由器中存储转发的时间。

处理时间比较难以计算。

响应时间＝(数据包比特数/带宽)+(传输距离/传输速度)+处理时间

下载速度＝数据的字节数/响应时间

什么是吞吐率？

吞吐率：服务器单位时间内处理请求的个数。
单位：reqs/s

吞吐率用来衡量服务器处理请求的能力。

当请求非常少的时候吞吐率并不高，因为此时服务器的性能还没有体现出来。那么随着请求的不断增多，吞吐率会随之上升，但当并发请求数上升到某一个临界点时，吞吐率不升反降。那个临界点就是服务器吞吐率的最大值，也叫最大吞吐率。

若我们的网站有促销活动前，可以通过上述方法来估计服务器的最大吞吐率，从而能判断服务器能否顶住促销带来的压力。

什么是并发数？什么是并发用户数？

要搞清楚并发数和并发用户数的区别，首先需要了解HTTP协议。

HTTP协议是一种应用层协议，它本身是无连接的，也就是客户端与服务器每完成一次数据交互就需要断开连接，下次通信时重新建立连接。但是HTTP1.1中有一个keep-alive字段，它使得通信双方在完成一次通信后仍然保持一定时长的连接。若该时间内客户端又想与服务器通信，那么无需再创建新的连接，只需重用刚才的连接即可，这样能提高通信的效率，减少额外的开销。

并发数：客户端向服务器请求的次数。不论是否延用已创建的连接，只要客户端向服务器提出请求，就算一个并发数。
并发用户数：创建TCP连接的个数。如果一个浏览器延用了已创建的连接向服务器发送了10次请求，那么只算一个并发用户数。

**注意：**现在的浏览器支持多线程，可以同时与服务器建立多个TCP连接，因此一个用户可能会导致多个并发用户数。所以“并发用户数”和“用户数”不能完全画等号，这点需要注意！

平均请求等待时间和服务器平均请求处理时间

**平均请求等待时间：**用户从点击一个按钮，到新的页面加载完毕所需的时间。

**服务器平均请求处理时间：**服务器从等待队列中取出一个请求开始，到处理完该请求所需的时间。

**综上所述：**平均请求处理时间是站在用户角度，是用来衡量用户体验的好坏的指标。
而服务器平均请求处理时间是衡量服务器性能好坏的指标，其实就是吞吐率的倒数。

**注意：**平均请求等待时间和服务器平均请求处理时间不成正比关系！
平均请求等待时间＝请求传输时间＋请求等待时间＋请求处理时间
服务器平均请求处理时间＝请求处理时间
由此可知，在请求数很少的情况下，浏览器发来的请求无需等待，直接被服务器处理，那么请求等待时间和服务器请求处理时间成正比关系；但在请求异常多的时候，请求到来速度远远大于服务器处理请求的速度，那么很多请求将会在等待队列中挤压，此时即使服务器处理请求的能力很强(即服务器平均请求处理时间很短)，但用户的等待时间依然很长，此时用户等待时间与服务器请求处理时间不成正比。

使用Apache Bench进行压力测试

我们使用Apache服务器的Apache Bench(简称ab)对网站进行压力测试。ab简单易用，关键可以直接在服务器本地发起测试，这样我们可以获取不包括传输时间的服务器处理时间。通过服务器处理时间就可以知道服务器的性能。

1. 压力测试命令

-n100：总并发数
-c10：并发用户数
http://www.acmcoder.com/index.php：需要测试的页面

2. 测试结果解析

如何选择网站的被测URL？

一个网站的URL可能有很多，每个URL对应的处理也不尽相同，某一个URL的测试结果并不具有代表性。因此，我们需要选择一系列有代表性的URL，将测试结果的加权平均数作为网站的综合性能。

{{userData.name}}已认证

架构高性能网站秘笈(一)——了解衡量网站性能的指标

服务器如何发送数据？

数据在网线中的速度

什么是带宽？

带宽的定义

带宽的单位

什么影响了数据发送速度(带宽)？

运营商为什么要限制带宽？

什么是共享带宽？什么是独享带宽？

什么是响应时间？

什么是吞吐率？

什么是并发数？什么是并发用户数？

平均请求等待时间和服务器平均请求处理时间

使用Apache Bench进行压力测试

1. 压力测试命令

2. 测试结果解析

如何选择网站的被测URL？

独立博客怎样申请谷歌Adsense

安全咨询服务

{{userData.name}}已认证

服务器如何发送数据？

数据在网线中的速度

什么是带宽？

带宽的定义

带宽的单位

什么影响了数据发送速度(带宽)？

运营商为什么要限制带宽？

什么是共享带宽？什么是独享带宽？

什么是响应时间？

什么是吞吐率？

什么是并发数？什么是并发用户数？

平均请求等待时间 和 服务器平均请求处理时间

使用Apache Bench进行压力测试

1. 压力测试命令

2. 测试结果解析

如何选择网站的被测URL？

Related posts:

独立博客怎样申请谷歌Adsense

安全咨询服务

负载均衡器技术Nginx和F5的优缺点对比

LVS+keepalived实现负载均衡

Yahoo!网站性能最佳体验的34条黄金守则

nginx服务器高并发配置详解(单机3w+并发)

平均请求等待时间和服务器平均请求处理时间