操作系统与网络基础

I.为何要有操作系统

现代计算机系统是个复杂的系统。若每位程序员都必须掌握该系统所有细节，再写代码，严重影响开发效率。于是计算机安装了一层软件（系统软件），称为操作系统。它主要是为用户程序提供一个更好，更简单，更清晰的计算机模型，并管理所有设备。

程序员无法把所有的硬件操作细节都了解到，那就由操作系统来做，有了它，程序员就解脱出来。应用软件直接使用操作系统提供的功能来间接使用硬件。

操作系统的位置

操作系统是一个协调、管理和控制计算机硬件资源和软件资源的控制程序。

操作系统位于计算机硬件与应用软件之间，本质也是一个软件。操作系统由操作系统的内核（运行于内核态，管理硬件资源）以及系统调用（运行于用户态，为应用程序写的应用程序提供调用接口）两部分组成，所以，单纯的说操作系统是运行于内核态的，是不准确的。

细分，操作系统分两部分：

一．隐藏了丑陋的硬件调用接口，为应用程序员提供调用硬件资源的更好，更简单，更清晰的模型（系统调用接口）。应用程序有了这些接口后，就不用在考虑操作硬件的细节，专心开发应用程序。

注意点：操作系统的实际客户是应用程序（应用程序员负责开发应用程序，因而也可说应用程序员是操作系统的客户）。应用程序直接与操作系统打交道。最终，用户则是与应用程序（即用户接口）打交道，或是命令行shell 或图形界面（如桌面），它们都只是运行于操作系统之上的应用软件，并不属于操作系统

二．将应用程序对硬件资源的静态请求变得有序化

如：很多应用软件其实是同享一套计算机硬件，比方说有可能有三个应用程序同时需要申请打印机来输出内容，那么a程序竞争到了打印机资源就打印，然后可能是b竞争到打印机资源，也可能是c,这就导致了无序，打印机可能打印一段a的内容然后又去打印c…，操作系统的一个功能就是讲这种无序变得有序（多路复用）

操作系统发展史

第一代计算机：真空管和穿孔卡片

特点：还木有操作系统的概念，所用的程序设计都是由纯粹的机器语言编写的

第二代计算机：集体和批处理

由于当时计算机昂贵，自认为很自然地想办法较少机时的浪费。采用的就是批处理系统。

特点：有了操作系统的概念。最早期操作系统:是人力与计算机结合的系统，需要人参与。

三：第三代计算机：集成电路芯片和多道程序设计

多道技术中的多道指的是多个程序，多道技术的实现是为了解决多个程序竞争或者说共享同一个资源（如CPU）的有序调度问题，解决方式及多路复用。

多路复用分：时间上的复用和空间上的复用

空间上的复用：将内存分为几部分，每部分放入一个程序，这样，同一时间内存中就有了多道程序。

时间上的复用：当一个程序在等待I\O时，另一个程序可以使用cpu，如果内存中可以同时存放足够多的作业，则cpu的利用率可接近100%,类似于统筹法。

时间上的复用最大的问题：

首先丧失是安全性，比如：你的QQ程序可以访问操作系统的内存，这意味着你的QQ可以拿到操作系统的所有权限。

其次丧失的是稳定性，某个程序奔溃时由可能把别人的内存也给回收了，比方说把操作系统的内存给回收了，则操作系统崩溃。

第四代计算机：个人计算机

操作系统的作用

作用一：为应用程序提供如何使用硬件资源的抽象

操作系统提供文件这个抽象概念，对文件的操作就是对磁盘的操作，有了文件我们无需再去考虑关于磁盘的读写控制

二：管理硬件资源

现代的操作系统运行同时运行多道程序，操作系统的任务是在相互竞争的程序之间有序的控制对处理器、存储器以及其他I\O接口设备的分配

例如：同一台计算机同时运行三个程序，它们三个在同一时刻在同一台计算机上输出结果，开始的几行可能是程序1的输出，接着几行是程序2的输出，然后又是程序3的输出，最终将是一团糟（程序之间是一种互相竞争资源的过程）

操作系统将打印机的结果送到磁盘的缓冲区，在一个程序完全结束后，才将暂存在磁盘上的文件送到打印机输出，同时在其他的程序可以继续产生更多的输出结果（这些程序的输出没有真正的送到打印机）,这样，操作系统就将由竞争产生的无序变得有序化。

多路复用

现代计算机或者网络都是多用户的，多个用户不仅共享硬件，而且共享文件，数据库等信息，共享意味着冲突和无序。

操作系统主要使用来：

记录哪个程序使用什么资源
对资源请求进行分配
为不同的程序和用户调节互相冲突的资源请求

我们可将上述操作系统的功能总结为：处理来自多个程序发起的多个（多个及复用）共享（共享即复用）资源的请求，简称多路复用。

多路复用：

1，时间上的复用

当一个资源在时间上复用是，不同的程序或用户轮流使用它，第一个程序获取该资源使用结束后，在轮到第二个…第三个…

例如：只有一个cpu,多个程序需要在该cpu上运行，操作系统先把cpu分给第一个程序，在这个程序运行的足够长的时间（时间长短有操作系统的算法说决定）或者遇到了I\O阻塞，操作系统则把cpu分配给下一个程序，以此类推，直到第一个程序重新被分配到了cpu然后再次运行，由于cpu的切换速度很快，给用户的感觉就是这些程序是同时运行的，或者是并发的，或伪并行。

2.空间上的复用

每个客户都获取了一个大的资源中的一部分资源，从而减少了排队在等待资源的时间。

例如：多个运行的程序同时进入内存，硬件层面提供。保护机制来确保各自的内存是分割开的，且由操作系统控制，这比一个程序独占内存一个一个排队进入内存效率要高得多。

有关空间复用的其他资源还有磁盘，在许多系统中，一个磁盘同时为许多用户保存文件。分配磁盘空间并且记录谁正在使用哪个磁盘块是操作系统资源管理的典型任务。

这两种方式结合起来便是多道技术

网络基础之网络协议

I.操作系统基础

操作系统（operating system , OS）是管理和控制计算机硬件与软件资源的计算机程序，是直接运行在‘裸机’上的最基本的系统软件，任何其他软件都必须在操作系统的支持下才能运行。

网络通信原理
1. 互联网的本质就是一些列的网络协议

英语成为世界上所有人通信的统一标准，如果把计算机看成分布于世界各地的人，那么连接两台计算机之见得Internet 实际上就是一些列统一的标准，这些标准称之为互联网协议，互联网的本质就是一些列的协议，总称之为“互联网协议”

互联网协议的功能：定义计算机如何接入Internet,以及接入Internet的计算机通信的标准

Osi五层模型

七层协议图

五层模型：

物理层

孤立的计算机之间要想一起玩，就必须接入Internet，就是计算机之间必须完成组网

物理层功能：主要是基于电器特性发送高低电压（电信号），高电压为 1，低电压为0

数据链路层

单纯的电信号0和1没有任何意义，必须规定电由来：信号多少位一组，每组什么意思

功能：定义了电信号的分组方式

以太网协议：

早期的时候各个公司都有自己的分组方式，后来形成了统一的标准，即以太网协议ethernet。

ethernet规定:

一组电信号构成一个数据包，叫做‘帧’
每一帧分成：报头head和数据data两部分

Head包含：固定18个字节

~~~发送者\源地址，6个字节

~~~接受者\目标地址，6个字节

~~~数据类型，6个字节

Data包含：最短46个字节，最长1500个字节

~~~数据包的具体内容：

Head长度 + data长度 = 最短64字节，最长1518字节，超过最大限制就分片发送

Mac地址：
head中包含的源和目标地址而来：ethernet规定接入internet的设备都必须具备网卡，发送端和接收端的地址便是指网卡的地址，即mac地址

mac地址：每块网卡出厂时都被烧制上一个世界上唯一的mac地址，长度为48位2进制，通常有12位16进制数表示（前六位是厂商编号，后六位是流水号）

广播：

有了mac地址，同一网络内两台主机就可以通信了（一台主机通过arp协议获取另外一台主机的mac地址）

Ethernet采用最原始的方式，广播的方式进行通信，即计算机通信基本靠吼

网络层

网络层由来：。有了ethernet ,mac地址,广播的发送方式，世界上的计算机就可以彼此通信了，问题是世界范围的互联网是由一个个彼此隔离的小的局域网组成的，那么如果所有的通信都采用以太网的广播方式，那么一台机器发送的包全世界都会收到，这就不仅仅是效率低的问题了，这会是一种灾难

上图：必须找出这一种方法来区分哪些计算机属于同一广播域，哪些不是，如果是就采用广播的方式发送，如果不是，就采用路由的方式（向不同广播领域\子网分发数据包），mac地址是无法区分的，它只是跟厂商有关。

网络层功能：引入一套新的地址用来区分不同的广播域资\子网，这套地址即网络地址

IP协议：

~~~规定网络地址的协议叫IP协议，它定义的地址称之为IP地址，广泛采用的v4版本即ipv4,它规定网络地址由2位2进制表示

~~~范围0.0.0.0-255.255.255.255

~~~一个ip地址通常写成四段十进制，例：173.16.10.1

IP地址分两部分：

~~~网络部分：表示子网

~~~主机部分:表示主机

注意：单纯的ip地址段只是标识了ip地址的种类，从网络部分或主机部分都无法辨识一个ip所处的子网

例：172.16.10.1 与 172.16.10.2并不能确定二者处于同一子网

子网掩码：

所谓的‘子网掩码’，就是表示自网络特征的一个参数。它在形式上等同于IP地址，也是一个32位二进制数字，它的网络部分全部为1，主机部分全部为0。比如，IP地址172.16.10.1，如果已知网络部分是前24位，主机部分是后8位，那么子网络掩码就是11111111.11111111.11111111.00000000，写成十进制就是255.255.255.0。

知道“子网掩码”，我们就能判断，任意两个IP地址是否处在同一个子网络。方法是将两个IP地址与子网掩码分别进行AND运算（两个数位都为1，运算结果为1，否则为0），然后比较结果是否相同，如果是的话，就表明它们在同一个子网络中，否则就不是。

比如，已知IP地址172.16.10.1和172.16.10.2的子网掩码都是255.255.255.0，请问它们是否在同一个子网络？两者与子网掩码分别进行AND运算，

172.16.10.1：10101100.00010000.00001010.000000001

255255.255.255.0:11111111.11111111.11111111.00000000

AND运算得网络地址结果：10101100.00010000.00001010.000000001->172.16.10.0

172.16.10.2：10101100.00010000.00001010.000000010

255255.255.255.0:11111111.11111111.11111111.00000000

AND运算得网络地址结果：10101100.00010000.00001010.000000001->172.16.10.0

结果都是172.16.10.0，因此它们在同一个子网络。

总结一下，IP协议的作用主要有两个，一个是为每一台计算机分配IP地址，另一个是确定哪些地址在同一个子网络。

Ip数据包：

Ip数据包也分为head和data部分，无须为ip包定义单独的栏位，直接放入以太网包的data部分

head：长度为20到60字节

data：最长为65,515字节。

而以太网数据包的”数据”部分，最长只有1500字节。因此，如果IP数据包超过了1500字节，它就需要分割成几个以太网数据包，分开发送了。

ARP协议：

arp协议由来：计算机通信基本靠吼，即广播的方式，所有上层的包到最后都要封装上以太网头，然后通过以太网协议发送，在谈及以太网协议时候，我门了解到

通信是基于mac的广播方式实现，计算机在发包时，获取自身的mac是容易的，如何获取目标主机的mac，就需要通过arp协议

arp协议功能：广播的方式发送数据包，获取目标主机的mac地址

协议工作方式：每台主机ip都是已知的

例如：主机172.16.10.10/24访问172.16.10.11/24

1.首先通过ip地址和子网掩码区分出自己所处的子网

2.分析172.16.10.10/24与172.16.10.11/24处于同一网络(如果不是同一网络，那么下表中目标ip为172.16.10.1,通过arp获取的是网关的mac)

4.这个包会以广播的方式在发送端所处的自网内传输，所有主机接收后拆开包，发现目标ip为自己的，就响应，返回自己的mac

传输层：

传输层的由来：网络层的ip帮我们区分子网，以太网层的mac帮我们找到主机，然后大家使用的都是应用程序，你的电脑上可能同时开启qq，暴风影音，等多个应用程序，

那么我们通过ip和mac找到了一台特定的主机，如何标识这台主机上的应用程序，答案就是端口，端口即应用程序与网卡关联的编号。

传输层功能：建立端口到端口的通信

补充：端口范围0-65535，0-1023为系统占用端口

tcp协议：

可靠传输，TCP数据包没有长度限制，理论上可以无限长，但是为了保证网络的效率，通常TCP数据包的长度不会超过IP数据包的长度，以确保单个TCP数据包不必再分割。

udp协议：

不可靠传输，”报头”部分一共只有8个字节，总长度不超过65,535字节，正好放进一个IP数据包。

tcp报文

tcp三次握手和四次挥手

应用层：

应用层由来：用户使用的都是应用程序，均工作于应用层，互联网是开发的，大家都可以开发自己的应用程序，数据多种多样，必须规定好数据的组织形式

应用层功能：规定应用程序的数据格式。

例：TCP协议可以为各种各样的程序传递数据，比如Email、WWW、FTP等等。那么，必须有不同协议规定电子邮件、网页、FTP数据的格式，这些应用程序协议就构成了”应用层”。

网络通信流程

1.本机获取

本机的IP地址：192.168.1.100
子网掩码：255.255.255.0
网关的IP地址：192.168.1.1
DNS的IP地址：8.8.8.8

2.打开浏览器，想要访问Google，在地址栏输入了网址：www.google.com。

3.dns协议(基于udp协议)

13台根dns：

A.root-servers.net198.41.0.4美国
B.root-servers.net192.228.79.201美国（另支持IPv6）
C.root-servers.net192.33.4.12法国
D.root-servers.net128.8.10.90美国
E.root-servers.net192.203.230.10美国
F.root-servers.net192.5.5.241美国（另支持IPv6）
G.root-servers.net192.112.36.4美国
H.root-servers.net128.63.2.53美国（另支持IPv6）
I.root-servers.net192.36.148.17瑞典
J.root-servers.net192.58.128.30美国
K.root-servers.net193.0.14.129英国（另支持IPv6）
L.root-servers.net198.32.64.12美国
M.root-servers.net202.12.27.33日本（另支持IPv6）

域名定义：http://jingyan.baidu.com/article/1974b289a649daf4b1f774cb.html

顶级域名：以.com,.net,.org,.cn等等属于国际顶级域名，根据目前的国际互联网域名体系，国际顶级域名分为两类：类别顶级域名(gTLD)和地理顶级域名(ccTLD)两种。类别顶级域名是　　　　　　　　以"COM"、"NET"、"ORG"、"BIZ"、"INFO"等结尾的域名，均由国外公司负责管理。地理顶级域名是以国家或地区代码为结尾的域名，如"CN"代表中国，"UK"代表英国。地理顶级域名一般由各个国家或地区负责管理。

二级域名：二级域名是以顶级域名为基础的地理域名，比喻中国的二级域有，.com.cn,.net.cn,.org.cn,.gd.cn等.子域名是其父域名的子域名，比喻父域名是abc.com,子域名就是www.abc.com或者*.abc.com.
一般来说，二级域名是域名的一条记录，比如alidiedie.com是一个域名，www.alidiedie.com是其中比较常用的记录，一般默认是用这个，但是类似*.alidiedie.com的域名全部称作是alidiedie.com的二级

4.HTTP部分的内容，类似于下面这样：

GET / HTTP/1.1
Host: www.google.com
Connection: keep-alive
User-Agent: Mozilla/5.0 (Windows NT 6.1) ……
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8
Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3
Cookie: … …

我们假定这个部分的长度为4960字节，它会被嵌在TCP数据包之中。

5 TCP协议

TCP数据包需要设置端口，接收方（Google）的HTTP端口默认是80，发送方（本机）的端口是一个随机生成的1024-65535之间的整数，假定为51775。

TCP数据包的标头长度为20字节，加上嵌入HTTP的数据包，总长度变为4980字节。

6 IP协议

然后，TCP数据包再嵌入IP数据包。IP数据包需要设置双方的IP地址，这是已知的，发送方是192.168.1.100（本机），接收方是172.194.72.105（Google）。

IP数据包的标头长度为20字节，加上嵌入的TCP数据包，总长度变为5000字节。

7 以太网协议

最后，IP数据包嵌入以太网数据包。以太网数据包需要设置双方的MAC地址，发送方为本机的网卡MAC地址，接收方为网关192.168.1.1的MAC地址（通过ARP协议得到）。

以太网数据包的数据部分，最大长度为1500字节，而现在的IP数据包长度为5000字节。因此，IP数据包必须分割成四个包。因为每个包都有自己的IP标头（20字节），所以四个包的IP数据包的长度分别为1500、1500、1500、560。

8 服务器端响应

经过多个网关的转发，Google的服务器172.194.72.105，收到了这四个以太网数据包。

根据IP标头的序号，Google将四个包拼起来，取出完整的TCP数据包，然后读出里面的”HTTP请求”，接着做出”HTTP响应”，再用TCP协议发回来。

本机收到HTTP响应以后，就可以将网页显示出来，完成一次网络通信。