当前位置：首页 > news >正文

菜鸟式网站建设图书室内设计师收入高吗

news 2025/11/14 19:50:20

菜鸟式网站建设图书,室内设计师收入高吗,上市公司集团网站建设,德州建设街小学网站文章目录 1. TCP协议的引入2. TCP协议的特点3. TCP协议格式3.1 序号与确认序号3.2 发送缓冲区与接收缓冲区3.3 窗口大小3.4 六个标志位 4. 确认应答机制5. 超时重传机制6. 连接管理机制6.1 三次握手6.2 四次挥手 7. 流量控制8. 滑动窗口9. 拥塞控制10. 延迟应答11. 捎带应答12.… 文章目录 1. TCP协议的引入2. TCP协议的特点3. TCP协议格式3.1 序号与确认序号3.2 发送缓冲区与接收缓冲区3.3 窗口大小3.4 六个标志位 4. 确认应答机制5. 超时重传机制6. 连接管理机制6.1 三次握手6.2 四次挥手 7. 流量控制8. 滑动窗口9. 拥塞控制10. 延迟应答11. 捎带应答12. 面向字节流13. 粘包问题14. TCP异常情况15. 总结16. 基于TCP的应用层协议 1. TCP协议的引入认识可靠性现在的计算机大多都是基于冯诺依曼体系结构的虽然这里的输入设备、输出设备、内存、CPU是在同一个机器上的但是它们彼此间却是相互独立的。如果它们之间要进行通信那就必须要用“线”连接起来其中连接内存和外设之间的“线”叫做IO总线连接CPU与内存之间的线叫做系统总线。由于这些硬件设备在同一台机器上因此连接它们的“线”是很短的它们之间传输数据时出现错误的概率也很低。但如果要进行通信的设备相隔千里那么连接它们之间的“线”就要很长传输数据时出现错误的概率也就大大增加此时要保证传输到对端的数据无误就必须引入可靠性的概念。而TCP就是在这样一种背景下诞生了TCP就是一种保证可靠性的协议那UDP的存在有何意义既然我们用TCP协议来保证传输的可靠性而UDP协议是不可靠的它存在的意义是什么呢其实可靠与不可靠它们两个是中性词并无褒贬之分。 TCP是可靠的协议那么就意味着它要做更多的工作来保证数据传输的可靠性并且如果引起不可靠的因素越多那么保证可靠消耗的成本时间与空间也就越多。数据在传输过程中出现了丢包、乱序、检验和失败等这些都是不可靠的情况。由于TCP相比UDP要保证可靠性的问题那么它使用起来一定比UDP更加复杂并且维护成本也更高。UDP协议是不可靠的协议那么UDP协议在数据传输的过程中也就不要考虑数据传输时出现错误的问题它使用和维护起来也就一定更简单。需要注意的是虽然TCP简单但是TCP效率不一定比UDP低TCP当中不仅有保证传输可靠性的机制还有保证传输效率的机制。 TCP与UDP这两个协议没有谁好谁坏之分只有谁更合适我们在网络通信时使用TCP还是UDP取决于上层的应用场景。如果上层应用严格要求数据在传输过程中的可靠性那么我们选择TCP协议因为TCP协议可以保证数据传输的可靠性如果上层应用允许在数据传输时出现丢包等情况那么我们选择UDP协议因为它足够简单。 2. TCP协议的特点经过上面的介绍我们也就可以明白TCPTransmission Control Protocol是一种常用的传输层协议用于在计算机网络中传输数据。它是TCP/IP协议簇的核心协议之一确保可靠性从一个断点传输到另一个端点。 TCP协议有以下特点可靠性TCP提供可靠的数据传输确保数据按顺序传输到对端并且不会出现丢失、重复或者损坏的情况。连接导向在数据传输之前TCP需要在通信的两端建立一个连接。这个连接在数据传输结束后会被关闭。流控制TCP使用滑动窗口机制进行流量控制确保发送方不会淹没接收方。拥塞控制TCP具有拥塞控制机制可在网络拥塞时自动调整发送速率以减少网络拥塞和数据丢失。面向字节流TCP将数据视为连续的字节流而不是离散的数据包。这意味着着数据可以分割成更小的块进行传输也可以合并多个小块的数据后交付给应用层。 3. TCP协议格式 TCP报头中各个字段的含义如下源/目的端口号表示数据从哪个进程来发送到哪个进程去。32位序号/32位确认序号分别表示TCP报文中每个字节数据的编号以及对方的确认是TCP保证可靠性的重要字段。4位TCP报头长度表示该TCP报头的长度以4字节为单位。6位保留字段TCP报头中暂时未使用的6个比特位。16位窗口大小保证TCP可靠性机制和效率提升机制的重要字段。16位检验和由发送端填充采用CRC校验。接收端校验不通过则认为接收到的数据有问题。检验和包含TCP首部和TCP数据部分16位紧急指针标识紧急数据在报文中的偏移量需要配合标志字段当中的URG字段统一使用。选项字段TCP报头当中允许携带额外的选项字段最多40字节。 TCP报头当中的六位标志位 URG紧急指针是否有效ACK确认序号是否有效PSH提示接收端应用程序立刻将TCP接收缓冲区当中的数据读走RST表示请求对方重新建立连接我们把携带RST标识的报文称为复位报文段SYN表示请求与对方建立连接我们把携带SYN标识的报文称为同步报文段FIN通知对方本端要关闭了。我们把携带FIN标识的报文称为结束报文段 TCP报头在内核中本质就是一个位段类型给数据封装TCP报头时本质就是用该位段类型定义了一个变量然后填充TCP报头当中的各个属性字段最后将这个TCP报头拷贝到数据的首部至此便完成了TCP报头的封装。 TCP如何将报头与有效载荷分离当TCP从底层获取到一个报文之后虽然TCP不知道报文的具体长度但是报文的前20个字节是报文的基本报头且其中涵盖了4位的首部长度。 TCP是这样分离报头和有效载荷的当TCP读取到一个报文之后首先提取出报文的前20个字节并从20个字节中提取出4位首部长度这样便得到了TCP报头的大小size。如果size的值大于20则需要再从报文中读取size - 20字节的数据这部分数据就是TCP报头当中选项字段。读取完TCP的基本报头和选项字段之后剩下的就是有效载荷了。需要注意的是TCP报文当中的4位首部长度描述的基本单位是4字节这恰好也是报文的宽度即报文数据的单位。4位首部长度的取值范围为0000~1111因此TCP报头的最大长度为 15 * 4 60 字节因为基本报头的长度是20字节所以报头中选项的长度最多为40字节。如果TCP报头当中不携带选项字段那么TCP报头的长度就为20字节此时报头当中的4位首部长度的值也就为 20 / 4 5 字节也就是说首部长度的值为0101。 TCP如何得知将有效载荷交付给上层的哪一个协议应用层的每一个网络进程都必须绑定一个端口号。服务端进程必须由程序员显式指定一个端口号而客户端进程又系统分配一个端口号。 TCP的报头中涵盖了目的进程端口号因此就可以根据端口号找到指定的进程从而交付数据。 3.1 序号与确认序号如何保证可靠性在进行网络通信时一方发出数据之后它不能保证该数据能被对方成功收到。因为数据在传输过程中可能会发生各种各样的错误只有当收到对端主机的响应之后才可认为上一次发送的数据被对端成功收到了。图中实线表示数据可以保证被对方收到虚线则不能。但TCP要保证的是双方通信的可靠性虽然此时主机A能够保证自己上一次发送的数据被主机B可靠地收到了但主机B也需要保证自己发送的响应数据被主机A可靠地收到了。因此主机A在收到主机B的响应消息之后还要向主机B发送响应消息的响应消息如此这样循环下去。。。岂不是很不合理呢只有当一端收到对方的响应消息之后才能保证自己发送的消息被对方成功收到了但是总有一方有最新的一条消息所以我们无法百分百保证可靠性所以严格意义上来说互联网通信当中是没有百分百的可靠性的因为通信双方总有一条消息得不到响应。但是实际上也没有必要保证百分百的可靠性我们只需要保证核心数据被对方收到就可以了。而对于一些无关紧要的数据比如响应数据我们不必保证它的可靠性。这种策略在TCP当中就叫做确认应答机制。需要注意的是确认应答机制不是保证双方通信的百分百可靠性而是只要一方收到另一方的响应消息就说明它上一次发送的数据被另一方可靠地收到了。可是我们必须要考虑一个问题如果双方在进行网络通信时只有收到了上一次发送数据的响应才能发下一个数据那么此时双方的数据通信就是串行的效率非常低因此双方在进行网络通信的时候允许一方向另一方连续发送多个报文数据只要保证发送的每个报文都有对应的响应消息就行了此时也就能保证这些报文被对方收到了。但在连续发送多个报文时由于各个报文在进行网络传输时选择的路径可能是不一样的因此这些报文到达对端主机的先后顺序也就可能和报文的发送顺序是不一致的。但是报文有序也是可靠性的一种为了保证报文有序我们引入32位序号 32位序号报文有序也是可靠性的一种TCP报头当中的32位序号的作用之一实际就是用来保证报文的有序性的。 TCP将发送出去的每个字节数据都进行了编号这个编号叫做序列号。比如现在发送端要发送3000字节的数据如果每次只发送1000字节的数据那么就需要用三个TCP报头来发送者3000字节的数据。此时这三个TCP报文当中的32位序号填的就是发送数据中首个字节的序列号因此分别填的是1、 1001、 2001 此时接收端在收到了这三个TCP报文之后就可以根据TCP报头当中的序列号对这三个报文进行重排该动作在传输层进行重拍后将其放到TCP的接收缓冲区中此时接收端这里报文的顺序就与发送端一致了。接收端在进行报文重排时可以根据当前报文的32位序号以及与其有效载荷的字节数进而确定下一个报文对应的序列号。在我们发送核心数据的时候需要32位序号那么在我们发送响应数据的时候其实也需要32位确认序号。 32位确认序号 TCP报头当中的32位确认序号是告诉对端我当前已经收到了哪些数据你的数据下一次应该从哪里发送。以上面的例子为例当主机B收到主机A发送的32位序号为1的报文后由于该报文中报文1000字节的数据因此主机B收到序列号为1 ~ 1000的字节数据于是主机B发给主机A的响应数据的报头当中的32位确认序号就会被填为1001。这样做有两个目的一方面是告诉主机A序列号为在1001之前的数据我已经收到了另一方面是告诉主机A下次你应该从序列号为1000的数据开始发送注意响应数据和其他数据一样也是一个完整的报文虽然它不携带有效载荷。如果出现报文丢失的情况怎么办主机A发送了三个报文给主机B其中每个报文的有效载荷都是1000字节这三个报文的32位序号是1、 1001、 2001。如果这三个报文在网络传输的过程中出现了丢包最终只有需要为1和2001的报文都主机B收到了那么当主机B在对报文进行顺序重排的时候就会发现只收到了 1 ~ 1000 和2001 ~ 3000的数据。此时主机B在对主机A进行响应时其响应报头当中的32位确认序号填的就是10001告诉主机A下次要从序号1001的数据开始发送。注意此时主机B在对主机A响应时其32位确认序号就不能填3001。因为如果填了3001就表明3001之前的数据全被收到了这样就忽略了 1001 ~ 2000 的字节数据了。因此主机B只能给主机A响应1001当主机A收到该确认序号之后就能确定从1001开始的报文丢失了然后就重新发送。因此发送端可以根据对端发来的确认序号判断是否有哪个报文在传输中丢失了。为什么要使用两套序号机制如果通信一方只是发送数据另一方只是接收数据那么只用一套序号就可以了。但是TCP是全双工通信的双方都有可能发送数据和接收数据。双方发出的报文中不仅要填充自己的32位序号来表明自己发送数据的序列号。还要填充32位确认序号对对方上一次发送的数据进行确认告诉对方下一次应该从哪一字节序号进行发送。因此在TCP通信时双方都要有确认应答机制在TCP报头当中就出现了两套序号。 3.2 发送缓冲区与接收缓冲区 TCP本身是具有发送缓冲区和接收缓冲区的这两个缓冲区都是在TCP传输层内部实现的。 TCP发送缓冲区当中的数据由上层应用层进行写入当上层应用层调用write/send这样的系统调用接口时实际并不是直接将数据发送到了网络当中而是将数据从应用层拷贝到了TCP的发送缓冲区当中。TCP接收缓冲区当中的数据最终也是由应用层来读取的当上层调用read/recv这样的系统调用接口时实际也不是直接从网络中读取数据而是将数据从TCP的缓冲区拷贝到了应用层而已。就好比调用read和write接口进行文件读写时并不是直接从磁盘读取数据也不是直接将数据写入到磁盘上而对文件缓冲区进行读写操作。当数据写入到TCP的缓冲区之后对应的read/write函数就可以返回了至于发送缓冲区当中的数据具体什么时候发送怎么发送等问题是由TCP决定的。我们之所以称TCP为传输层控制协议就是因为TCP决定了数据的发送和接收方式以及决定了传输数据时遇到的问题该如何解决。用户只需要将数据拷贝到TCP的发送缓冲区当中以及从TCP的接收缓冲区当中读取数据就行。 TCP的发送缓冲区和接收缓冲区存在的意义发送缓冲区和接收缓冲区的作用数据在网络中传输时可能会出现某些错误此时就可能要求发送端进行数据重传因此TCP必须提供一个发送缓冲区来暂时保存发送出去的数据便于应对出现数据重传的情况。只有当发出去的数据被对端可靠地读取之后发送缓冲区中对应的数据才可以被覆盖掉。接收端处理数据的速度是有限的为了保证没来得及处理的数据不被丢弃我们必须提供一个接收缓冲区来暂时保存没有被处理的数据。另外TCP的数据重排也是在接收缓冲区中进行的。它们其实就是一个经典的生产者消费者模型对于发送缓冲区来说上层应用不断向缓冲区内写入数据下层网络层不断读取数据从而进行进一步地封装。在这个过程中上层应用就是生产者的角色下层网络层就是消费者的角色而发送缓冲区就是它们的交易场所。对于接收缓冲区来说下层网络层不断向缓冲区中写入数据上层应用不断从缓冲区中拿出数据进行处理。在这个过程中下层网络层就是生产者的角色上层应用就是消费者的角色而接收缓冲区就是它们的交易场所。因此引入发送缓冲区和接收缓冲区也就是引入了两个生产者消费者模型从而将上层应用于底层通信进行解耦。 3.3 窗口大小当发送端要发送数据给对端时本质是将自己发送缓冲区的数据发送到对端的接收缓冲区当中。但是缓冲区是有大小的如果接收端处理的速度小于发送端发送的速度那么总有一个时刻接收缓冲区会被写满这时发送端再发送数据过来就会造成数据丢包进而引发丢包重传等一系列的连锁反应。因此TCP报文当中就有了16的窗口大小这个16位窗口大小当中填的是自身接收缓冲区中剩余空间的大小也就是当前主机接收数据的能力。接收端在对发送端发来的数据进行响应时就可以通过16位窗口大小告知发送端自己当前接收缓冲区剩余空间的大小此时发送端就可以更具这个窗口大小字段来调整自己发送数据的速度。在编写TCP套接字时我们调用read/recv函数从套接字中读取数据时可能会因为套接字当中没有数据而被阻塞本质是因为TCP的接收缓冲区当中没有数据了我们实际是阻塞在接收缓冲区当中了。而我们调用write/read函数往套接字当中写入数据时可能会因为套接字已经写满而被阻塞住本质是因为TCP的发送缓冲区已经被写满了我们实际是阻塞在发送缓冲区当中了。在生产者消费者模型中如果生产者生产数据被阻塞或者消费者消费数据被阻塞那么一定是因为某些条件不就绪而被阻塞。 3.4 六个标志位为什么会存在标志位 TCP报文的种类多种多样除了正常连接时发送的普通报文还有建立连接时发送的请求建立连接的报文以及断开连接时发送的断开连接的报文等等。收到不同种类的报文时我们需要执行对应的动作比如正常通信的报文我们需要放到接收缓冲区当中等待上层进行读取而建立和断开连接的报文本质不是交给用户处理的而是需要让操作系统在TCP层执行对应的握手和挥手动作。也就是说不同种类的报文对应的不同的处理逻辑所以我们要能够区分报文的种类。而CPU就是使用报文当中的六个标志字段来进行区分的这六个标志位都只占用一个比特位为0表示假为1表示真。 SYN 报文当中的SYN被设置为1表示该报文是一个连接建立的请求报文。只有在连接建立阶段SYN才被设置正常通信的时候SYN不被设置。 ACK 报文当中的ACK被设置为1表明该报文可以对收到的报文进行确认。一般除了第一个请求没有设置ACK其余报文都会设置ACK。因为发送出去的数据本身就对对方发送过来的数据具有一定的确认能力因此双方在进行数据通信时可以顺便对对方上一次发送的数据进行响应。 FIN 报文当中的FIN被设置为表明该报文是一个连接断开的请求报文。只有在断开连接阶段FIN才被设置正常通信时FIN不会被设置。 URG 双方在进行网络通信的时候由于TCP是保证数据按序到达的即便发送端将要发送的数据分成了若干个TCP报文进行发送最终到达接收端时这些数据也都是有序的因为TCP可以通过序号来对这些TCP报文进行顺序重排最终就能保证数据到达对端接收缓冲区中是有序的。 TCP按序到达本身也是我们的目的此时对端上层从接收缓冲区读取数据时也必须是按顺序读取的。但是有时候发送端可能发送了一些“紧急数据”这些数据需要让对方上层提取进行读取此时就要用到URG。此时就需要用到URG标志位以及TCP报头当中的16位紧急指针。当URG标志位被设置为1时需要通过TCP报头当中的16位紧急指针来找到紧急数据否则一般情况下不需要关注TCP报头当中的16位紧急指针。16位紧急指针代表的就是紧急数据在报文中的偏移量。因为紧急指针只有一个它只能表示数据段中的某一个位置因此紧急数据只能发送一个字节而至于这一个字节的具体含义这里就不展开讨论了。 recv函数的第四个参数flags有一个叫做MSG_OOB的选项可以设置其中OOB是带外数据out of band的简称带外数据就是一些比较重要的数据因此上层如果想读取紧急数据就可以使用recv函数进行读取并设置MSG_OOB选项。与之对应的send函数的第四个参数flags也提供了一个叫做MSG_OOB的选项上层如果想发送紧急数据就可以使用send函数进行写入并设置MSG_OOB选项。 PSH 报文当中的PSH被设置为1是在告诉对方尽快将你的接收缓冲区的数据交付给上层。我们一般任务当使用read/recv从缓冲区中读取数据时如果缓冲区当中有数据read/recv函数就能够读取到数据并进行返回而如果缓冲区当中没有数据那么此时read/recv就会阻塞住直到缓冲区当中有数据时才会读取到数据并进行返回。实际这种说法是不准确的其实接收缓冲区和发送缓冲区都有一个水位线的概念。比如我们假设TCP接收缓冲区的水位线是100字节那么只有当接收缓冲区当中有100字节时才会让read/recv函数读取这100字节的数据并进行返回。如果接收缓冲区当中有一点数据就让read/recv函数读取返回了此时read/recv函数就会频繁地进行读取和返回进而影响读取数据的效率在内核态和用户态之间切换也是有成本的。因此不是说接收缓冲区当中只要有数据调用read/recv函数时就能读取到数据进行返回而是当缓冲区当中的数据量到一定范围时才能进行读取。当报文当中的PSH设置为1时实际就是在告诉对方操作系统尽快将接收缓冲区的数据交付给上层尽管接收缓冲区的数据还没到达指定的水位线。这也就是为什么我们使用read/recv函数读取数据时期望读取的字节数和实际读取的字节数是不一定吻合的。 RST 报文当中的RST被设置为1表示需要让对方重新建立连接在通信双方在连接未建立好的情况下一方向另一方发送数据此时另一方的响应报头中的RST位就会被置1表示要求对方重新建立连接。在双方建立好连接进行正常通信时如果通信中途发现之前建立好的连接出现了异常也会要求重新建立连接。 4. 确认应答机制 TCP保证可靠性的机制之一就是确认应答机制确认应答机制就是由TCP报头中的32位序号和32位确认序号来保证的。需要再次强调的是确认应答机制不是保证双方通信的全部消息的可靠性而是通过收到对方的应答消息来保证自己曾经发送给对方的某一条消息被对方可靠地收到了。如何理解TCP将每个字节的数据都进行了编号 TCP是面向字节流的我们可以将TCP的发送缓冲区和接收缓冲区都想象成一个字符数组。此时上层应用拷贝到TCP发送缓冲区当中的每一个字节数据天然有了一个序号这个序号就字符数组的下标只不过这个下标不是从0开始的而是从1开始递增的。而双方在同时时本质就是将自己发送缓冲区的数据拷贝到对方的接收缓冲区中。发送方发送数据时报头中所填的序号实际就是发送的若干字节数据当中首个字节数组在发送缓冲区中对应的下标。接收方接收到数据进行响应时响应报头当中的确认序号实际就是接收缓冲区接收到的最后一个有效数据的下一个位置对应的下标。当发送方收到接收方的响应后就可以从下标为确定序号的位置继续发送了。 5. 超时重传机制双方在进行网络通信的时候发送方发出去的数据在一个特定的时间间隔内如果得不到对方的应答此时发送方就会进行数据重发这就是TCP的超时重传机制。需要注意的是TCP保证双方通信的可靠性一部分是通过TCP的协议报头体现出来的还有一部分是通过实现TCP的代码逻辑体现出来的。比如超时重传机制就是发送方在发送数据后开启了一个定时器若是在这个时间内没有收到刚才发送的数据的确认应答报文则会对报文进行重传这就是通过TCP的代码逻辑实现的而在TCP报头中是看不出来的。丢包的两种情况丢包分为两种情况一直种是发送的数据报文丢失了此时发送端在一定时间内收不到对应的响应报文就会进行超时重传。另一种情况是对方发来的响应报文丢包了此时发送端也会因为收不到对应的响应报文而进行超时重传。当出现丢包时发送方是无法辨别是发送的数据报文丢失了还是对方发来的响应报文丢失了因为这两种情况下发送方都收不到对方发来的响应报文此时发送方就只能进行超时重传。如果是对方的响应报文丢失而导致发送方进行超时重传此时接收方就会再次收到一个重复的报文数据但此时也不用担心接收方可以根据报头当中的32位序号来判断曾经是否收到过这个报文从而进行去重。需要注意的是当发送缓冲区当中的数据被发送出去后操作系统不会立即将该数据从发送缓冲区当中删除或者覆盖而是会让其保存在发送缓冲区当中以便后续可能的超时重传。直到收到响应报文后发送缓冲区中的这部分数据才可以删除或者覆盖。超时重传的等待时间超时重传的时间既不能太短也不能太长。如果超时重传的时间设置太长会导致丢包后长时间收不到对方的数据影响效率。超时重传的时间设置的太短会导致双方收到大量的重复报文可能对方发送的响应报文孩子网络中传输而并没有丢包但此时发送方就开始进行数据重传了并且发送大量重复报文也会浪费网络资源。因此超时重传的时间一定要是合理的最理想的情况就是找到一个最小的时间保证确认应答一定能在这个时间返回。但这个时间的长短是与网络环境有关的。网好的时候重传的时间可以设置短一点网卡的时候重传的时间可以设置的长一点1也就是说超时重传设置的等待时间一定是上下浮动的因此这个时间不可能是固定的某个值。 TCP为了保证无论在任何环境下都有比较高性能的通信会动态计算这个最大超时时间。 Linux中Unix和Windows也是如此超时以500ms为一个单位进行控制每次判定超时重发的时间都是500ms的整数倍。如果重发一次之后仍然得不到应答下次重发的时间就是 2 * 500ms如果再得不到应答继续乘2以此类推下去。当累计到一定的重传次数之后TCP就会认为是网络或对端主机出现了异常进而强制关闭连接。 6. 连接管理机制 TCP是面向连接的 TCP的各种可靠性机制实际都不是从主机到主机的而是基于连接的与连接是强相关的。比如一台服务器启动后有可能有多个服务器前来访问如果TCP不是基于连接的也就意味着服务器只有一个接收缓冲区此时各个客户端发来的数据都会拷贝到这个接收缓冲区当中此时这些数据就可能会收到干扰。而我们在TCP通信之前需要先建立连接就是因为TCP的各种可靠性都是基于连接的要保证数据传输的可靠性就必须先建立好连接。操作系统对连接的管理面向连接是TCP可靠性的一种只有在连接建立好之后可靠性才能得到保证而一台机器上可能存在大量的连接此时操作系统就要对这些连接做管理。操作系统在管理这些连接的时候需要“先描述再组织”在操作系统中有一个管理连接的结构体该结构体当中包含了连接的各种属性字段所有定义出来的连接结构体最终都会以某种数据结构组织起来此时操作系统对连接的管理就变成了对数据结构的增删查改。建立连接本质就是在操作系统中定义一个管理连接的结构体变量然后填充各种属性字段最后将其插入到管理连接的数据结构当中。断开连接本质也就是将某个连接从管理连接的数据结构删除释放连接占用的资源。因此连接的管理是有成本的这个成本就是管理连接结构体的时间成本和存储连接结构体的空间成本。 6.1 三次握手双方在使用TCP协议通信之前需要先建立连接这个建立连接的过程我们称之为三次握手。三次握手的过程以服务端和客户端为例当客户端要与服务器进行通信时需要先与服务器建立连接此时客户端会作为主动方先向服务器发送连接建立请求然后双方TCP在底层进行三次握手。第一次握手客户端向服务器发送的报文当中的SYN位被设置为1表示请求与服务器建立连接。第二次握手服务器收到客户端发来的连接请求之后紧接着向客户端发起连接请求并对客户端发起的连接请求进行响应此时服务器向客户端发送的报文中的SYN和ACK均被设置为1。第三次握手客户端收到服务器发来的报文后得知服务器收到了自己发送的连接请求并请求和自己建立连接最后客户端再向服务器发来的报文进行响应。需要注意的是客户端向服务器发起的连接建立请求是请求建立从客户端到服务端的通信连接而TCP是全双工通信因此服务器在收到客户端发来的连接建立请求后服务器也需要向客户端发起连接建立请求请求建立从服务器到客户端方法的通信连接。为什么是三次握手首先我们需要知道连接建议不是百分之百能成功的通信双方在进行三次握手时其中前两次握手能够保证被对方收到因为前两次握手都有对应的下一次握手对其进行响应但是第三次握手是没有对应的响应报文的如果第三次握手客户端发送的ACK报文丢失了那么连接就会建立失败。建立连接不管采用几次握手最后一次握手的可靠性都是不能保证的。建立连接的建立都不说百分之百成功的因此建立连接时具体采用几次握手的依据实际是看几次握手时的优点更多。因为TCP是全双工通信的因此建立连接的核心要务就是验证双方的通信信道是否是连通的。而三次握手恰好是验证双方通信信道的最小次数通过三次握手后双方就都能知道自己和对方是否都能够正常发送和接收数据。在客户端看来把它收到服务器发来第二次握手时说明自己发出的第一次握手被对方可靠地收到了证明自己能发送以及服务器能接收同时当自己收到服务器发来的第二次握手时也就证明服务器能发以及能收此时就证明自己和服务器都是能发能收的。在服务器看来当它收到客户端发来第一次握手时证明客户端能发以及自己能收而当它收到客户端发来的第三次握手时说明自己发出的第二次握手被对方可靠地收到了也就证明自己能发以及客户端能收此时就证明自己和客户端都是能发能收的。既然三次握手已经能够验证双方通信信道是否正常了那么三次以上的握手当然也是可以验证的但既然三次已经能验证了就没有必要再进行更多次的握手了。三次握手能够保证连接建立时的异常连接挂在客户端当客户端收到服务器发来的第二次握手时客户端就已经证明双方通信是连通的了因此当客户端发出第三次握手之后这个连接就已经在客户端建立了。而只有当服务器收到客户端发来的第三次握手后服务器才知道双方通信信道是连通的此时在服务器端才会建立对应的连接。因此双方在进行第三次握手建立连接时双方建立连接的时间点也是不一样的。如果客户端最后发出的第三次握手丢包了此时在服务端就不会建立对应的连接而在客户端就需要短暂地维护一个异常的连接。而维护连接是需要时间成本和空间成本的因此三次握手还有一个好处就是能够保证连接建立异常时这个异常连接是挂在客户端的而不会影响到服务器。虽然此时客户端也需要短暂维护这个异常但客户端的异常连接不会特别多不像服务器一旦多个客户端建立连接时都失败了此时服务器端就需要耗费大量资源来维护这些异常连接。此外建立连接失败时的异常连接不会一直维护下去。如果服务端长时间收不到客户端发来的第三次握手就会将第二次握手进行超时重传此时客户端就有机会重新发出第三次握手。或者当客户端认为连接建立好后向服务器发送数据时此时服务器会发现没有和该客户端建立连接时而要求客户端重新建立连接。因此这里给出两个连接时采用三次握手的理由三次握手是验证双方通信信道的最小次数能够让建立的连接尽快建立起来。三次握手能够保证连接建立时的异常连接挂在客户端。三次握手时的状态变化三次握手时的状态变化如下最开始客户端和服务端都处于CLOSED状态服务器为了能够接收客户端发来的连接请求需要由CLOSED状态变为LISTEN状态此时客户端就可以向服务器发起三次握手了当客户端发起第一次握手后状态变为SYN_SENT状态处于LISTEN状态的服务器收到客户端的连接之后将该连接放入内核等待队列中并向客户端发起第三次握手此时服务器的状态变为SYN_RCVD当客户端收到服务器发来的第二次握手后紧接着向服务发送最后一次握手此时客户端的连接已经建立状态变为ESTABLISHED而服务端收到客户端发来的最后一次握手后连接也建立成功此时服务器的状态也变为ESTABLISHED 至此三次握手结束双方可以进行数据交互了。套接字和三次握手之间的关系在客户端发起连接请求之前服务器需要先进入LISTEN状态此时就需要服务器调用对应listen函数。当服务器进入LISTEN状态后客户端就可以向服务器发起三次握手了此时客户端对应调用的就是connect函数。需要注意的是connect函数不参与底层的三次握手connect函数的作用只是发起三次握手。当connect函数返回时要么是底层已经成功完成了三次握手连接建立成功要么是底层三次握手失败。如果服务器端与客户端成功完成了三次握手此时在服务器端就会建议一个连接但这个连接在内核的等待队列当中服务器端需要调用accept函数将这个建立好的连接提取上来。当服务器端将建立好的连接获取上来之后双方就可以通过read/recv以及write/send进行数据交互了。 6.2 四次挥手四次挥手的过程由于维护双方的连接是需要成本的所以在通信结束的时候我们就要断开连接这个断开连接的过程为四次挥手。第一次挥手客户端向服务端发送的报文中的FIN位被设置为1表示请求与服务端断开连接。第二次挥手服务端收到客户端发来的断开连接请求之后对其进行响应。第三次挥手服务端收到客户端断开连接的请求且已经没有数据需要发送给客户端的时候服务端就会向客户端发起断开连接请求。第四次挥手客户端收到服务端发来的断开连接请求后对其进行响应。四次挥手结束之后双方的连接才算是真正断开。为什么是四次握手由于TCP是全双工的建立连接的时候也需要建立双方的连接断开连接的时候也如此。在断开连接时不仅要断开从客户端到服务器方向的通信信道还要断开从服务器到客户端的通信信道其中每两次挥手就对应就是关闭一个方向的通信信道因此断开连接需要四次挥手。需要注意的是第二次挥手和第三次挥手不能合并在一起因为第三次挥手是服务端想要与客户端断开时发给客户端的请求而当服务器收到客户端断开连接的请求并响应之后服务器不一定会马上发起第三次挥手因为服务器可能还有某些数据要发送给客户端只有当服务器将这些数据发送完之后才会向客户端发起第三次挥手。四次挥手时的状态变化在挥手前客户端和服务器都处于连接建立后的ESTABLISHED装填。客户端为了与服务器断开连接主动向服务器发起连接断开请求此时客户端的状态变为FIN_WAIT_1。服务端收到客户端发来的连接断开请求后对其进行响应此时服务器的状态变为CLOSE_WAIT而客户端状态变为FIN_WAIT_2。当服务器没有数据需要发送给客户端时服务器会向客户端发起断开连接请求等待最后一个ACK到来此时服务器的状态变为LASE_ACK。客户端收到服务器发来的第三次挥手后会向服务器发送一个响应报文此时客户端进入TIME_WAIT装填。当服务器收到客户端发来的最后一个响应报文时服务器会彻底关闭连接变为CLOSE状态。而客户端则会等待一个2MSLMaximum Segment Lifetime报文最大生存时间才会进入CLOSED状态。至此四次挥手结束通信双方断开连接。套接字与四次挥手之间的关系客户端发起断开连接请求对应就是客户端主动调用close函数服务端发起断开连接请求对应就是服务端主动调用close函数一个close对应的就是两次挥手双方都要调用close因此就是四次挥手 CLOSE_WAIT 双方在进行四次挥手时如果只有客户端调用了close函数而服务器不调用close函数此时服务器就会进入CLOSE_WAIT状态而客户端则会进入FIN_WAIT_2状态。但只有完成四次挥手后连接才算真正断开此时双方才会释放对应的连接资源如果服务器没有主动关闭需要的文件描述符此时在服务器端就会存在大量处于CLOSE_WAIT状态的连接而每个连接都会占用服务器的资源最终就会导致服务器可用资源越来越少。因此如果不及时关闭不用的文件描述符除了会造成文件描述符泄漏以外可能也会导致连接资源没有完全释放这其实也是一种内存泄漏的问题。因此编写网络编程套接字代码时如果发现服务器端存在大量处于CLOSE_WAIT状态的连接此时就可以检查一下是不是服务器没有及时调用close函数关闭对应的文件描述符。 TIME_WAIT 如果客户端在发出第四次挥手之后立即进入CLOSED状态那么此时服务器就算进行超时重传也得不到客户端的响应因为客户端已经关闭了。服务器在经过若干次超时重发之后得不到响应的话最终也一定会将对应的连接关闭但在服务器不断进行超时重传期间还需要维护这条废弃的连接这样对服务器是非常不友好的。为了避免这种情况客户端在四次挥手之后并没有立即进入CLOSED状态而是进入到了TIME_WAIT状态进行等待此时要是第四次挥手的报文丢包了客户端也能收到服务器重发的报文进行响应。 TIME_WAIT状态存在的必要性客户端在进行四次挥手后进入TIME_WAIT状态如果第四次挥手的报文丢包了客户端在一段时间内仍然能够接收到服务器重发的FIN报文并对其进行响应能够较大概率保证最后一个ACK被服务器收到。客户端发出最后一次挥手时双方历史通信的数据可能还没有发送到对方。因此客户端四次挥手后进入TIME_WAIT状态还可以保证双方通信信道上的数据在网络中尽可能地消散。实际第四次挥手丢包后可能双方网络状态出现了问题尽管客户端还没有关闭连接也收不到服务器重发的连接断开请求此时客户端TIME_WAIT等若干时间最终也会关闭连接而服务器经过多次超时重传之后也会关闭连接。这种情况虽然让服务器维持了闲置的连接但毕竟是少数引入TIME_WAIT状态就是尽量让主动发起四次挥手的客户端维护这个成本。因此TCP并不能完全保证建立连接和断开连接的可靠性TCP保证的是建立连接之后以及断开连接之前双方通信数据的可靠性。 TIME_WAIT的等待时长是什么 TIME_WAIT的等待时长既不能太长也不能太短。太长会让等待方维持一个较长的等待时间的TIME_WAIT状态在这个时间内等待方也需要花费时间成本来维护这个连接这也是一种浪费资源的现象。太短可能没有达到我们的最初目的没有保证ACK被对方较大概率收到也没有保证数据在网络中消散此时TIME_WAIT的意义也就没有了。 TCP协议规定主动关闭连接的一方在四次挥手后要处于TIME_WAIT装填等待两个MSL的时间才能进入CLOSED状态。 MSL在RFC1122中规定为两分钟但是各个操作系统的实现不同比如在CentOS7上默认的值是60s我们可以通过以下命令来查看MSL的值。 TIME_WAIT的等待时长设置为两个MSL的原因 MSL是TCP报文的最大生存时间因此TIME_WAIT状态储蓄存在2MSL的话就能保证两个传输方向上的尚未被接收或迟到的报文段都已经消失。同时也是在理论上保证最后一个报文可靠到达的时间。 7. 流量控制 TCP支持根据接收端的接收数据的能力来决定发送端发送数据的速度这个机制叫做流量控制。接收端处理数据的速度是有限的如果发送端是发送的太快导致接收端的缓冲区被打满此时发送端继续发送数据就会造成丢包等问题。因此接收方可以将自己接收数据的能力告知发送端从而让发送端控制自己发送数据的速度。接收端将自己可以接收数据的缓冲区大小放入TCP首部中的“窗口大小”字段通过ACK通知发送端。窗口大小字段越大说明网络的吞吐量越高。接收端一旦发现自己的缓冲区快慢了就会将窗口大小设置成一个更小的值通知给发送端。发送端接收到这个窗口之后就会减慢自己发送的速度。如果接收缓冲区满了就会将窗口值设置为0这时发送方不再发送数据但需要定期发送一个窗口探测数据段使接收端把窗口大小告诉发送端。当发送端得知接收端接收数据的能力为0时会停止发送数据此时发送端会通过以下两种方式来得知何时可以继续发送数据。等待告知接收端上层将接收缓冲区的数据读走后接收端会向发送端发送一个TCP报文主动将自己的窗口大小告知发送端发送端得知接收端的接收缓冲区有空间后就可以继续发送数据了。主动询问发送端每隔一段时间向接收端发送报文该报文不携带有效数据只是为了询问发送端的窗口大小直到接收端的接收缓冲区有空间后发送端就可以继续发送数据了。 16位数字最大表示为65535那TCP窗口最大就是65535吗理论上确实是这样的但实际上TCP报头当中40字节的选项字段中包含了一个窗口扩大因子M实际窗口大小是窗口字段的值左移M位得到的。第一次向对方发送数据时如何得知对方的窗口大小双方在进行TCP通信之前需要先进行三次握手建立连接而双方在握手时除了验证双方通信信道是否畅通以外还进行了其他信息的交互其中就包括告知对方自己的接收能力因此双方在还没有正式开始通信之前就已经知道了对方接收数据的能力所以双方在发送数据时是不会出现缓冲区溢出的问题的。 8. 滑动窗口连续发送多个数据双方在进行TCP通信时可以一次向对方发送多条数据这样可以将等待多个响应的时间重叠起来进而调高数据通信的效率。需要注意的是虽然双方在进行TCP通信时可以一次向对方发送大量的报文但不能将自己发送缓冲区当中的数据全部打包发送给对端在发送数据时还要考虑对方的接收能力。滑动窗口发送方可以一次发送多个报文给对方此时也就意味着发送出去的这部分报文当中有相当一部分数据是暂时没有收到应答的。其实可以将发送缓冲区的数据分为三部分已经发送并且已经收到ACK的数据已经发送但还没有收到ACK的数据还没有发送的数据发送缓冲区的第二部分就叫做滑动窗口。滑动窗口描述的是发送方不用等待ACK一次所能描述的数据最大量。滑动窗口存在的最大意义就是可以提高发送数据的效率滑动窗口的大小等于对方窗口大小与自身拥塞窗口大小的较小值因为发送数据不仅要考虑对方的接收能力还要考虑当前网络的状况。我们这里先不考虑拥塞窗口并且假设对方的窗口大小一直固定为4000此时发送方不用等待ACK一次所能发送的数据就是4000字节因此滑动窗口的大小就是4000字节。现在连续发送1001~2000、 2001~3000、 3001~4000、 4001 ~ 5000这四个段的时候不需要等待任何ACK可以直接进行发送。当收到对方响应数据的确认序号为2001时说明1001~2000的数据已经被对方收到了此时该数据段应该被纳入发送缓冲区当中的第一部分而由于我们假设对方的窗口大小一直是4000因此滑动窗口现在可以向右移动继续发送5001 ~ 6000的数据以此类推。滑动窗口越大则网络的吞吐率越高同时也说明对方的接收能力很强。当发送方发送出去的数据段陆陆续续收到对应的ACK时就可以将收到ACK的数据段归置到滑动窗口的左侧并根据当前的滑动窗口大小决定是否需要将滑动窗口右侧的数据归置到滑动窗口当中。 TCP的重传机制要求暂时保存发出但未收到确认的数据而这部分数据实际就位于滑动窗口当中只有滑动窗口左侧的数据才是可以被覆盖或者删除的因为这部分数据才是发送并被对方可靠地收到了所以也可以支持TCP的重传机制。滑动窗口一定会整体右移吗滑动窗口不一定会整体右移的以刚才的例子为例假设对方已经收到了1001~2000的数据段并进行了响应但对方上层一直不从接收缓冲区读取数据此时当对方收到1001 ~ 2000的数据段时对方的窗口大小就由4000变为了3000。当发送端收到对方的响应序号为2001时就会将1001~2000的数据归置到滑动窗口的左侧但此时由于对方的接收能力变为了3000而当1001 ~ 2000的数据归置到滑动窗口的左侧之后滑动窗口也不会整体右移而是会将大小变为3000。因此滑动窗口是不一定在一直右移的随着对方接收数据能力大小的变化滑动窗口的大小也在变化。如何实现滑动窗口 TCP接收和发送缓冲区都可以看作一个字符数组而滑动窗口实际就可以看作是两个指针限定的一个范围比如我们用start指向滑动窗口的左侧end指向的是滑动窗口的右侧此时在start和end区间范围内的就可以叫做滑动窗口。当发送端收到对方的响应时如果相应当中的确认序号为x窗口大小为win此时就可以将start更新为x而将end更新为startwin。丢包问题当发送端一次发送多个报文数据时此时的丢包情况也可以分为两种。情况一数据包已经递达ACK丢包在发送端连续发送多个报文数据时部分ACK丢包并不要紧此时可以通过后续的ACK进行确认。比如图中2001 ~ 3000和4001 ~ 5000的数据包对应的ACK丢失了但只要发送端收到了最后5001 ~ 6000数据包的响应此时发送端也就知道2001 ~ 3000 和 40001 ~ 5000的数据包是收到了的。因为如果接收方收到了确认序号6001之后就可以认为1 ~ 6000的数据都已经收到了下次发送应该从序号为6001的数据开始发送。情况二数据丢包了当1001 ~ 2000的数据包丢失之后接收端会一直收到确认序号为1001的响应报文就是在提醒发送端“下一次应该从序号为1001的字节数据开始发送”。如果发送端连续收到三次确认序号为1001的响应报文此时就会将1001 ~ 2000的数据包重新进行发送。此时当接收端收到1001 ~ 2000的数据包之后就会直接发送确认序号为6001的响应报文因为2001 ~ 6000的数据接收端其实在之前就已经收到了。这种机制被称为“高速重发机制”也叫做“快重传”。需要注意的是快重传需要在大量的数据重传和个别的数据重传之间做平衡实际上这个例子中发送端并不知道是1001 ~ 2000的数据丢包了当发送端重复收到确认序号为1001的响应报文时理论是哪个发送端将1001 ~ 7000的报文全部重传但是这样会造成大量数据被重新传送从而导致网络资源的浪费。所以发送端可以先尝试将1001 ~ 2000的数据进行重传然后再更具重发后得到的响应报文判断是否需要重传其他数据。滑动窗口的数据一定都还没有被对方收到吗滑动窗口中的数据是暂时还没有收到对应响应报文的数据但并不是说滑动窗口中的数据一定没有被对方收到滑动窗口中可能有一部分数据对方已经收到了但是可能因为滑动窗口内左侧的数据出现了丢包等情况导致收不到对端的响应报文。例如图中的1001 ~ 2000的数据包如果在传输过程中丢包了此时虽然2001 ~ 5000的数据对方都收到了但此时对方发过来的确认序号为1001这时候不能确定对端是否收到了后面的数据滑动窗口也是不能移动的。直到成功补发1001之后的数据后对端发来5001的确认序号此时1001 ~ 5000的数据才能被归置到滑动窗口的左侧。快重传与超时重传快重传是能够快速进程数据的补发当发送端收到三次连续的应答之后就会触发快重传而不像超时重传一样需要通过设置重传定时器在一定的时间之后才能进行重传。虽然快重传能够快速地判定数据包丢失但是快重传并不难取代超时重传因为有时数据包丢失之后可能不能收到对方连续三次相同的应答此时就需要进行超时重传。因此快速重传能提高效率但是超时重传也是必不可少的 9. 拥塞控制两台主机在进行TCP传输的过程中出现个别数据丢包是很正常的此时可以通过快重传或者超时重发对数据包进行补发。但是如果出现了大量丢包时就不能认为是正常现象了。 TCP通信不仅考虑了通信双端主机的问题还考虑了网络的问题。流量控制考虑的是对端接收缓冲区的接收能力进而控制发送方发送数据的速度避免对端接收缓冲区溢出。滑动窗口考虑的是发送端不用等待ACK而一次所能发送数据的最大量进而提高发送端发送数据的效率。拥塞窗口考虑的是双方网络的问题如果发送数据大小超过了拥塞窗口的大小就可能会引起网络拥塞。双方通信时出现少量的丢包时TCP是允许的但是如果出现了大量的丢包TCP就会认为是网络出现了拥塞问题。如何解决网络拥塞问题网络出现大面积瘫痪时一定是网络中不部分主机共同作用的结果。如果网络中的主机在同一时间内发送了大量数据到网络中此时位于网络中某些关键节点的路由器就可能会排了很长的报文最终导致报文无法在超时时间内到达对端主机此时也就会导致丢包等问题。当网络出现拥塞问题时通信双方虽然没有很好的解决方案但它们至少可以做到不加重网络的负担。双方通信时出现大量丢包的情况不应该立即将这些数据进行重传而应该选择少发或者是不发等待网络状况恢复之后再选择慢慢恢复发送数据的速率。需要注意的是网络拥塞时影响的不只是一台主机而应该是该网络当中的所有主机此时该网络中所有主机都会使用避免拥塞算法。因此拥塞控制看似是一台主机上采取的策略其实在网络崩溃之后该网络中所有主机都用采用拥塞控制的策略这样才能有效缓解网络拥塞问题。拥塞控制虽然滑动窗口可以高效可靠地发送大量数据但是有可能当前的网络状况是拥塞的此时贸然发送大量数据会加重网络的拥塞问题。因此TCP引入慢启动机制在刚开始通信的时候先发送少量数据摸清当前网络状况再决定要安装多大的速度进行发送。刚开始放数据的时候拥塞窗口的值为1每收到一个ACK应答时拥塞窗口的值就乘以2。如果不考虑对方接收数据的能力俺么滑动窗口的大小就是取决于拥塞窗口的大小的此时拥塞窗口的大小和滑动窗口的大小就是按指数级增长的。但是指数级增长是非常快的如果拥塞窗口的值一直以指数的方式进行增长就有可能导致网络出现拥塞。为了避免短时间内再次导致网络拥塞不能让拥塞窗口按指数级的方式进行增长。此时就引入了慢启动的阈值当拥塞窗口的大小超过这个阈值之后拥塞窗口就是线性增长的。当TCP刚开始启动的时候慢启动阈值设置为对方窗口大小的最大值。在每次超时重发的时候慢启动阈值会变成当前拥塞窗口的一般同时拥塞窗口的值被置为1如此循环下去。主机在进行网络通信的时候实际就是在不断进行指数增长加法增大和乘法减小。需要注意的是在同一网络中不是所有主机此时的网络状态都是一样的每台主机认为拥塞窗口的大小不一样是一样的。即便是同区域的两台主机在同一时刻认为拥塞窗口的大小也不一定是完全相同的。因此在同一时刻可能一部分主机正在进行网络通信而另一部分主机可能已经发送网络拥塞了。 10. 延迟应答由于TCP的流量控制机制接收端进行接收数据后如果立刻返回ACK应答此时由于数据还没有被消费那么返回的窗口大小此时就是缓冲区中剩下的那一小部分区域也就是说此时返回的窗口可能是比较小的。假设接收缓冲区大小为1M如果对方一次发送600K的数据此时立刻进行ACK应答那么返回的窗口大小就是1M - 600K 400K。但实际上接收端数据数据的速度是很快的这400K的数据很快就被处理掉了。在这种情况下如果接收端返回的窗口更大一些它也能处理的过来。于是接收端最好在收到消息之后延迟一小段时间再进行应答这样返回的窗口更大一些。延时应答不是为了提高网络传输的可靠性而是流出一点时间让接收缓冲区的上层及时消费数据这样返回的窗口就跟大一些从高增大网络吞吐量提高数据的传输效率。数据包的延迟应答有数量限制和时间限制延迟应答的数据包的数量不能超过一定的范围且延迟应答的时间不能超过最大延迟时间这个时间不会导致误超时重传。延迟应答具体的数量和超时时间不同操作系统有差异一般N取2超时时间取200ms。 11. 捎带应答捎带应答其实是TCP通信时最常规的一种方式就好比主机A给主机B发送了一条消息当主机B收到这条消息之后需要对其进行ACK应答但是刚好主机B也要给主机A发送消息此时这个ACK就可以搭顺风车和消息一起发送过去。既发送数据又完成了对收到数据的响应这种方式就叫做捎带应答。有了捎带应答双方通信就可以减少单纯的确认报文了。此外由于捎带应答的报文携带了有效数据那么此时对方也要回发一个ACK响应这样的话不仅可以保证报文被对方成功收到了也能保证发给对方的响应被成功收到了。 12. 面向字节流当创建一个TCP的socket时会同时在内核中创建一个发送缓冲区和一个接收缓冲区。调用write函数就是将数据写入到发送缓冲区当中此时write函数就返回了缓冲区中的数据又TCP在合适的时候进行发送。如果发送的字节数太长TCP会将其拆成多个数据包进行发送。而如果字节数太短TCP不会立刻发送而是会等到合适的时机再进行发送。接收数据的时候数据从网卡驱动程序到内核的接收缓冲区再由read函数去读取数据。read函数读取的字节数也是可以根据用于意愿而调整的。由于缓冲区的存在TCP程序的读写不需要一一对应。比如写100个字节数据时可以调用一次write函数。读100个字节数据的时候可以读100次每次读1个字节。对于TCP来说它并不关心缓冲区内的是什么数据在TCP看来都是一个个的字节数据而已。至于怎么解析数据由应用层决定TCP只负责发送这就是面向字节流。 13. 粘包问题什么是粘包问题粘包问题通常出现在使用TCP作为传输层协议的网络通信总。TCP是一个面向连接的协议它保证传输的可靠性但是并不难保证数据的边界。站在应用层来看TCP是一个一个地发送报文按顺序放在缓冲区中但是站在应用层的角度看到的只是一串连续的数据。在发送方连续发送多个小数据包时TCP协议会将它们组合成较大的数据块进行传输而接收方在接收数据时并不知道原始的数据边界因此就无法正确地将其拆分开来。这就是所谓的粘包问题。如何解决粘包问题要解决粘包粘包问题本质就是要明确报文和报文之间的边界。对于定长的包保证每次都按固定大小读取即可。对于变长的包可以在报头的位置约定一个包总长度的字段从而就知道了包的结束位置。比如HTTP报头当中就包含Content-Length属性表示正文的长度。对于变长的包还可以在包和包之间用明确的分隔符。因为应用层协议是程序员自己来定的只要保证分隔符不喝正文冲突即可。 UDP是否存在粘包问题对于UDP如果还没有上层交付数据UDP的报文长度依然存在同时UDP是一个一个把数据交付给应用层的有很明确的数据边界。站在应用层的角度使用UDP的时候要么收到完整的UDP报文要么不收。不会出现收一部分的情况。因此UDP是不存在粘包问题的根本原因就是UDP报头当中的16位UDP长度记录了UDP报文的长度因此UDP在底层的时候就把报文和报文之间的边界明确了。而TCP存在粘包问题就是因为TCP是面向字节流的TCP报文直接没有明确的边界。 14. TCP异常情况进程终止当客户端正常访问服务器时如果客户端突然崩溃了此时建立好的连接会怎样当一个进程在正常连接的时候退出该进程曾经所占用的文件描述符都会被操作系统自动关闭也就是说操作系统会去调用close函数此时操作系统在底层仍然会进行四次握手然后释放对应的资源。TCP底层也仍然可以发送FIN和正常关闭连接没有什么区别。机器重启当客户端正常访问服务器时如果将客户端重启此时建立好的连接会怎样当客户端机器重启之后操作系统会先杀掉所有进程之后再进行关机重启此时双操作系统也会正常完成四次挥手然后释放对应的连接资源。机器掉电/网线断开当客户端正常访问服务器时如果客户端突然掉线了此时建立好的连接会怎样当客户端掉线之后服务器在短时间之内无法知道客户端掉线了因此在服务器端会维持与客户端建立的连接但这个连接也不会一直维持因为TCP是有保活策略的。服务器会定期查看客户端的存在状况检查对方是否在线如果连接多次都没有收到ACK响应那么服务器就会关闭这条连接。此外客户端会可能会定期向服务器“报平安”如果服务器长时间没有收到客户端的消息此时服务器也会将对应的连接关闭。其中服务器定期询问客户端的存在状态的做法叫做基于保活定时器的一种心跳机制是由TCP实现的。此外应用层的某些协议也有一定类似的检测机制例如基于长连接的HTTP也会定期检测对方的存在状态。 15. 总结从文章的长度也可以看出TCP协议是非常复杂的它之所以这么复杂就是因为它既要保持可靠性同时又要尽可能地提高性能。可靠性检验和序列号确认应答超时重传连接管理流量控制拥塞控制提高性能滑动窗口快速重传延迟应答捎带应答 TCP的这些机制有些是通过协议来体现的有些是通过代码逻辑实现的。 TCP定时器此外TCP当中还设置了各种定时器重传定时器为了控制丢失的报文段或者丢弃的报文段也就是对报文段确认的等待时间。坚持定时器专门为对方零窗口通知而设立的也就是向对方发送窗口探测的时间间隔。保活定时器为了检查空闲连接的存在状态也就是向对方发送探查报文的时间间隔。TIME_WAIT定时器双方在四次挥手后主动断开连接的一方需要等待的时长。理解传输控制协议 TCP的各种机制实际都没有谈及数据真正的发送这些都叫做传输数据的策略。TCP协议是在网络数据传输当中做决策的它提供的是理论支持比如TCP只是要求发出的报文在一段时间内收不到ACK应答就进行超时重传而数据真正的发送实际是由底层的IP和MAC帧完成的。 TCP做决策IPMAC做执行我们将它们统称为通信细节它们最终的目的就是将数据传输到对端主机。而传输数据的目的是什么则是由应用层决定的因此应用层决定的是通信的意义而传输层及其往下的各层决定的是通信的方式。 16. 基于TCP的应用层协议常见基于TCP的应用层协议如下 HTTP超文本传输协议HTTPS安全数据传输协议SSH安全外壳协议Telnet远程终端协议FTP文件传输协议SMTP电子邮件传输协议谈谈云服务器 SSH也就是XShell的底层协议我们使用XShell时实际就是使用XShell的ssh客户端连接我们的云服务器。我们在使用XSheel时可以通过 ssh 用户名主机名IP地址的方式连接云服务器。实际因为我们的云服务器中存在sshd这样的服务。这实际就是ssh服务的服务器端我们使用的 ssh 用户名主机名命令当中的ssh实际就是ssh的客户端因此我们连接云服务器的本质就是在用ssh的客户端连接ssh服务器。使用netstat可以查看对应的ssh服务我们在云服务上敲出的各种命令最终会通过网络编程套接字的方式发送给云服务器由服务器来对我们的命令进行各种解释进而执行对应的动作。

查看全文

http://www.zqtcl.cn/news/577846/