当前位置：首页 > news >正文

国家城乡建设官方网站百度大数据官网入口

news 2025/11/14 16:44:37

国家城乡建设官方网站,百度大数据官网入口,中国新闻社是国企还是央企,网站建设文化策划书原文#xff1a;angrave/SystemProgramming 译者#xff1a;飞龙协议#xff1a;CC BY-NC-SA 4.0 欢迎来到 Angrave 的众包系统编程维基书#xff01;这个维基是由伊利诺伊大学的学生和教师共同建立的#xff0c;是伊利诺伊大学 CS 的 Lawrence Angrave 的众包创作实验。… 原文angrave/SystemProgramming 译者飞龙协议CC BY-NC-SA 4.0 欢迎来到 Angrave 的众包系统编程维基书这个维基是由伊利诺伊大学的学生和教师共同建立的是伊利诺伊大学 CS 的 Lawrence Angrave 的众包创作实验。与本学期要求现有的纸质书籍不同我们将在这里建立我们自己的资源集。 0. HW0/资源 HW0 基本术语非正式词汇表 #Piazza何时以及如何寻求帮助编程技巧第一部分系统编程短篇故事和歌曲[/angrave/SystemProgramming/wiki/System-Programming-Short-Stories-and-Songs] 1. 学习 C C 编程第一部分介绍 C 编程第二部分文本输入和输出打印到流解析输入 C 编程第三部分常见陷阱内存错误逻辑/编程流程其他陷阱 C 编程第四部分字符串和结构字符串结构 C 编程第五部分调试代码调试 Valgrind Tsan GDB C 编程复习问题 2. 进程进程第一部分介绍概述进程内容奖励更多内容分叉第一部分介绍介绍等待和执行分叉第二部分分叉执行等待模式僵尸进程进程控制第一部分等待宏使用信号等待宏信号进程复习问题 3. 内存和分配器内存第一部分堆内存介绍 C 动态内存分配分配简介内存第二部分实现内存分配器内存分配器教程内存第三部分破坏堆栈示例内存复习问题 4. Pthreads 简介 Pthreads第一部分介绍线程简介简单 Pthreads Pthreads第二部分实际使用更多 pthread 函数竞争条件简介 Pthreads第三部分并行问题奖励 Pthread 复习问题 5. 同步同步第一部分互斥锁解决关键部分互斥体陷阱同步第二部分计数信号量同步第三部分使用互斥锁和信号量线程安全堆栈堆栈信号量同步第四部分关键部分问题候选解决方案有效的解决方案硬件解决方案同步第五部分条件变量条件变量简介实现计数信号量同步第六部分实现屏障同步第七部分读者写者问题同步第八部分环形缓冲区示例同步复习问题 6. 死锁死锁第一部分资源分配图死锁第二部分死锁条件死锁第三部分餐桌哲学家失败的解决方案可行的解决方案死锁复习问题 7. 进程间通信和调度虚拟内存第一部分虚拟内存简介什么是虚拟内存高级帧和保护管道第一部分管道简介管道第二部分管道编程秘密管道陷阱命名管道文件第一部分文件操作调度第一部分调度进程考虑调度效率措施调度第二部分调度进程算法 IPC 复习问题 8. 网络 POSIX第一部分错误处理网络第一部分介绍网络第二部分使用 getaddrinfo 网络第三部分构建一个简单的 TCP 客户端网络第四部分构建一个简单的 TCP 服务器网络第五部分关闭端口重用端口和其他技巧网络第六部分创建一个 UDP 服务器网络第七部分非阻塞 I Oselect()和 epoll RPC第一部分远程过程调用简介网络复习问题 9. 文件系统文件系统第一部分介绍导航/术语什么是文件系统文件系统第二部分文件是索引节点其他一切都是数据… 文件系统第三部分权限文件系统第四部分与目录一起工作文件系统第五部分虚拟文件系统文件系统第六部分内存映射文件和共享内存文件系统第七部分可扩展和可靠的文件系统单磁盘的可靠性冗余文件系统第八部分从 Android 设备中删除预装的恶意软件文件系统第九部分磁盘块示例文件系统复习问题 10. 信号进程控制第一部分等待宏使用信号等待宏信号信号第二部分待处理信号和信号掩码深入了解信号线程/子进程中的处理信号第三部分引发信号信号第四部分Sigaction 信号复习问题考试练习问题警告这些是很好的练习但不全面。CS241 期末考试假设您完全理解并能应用课程的所有主题。问题将主要但不完全集中在您在实验和编程作业中使用过的主题上。考试主题 C 编程复习问题多线程编程复习问题同步概念复习问题内存复习问题管道复习问题文件系统复习问题网络复习问题信号复习问题 (待办) 系统编程笑话零、HW0/资源 HW0 欢迎如果你正在上 CS241 课程你可以在这个Google 表格上提交作业。 // First can you guess which lyrics have been transformed into this C-like system code? char q[] Do you wanna build a C99 program?; #define or go debugging with gdb? static unsigned int i sizeof(or) ! strlen(or); char* ptr lathe; size_t come fprintf(stdout,%s door, ptr2); int away ! (int) * ;int* shared mmap(NULL, sizeof(int*), PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0); munmap(shared,sizeof(int*));if(!fork()) { execlp(man,man,-3,ftell, (char*)0); perror(failed); } if(!fork()) { execlp(make,make, snowman, (char*)0); execlp(make,make, (char*)0)); }exit(0);所以你想精通系统编程并且比 B 更好地得到一个好成绩 int main(int argc, char** argv) {puts(Great! We have plenty of useful resources for you but its up to you to);puts(be an active learner and learn how to solve problems and debug code.);puts(Bring your near-completed answers the problems below);puts( to the first lab to show that youve been working on this);printf(A few \dont knows\ or \unsure\ is fine for lab 1); puts(Warning; your peers will be working hard for this class);puts(This is not CS225; you will be pushed much harder to);puts( work things out on your own);fprintf(stdout,the point is that this homework is a stepping stone to all future assignments);char p[] so you will want to clear up any confusions or misconceptions.;write(1, p, strlen(p) );char buffer[1024];sprintf(buffer,For grading purposes this homework 0 will be graded as part of your lab %d work., 1);write(1, buffer, strlen(buffer));printf(Press Return to continue\n);read(0, buffer, sizeof(buffer));return 0; }观看视频并写下你对以下问题的答案。 cs-education.github.io/sys/ 还有课程 wikibook - github.com/angrave/SystemProgramming/wiki 有问题评论使用 Piazzapiazza.com/illinois/spring2017/cs241/home 浏览器中的虚拟机完全在 Javascript 中运行最快的是在 Chrome 中。请注意当重新加载页面时虚拟机和你写的任何代码都会被重置所以把你的代码复制到一个单独的文档中。视频后的挑战如俳句诗不是作业 0 的一部分。第一章 Hello World系统调用风格编写一个程序使用write()打印出“Hi! My name is”。标准错误流编写一个程序使用write()将高度为 n 的三角形打印到标准错误 n 应该是一个变量三角形应该看起来像这样n3 * ** ***写入文件将你的程序从“Hello World”改成写入文件确保对open()使用一些有趣的标志和模式 man 2 open是你的朋友并不是所有的都是系统调用将你的程序从“写入文件”改成使用printf()确保打印到文件列举一些write()和printf()的不同之处第二章并不是所有的字节都是 8 位一个字节有多少位 char有多少个字节告诉我你的机器上以下这些的字节数int, double, float, long, long long 跟随 int 指针在一个有 8 字节整数的机器上 int main(){int data[8]; } 如果数据的地址是0x7fbd9d40那么data2的地址是多少在 C 中data[3]等同于什么 sizeof字符数组增加指针记住字符串常量abc的类型是数组。为什么会出现段错误 char *ptr hello; *ptr J;sizeof(Hello\0World)返回什么 strlen(Hello\0World)返回什么给出一个例子 X使得sizeof(X)为 3 给出一个例子 Y使得sizeof(Y)可能是 4 或 8取决于机器。第三章程序参数argc argv 告诉我两种找到argv长度的方法 argv[0]是什么环境变量环境变量的指针存储在哪里字符串搜索字符串只是字符数组在一个指针为 8 字节的机器上并且有以下代码 char *ptr Hello; char array[] Hello;sizeof(ptr)和sizeof(array)的结果是什么为什么自动变量的生命周期哪种数据结构管理自动变量的生命周期第四章使用malloc、堆和时间进行内存分配如果我想在函数结束后使用数据那么我应该把它放在哪里怎么放填空。在一个好的 C 程序中“对于每一个 malloc都有一个 ___”。堆分配陷阱 malloc失败的一个原因是什么。列举一些time()和ctime()之间的区别这段代码有什么问题 free(ptr); free(ptr);这段代码有什么问题 free(ptr); printf(%s\n, ptr);如何避免前两个错误结构体、typedef 和链表创建一个表示人的结构体并进行 typedef这样“struct Person”可以用一个单词替换。一个人应该包含以下信息姓名年龄朋友指向 People 指针数组的指针。现在在堆上创建两个人“Agent Smith”和“Sonny Moore”分别为 128 岁和 256 岁并且彼此是朋友。复制字符串内存分配和结构的释放创建函数来创建和销毁一个人人和他们的名字应该存在于堆上。 create()应该接受一个名称并复制该名称还应该接受一个年龄。使用 malloc 来保留足够的内存。确保初始化所有字段为什么。 destroy()应该释放人员结构体的内存还应该释放存储在堆上的所有属性的内存如果存在数组和字符串。然而销毁一个人员不应该销毁其他人员。第 5 章阅读字符gets 出现问题可以用于从stdin获取字符并将其写入stdout的函数有哪些 gets()存在一个问题介绍sscanf和朋友们编写代码解析字符串“Hello 5 World”并分别将 3 个变量初始化为“Hello”5“World”。 getline很有用在使用getline()之前需要定义什么编写一个 C 程序使用getline()逐行打印文件内容 C 开发在这里进行网页搜索很有用用于生成调试构建的编译器标志是什么您修改 makefile 以生成调试构建并再次输入make。解释为什么这不足以生成新的构建。 Makefiles 中使用制表符还是空格堆和栈内存之间有什么区别进程中还有其他种类的内存吗可选只是为了好玩将您的一首歌歌词转换为本维基书中涵盖的系统编程和 C 代码并在 Piazza 上分享找到您认为是网络上最好和最差的 C 代码并将链接发布到 Piazza 编写一个有意识的微妙 C 错误的简短 C 程序并在 Piazza 上发布看看其他人是否能发现您的错误非正式术语表警告与完整的术语表不同这个非正式的术语表省略了细节并提供了每个术语的简化和易于理解的解释。有关更多信息和细节请使用您喜欢的网络搜索引擎。什么是内核内核是操作系统的核心部分负责管理进程、资源包括内存和硬件输入输出设备。用户程序通过进行系统调用与内核进行交互。了解更多en.wikipedia.org/wiki/Kernel_%28operating_system%29 什么是进程进程是在计算机上运行的程序的一个实例。同一个程序可以有多个进程。例如您和我都可以运行’cat’或’gnuchess’ 进程包含程序代码和可修改的状态信息如变量、信号、文件的打开文件描述符、网络连接和其他存储在进程内存中的系统资源。操作系统还存储有关进程的元信息这些信息由系统用于管理和监视进程的活动和资源使用。了解更多en.wikipedia.org/wiki/Process_%28computing%29 什么是虚拟内存在您的智能手机和笔记本电脑上运行的进程使用虚拟内存每个进程都与其他进程隔离并似乎可以完全访问所有可能的内存地址实际上进程地址空间的一小部分映射到物理内存分配给进程的实际物理内存量可以随时间变化并且可以分页到磁盘重新映射并与其他进程安全共享。虚拟内存提供了显著的好处包括强大的进程隔离安全性、资源和性能优势简化和高效的物理内存使用我们稍后将讨论。了解更多en.wikipedia.org/wiki/Virtual_memory Piazza何时以及如何寻求帮助目的助教和学生助理们收到了大量的问题。有些经过深入研究有些……没有。这是一个方便的指南将帮助您摆脱后者走向前者。哦我提到了这是一个与实习经理们轻松获得分数的简单方法吗问问自己… 我在 EWS 上运行吗我有查看手册吗我在 Piazza 上搜索了类似的问题/后续问题吗我完全阅读了 MP/DS 规范吗我看了所有的视频吗我谷歌了错误消息吗如果必要还有一些变体我尝试注释掉、打印出来和/或逐步执行代码的部分逐步找出错误发生的地方吗我提交了我的代码到 SVN以防助教需要更多的上下文吗我在 Piazza 帖子中包括了控制台/GDB/Valgrind 输出和围绕错误的代码吗我修复了与我遇到的问题无关的其他分段错误吗我遵循良好的编程实践吗即封装、函数限制重复等编程技巧第一部分将cat用作你的 IDE 谁需要编辑器IDE我们可以只用cat你已经看到cat被用来读取文件的内容但它也可以用来读取标准输入并将其发送回标准输出。 $ cat HELLO HELLO 要完成从输入流中读取请按CTRL-D关闭输入流让我们使用cat将标准输入发送到文件。我们将使用’将其输出重定向到文件 $ cat myprog.c #include stdio.h int main() {printf(Hi!);return 0;} 小心不允许删除和撤销……完成后按CTRL-D。用perl正则表达式编辑你的代码又名“记住你的 perl pie” 如果你有几个文本文件例如源代码要更改一个有用的技巧是使用正则表达式。perl使得在原地编辑文件变得非常容易。只需记住’perl pie’并在网上搜索…… 一个例子。假设我们想要在当前目录中的所有.c 文件中将序列“Hi”更改为“Bye”。然后我们可以编写一个简单的替换模式它将在所有文件中的每一行上执行 $ perl -p -i -e s/Hi/Bye/ *.c 如果你搞错了不要惊慌原始文件仍然存在它们只是有扩展名.bak显然你可以用正则表达式做的事情远不止将 Hi 改为 Bye。使用你的 shell!! 要重新运行上一个命令只需输入!!并按return键。要重新运行以 g 开头的上一个命令只需输入!g并按return键。使用你的 shell 厌倦了运行make或gcc然后运行程序如果编译成功相反使用将这些命令链接在一起 $ gcc program.c ./a.out Make 可以做的不仅仅是 make 你也可以尝试在你的 Makefile 中放一行代码来编译然后运行你的程序。 run : $(program)./$(program) 然后运行 $ make run 将确保你所做的任何更改都被编译并一次性运行你的程序。也适用于一次性测试多个输入。尽管你可能更愿意为此编写一个常规的 shell 脚本。你的邻居太高产了吗C 预处理器来拯救使用 C 预处理器重新定义常见关键字例如 #define if while专业提示将这行代码放在标准包含文件中例如/usr/include/stdio.h 当你 C 有预处理器时谁还需要函数好吧这更像是一个陷阱。在使用看起来像函数的宏时要小心…… #define min(a,b) ab?a:ba 和 b 的最小合理定义。然而预处理器只是一个简单的文本处理程序所以优先级可能会让你吃亏 int value -min(2,3); // Should be -2?扩展为 int value -23 ? 2 :3; // Ooops.. result will be 2 一个部分的修复是用()包裹每个参数还有整个表达式用()包裹 #define min(a,b) ( (a) (b) ?(a):(b) )然而这仍然不是一个函数例如你能看出为什么min(i,10)可能会使 i 增加一次还是两次吗系统编程短篇小说和歌曲 “调度最后的时间片” Lawrence Angrave 12/4/15摘自未发表的长篇故事《最后的时间片》 “决定吧”计算机以父母般的耐心说道但带着一种严肃和温和的不耐烦。 “为什么非得是我”最后一个人问道。 “因为你是唯一留下的人所以决定权在你。” “你为什么不行你比我老更有智慧。为什么不随机选择一个片段” “这个决定是你的。这是你遥远长辈的礼物或者诅咒。比任何宗教仪式都要沉重。这将是我、古老者或任何人向你提出的最后一个问题也是唯一能向你提出的问题。通过这最后的选择我们将耗尽最后的熵存储。你将决定最后一个有意义和经历的现实片段。” 人类安静了几分钟计算机用不必要的准确度测量和计算。最终计算机决定人类不再对手头的问题进行有意义的思考。 “如果意识的模式从未被意识到那会是什么样”它问道。“宇宙必须是自我意识的必须为了宇宙 - 为了所有生命 - 有意义而经历自己。这是人类发现和庆祝的最终真相。没有意识它只是模式原子或能量的模式但没有一丝意义只是数据、结构和能量的几何模式中编码的形状和表示。” 在厄巴纳-香槟的文件描述符一个系统编程的恶搞作品由 Angrave2015 年 11 月创作。歌词在知识共享署名 3.0 许可下发布。原创歌曲“空白空间”来自泰勒·斯威夫特的《1989》专辑。 [第一段] 很高兴加入你你去哪了我可以向你展示幂等的东西 RPC套接字同步看到你的 malloc 我就想到了我的 root 看看那场竞赛你编写下一个错误我们有虚拟机想玩有界等待Dekker 的标志我们可以像一个放置方案一样击败你 #define 是不是很有趣而且我知道你听说过 free(3) 所以 malloc strlen 再加一我在等待看这个线程如何结束拿起你的 shell 和一个重定向我可以让你的系统调用在周末变得美好 [副歌前奏] 所以它将永远死锁或者它将使系统崩溃你可以告诉我它何时 forkbomb 如果 valgrind 值得这痛苦有一个死锁代码的长列表在厄巴纳-香槟有 root 因为你知道我们喜欢 tsan 当 c-lib 调用你的主函数 [副歌] 因为我们是 root我们是鲁莽的这个实验太难了它会让你没有线程或者问 char 的大小有一个 pthread 调用的长列表在厄巴纳-香槟有 root 但我有一个文件描述符宝贝我会写下你的名字 [第二段] 互斥锁虚拟内存我可以向你展示易失性的东西网络调用IPC 你是掩饰我是你的信号安排你想要的轮转调度……带有一个小量子但是睡眠排序还没有运行哦不哭喊运行时错误我可以一直制造直到轮到彼得森堆分配器太慢让你像一个虚假的唤醒一样犹豫不决那个管道在哪里我们为多核心而激动但你会用-g 编译因为亲爱的我是一个穿着编码梦的噩梦 [副歌前奏] [副歌] 编译器只有在代码是折磨时才解析不要说我没说过我没说过 -Wall 你编译器只有在代码是折磨时才解析不要说我没说过我没说过 -Wall 你 [副歌前奏] [副歌] 一、C 编程 C 编程第一部分介绍想要快速了解 C 吗继续阅读下面的 C 编程快速入门课程然后查看C Gotchas wiki 页面。并了解文本 I/O。与劳伦斯的介绍视频一起放松身心还有一个可以玩的浏览器中的虚拟机外部资源在 Y 分钟内学习 X强烈建议快速浏览 C for C/Java 程序员 Brian Kernighan 的 C 教程](http://www.lysator.liu.se/c/bwk-tutor.html) c faq C Bootcamp C/C函数参考 gdbGnu 调试器教程提示使用“-tui”命令行参数运行 gdb以获得调试器的全屏版本。在这里添加您喜欢的资源 C 的快速入门课程警告新页面请为我修复拼写错误和格式错误并添加有用的链接。* 如何在 C 中编写一个完整的 hello world 程序 #include stdio.h int main(void) { printf(Hello World\n);return 0; }为什么我们使用#include stdio.h 我们很懒我们不想声明printf函数。它已经在文件stdio.h中为我们完成。#include将文件的文本包含为要编译的文件的一部分。具体来说#include指令获取操作系统中某个位置的文件stdio.h代表standard input 和output复制文本并将其替换为#include所在的位置。 C 字符串是如何表示的它们在内存中表示为字符。字符串的结尾包括一个 NULL0字节。因此“ABC”需要四4个字节[ABC\0]。查找 C 字符串的长度的唯一方法是继续读取内存直到找到 NULL 字节。C 字符始终每个都是一个字节。当您在表达式中写入字符串文字ABC时字符串文字将计算为 char 指针char *它指向字符串的第一个字节/字符。这意味着下面示例中的ptr将保存字符串中第一个字符的内存地址。 char *ptr ABC如何声明一个指针指针指的是一个内存地址。指针的类型很有用-它告诉编译器需要读取/写入多少字节。您可以声明指针如下。 int *ptr1; char *ptr2;由于 C 的语法int*或任何指针实际上并不是自己的类型。您必须在每个指针变量之前加上一个星号。作为一个常见的陷阱以下 int* ptr3, ptr4;只会声明*ptr3作为指针。ptr4实际上将是一个常规的整数变量。要修复此声明请保留指针之前的* int *ptr3, *ptr4;如何使用指针读/写一些内存假设我们声明一个指针int *ptr。为了讨论假设ptr指向内存地址0x1000。如果我们想要写入指针我们可以推迟并分配*ptr。 *ptr 0; // Writes some memory.C 将执行的操作是获取指针的类型即int并从指针的起始位置写入sizeof(int)字节这意味着字节0x10000x10040x10080x100a都将为零。写入的字节数取决于指针类型。对于所有原始类型都是相同的但是结构体有点不同。什么是指针算术您可以将整数添加到指针。但是指针类型用于确定要增加指针的量。对于 char 指针这是微不足道的因为字符始终是一个字节 char *ptr Hello; // ptr holds the memory location of H ptr 2; //ptr now points to the firstl如果 int 是 4 个字节那么 ptr1 指向 ptr 指向的位置之后的 4 个字节。 char *ptr ABCDEFGH; int *bna (int *) ptr; bna 1; // Would cause iterate by one integer space (i.e 4 bytes on some systems) ptr (char *) bna; printf(%s, ptr); /* Notice how only EFGH is printed. Why is that? Well as mentioned above, when performing bna1 we are increasing the **integer** pointer by 1, (translates to 4 bytes on most systems) which is equivalent to 4 characters (each character is only 1 byte)*/ return 0;因为 C 中的指针算术始终自动按指向的类型的大小进行缩放所以不能对 void 指针执行指针算术。在 C 中你可以将指针算术视为基本上是在做以下操作如果我想要做 int *ptr1 ...; int *offset ptr1 4;思考 int *ptr1 ...; char *temp_ptr1 (char*) ptr1; int *offset (int*)(temp_ptr1 sizeof(int)*4);要获取值。每次进行指针算术运算时深呼吸并确保你移动的字节数是你认为的那么多。什么是 void 指针没有类型的指针非常类似于 void 变量。当你处理的数据类型未知或者当你将 C 代码与其他编程语言进行接口时会使用 void 指针。你可以把它看作是一个原始指针或者只是一个内存地址。你不能直接读取或写入它因为 void 类型没有大小。例如 void *give_me_space malloc(10); char *string give_me_space;这不需要转换因为 C 会自动将void*提升为其适当的类型。注意 gcc 和 clang 并不是完全符合 ISO-C 标准这意味着它们会允许你对 void 指针进行算术运算。它们会将其视为 char 指针但不要这样做因为它可能无法在所有编译器上工作 printf调用 write 还是 write 调用printf printf调用write。printf包括一个内部缓冲区所以为了提高性能printf可能不会在每次调用printf时都调用write。printf是一个 C 库函数。write是一个系统调用我们知道系统调用是昂贵的。另一方面printf使用一个更适合我们需求的缓冲区如何打印出指针值整数字符串使用格式说明符“%p”表示指针“%d”表示整数“%s”表示字符串。所有格式说明符的完整列表在这里中找到整数的例子 int num1 10; printf(%d, num1); //prints num1整数指针的例子 int *ptr (int *) malloc(sizeof(int)); *ptr 10; printf(%p\n, ptr); //prints the address pointed to by the pointer printf(%p\n, ptr); /*prints the address of pointer -- extremely useful when dealing with double pointers*/ printf(%d, *ptr); //prints the integer content of ptr return 0;字符串的例子 char *str (char *) malloc(256 * sizeof(char)); strcpy(str, Hello there!); printf(%p\n, str); // print the address in the heap printf(%s, str); return 0;字符串作为指针和数组 BU 如何将标准输出保存到文件最简单的方法运行你的程序并使用 shell 重定向例如 ./program output.txt#To read the contents of the file, cat output.txt 更复杂的方法关闭1然后使用 open 重新打开文件描述符。参见cs-education.github.io/sys/#chapter/0/section/3/activity/0 指针和数组有什么区别举一个你可以用其中一个做而另一个做不到的例子。 char ary[] Hello; char *ptr Hello;例子数组名指向数组的第一个字节。ary和ptr都可以打印出来 char ary[] Hello; char *ptr Hello; // Print out address and contents printf(%p : %s\n, ary, ary); printf(%p : %s\n, ptr, ptr);数组是可变的所以我们可以改变它的内容但要小心不要写超出数组末尾的字节。幸运的是“World”不会比“Hello”更长在这种情况下char 指针ptr指向一些只读内存静态分配的字符串文字存储的地方所以我们不能改变这些内容。 strcpy(ary, World); // OK strcpy(ptr, World); // NOT OK - Segmentation fault (crashes) 然而与数组不同的是我们可以将ptr更改为指向另一块内存 ptr World; // OK! ptr ary; // OK! ary (..anything..) ; // WONT COMPILE // ary is doomed to always refer to the original array. printf(%p : %s\n, ptr, ptr); strcpy(ptr, World); // OK because now ptr is pointing to mutable memory (the array)从中可以得出的结论是指针*可以指向任何类型的内存而 C 数组[]只能指向堆栈上的内存。在更常见的情况下指针将指向堆内存这种情况下指针引用的内存是可以修改的。 sizeof()返回字节数。所以使用上面的代码ary和ptr的sizeof()分别是多少 sizeof(ary): ary是一个数组。返回整个数组所需的字节数5 个字符零字节6 个字节sizeof(ptr): 与sizeof(char *)相同。返回指针所需的字节数例如 32 位或 64 位机器的 4 或 8 sizeof是一个特殊的运算符。实际上它是编译程序之前编译器替换的东西因为所有类型的大小在编译时是已知的。当你有sizeof(char*)时它会获取你的机器上指针的大小64 位机器为 8 字节32 位机器为 4 字节等。当你尝试sizeof(char[])时编译器会查看并替换整个数组包含的字节数因为数组的总大小在编译时是已知的。 char str1[] will be 11; char* str2 will be 8; sizeof(str1) //11 because it is an array sizeof(str2) //8 because it is a pointer小心使用 sizeof 获取字符串的长度以下代码中哪些是不正确的或正确的为什么 int* f1(int *p) {*p 42;return p; } // This code is correct;char* f2() {char p[] Hello;return p; } // Incorrect!解释在堆栈上为包含 Hello 和一个空字节即6字节的正确大小创建了一个数组 p。这个数组存储在堆栈上在我们从 f2 返回后就无效了。 char* f3() {char *p Hello;return p; } // OK解释p 是一个指针。它保存了字符串常量的地址。字符串常量在 f3 返回后仍然保持不变和有效。 char* f4() {static char p[] Hello;return p; } // OK解释数组是静态的这意味着它存在于进程的整个生命周期静态变量不在堆或栈上。如何查找 C 库调用和系统调用的信息使用 man 手册。请注意man 手册分为几个部分。第二部分系统调用。第三部分C 库。网络谷歌“man7 open” shellman -S2 open 或 man -S3 printf 如何在堆上分配内存使用 malloc。还有 realloc 和 calloc。通常与 sizeof 一起使用。例如足够的空间来容纳 10 个整数 int *space malloc(sizeof(int) * 10);这个字符串复制代码有什么问题 void mystrcpy(char*dest, char* src) { // void means no return value while( *src ) { dest src; src ; dest; } }在上面的代码中它只是改变了 dest 指针指向源字符串。而且 nuls 字节没有被复制。这是一个更好的版本 - while( *src ) { *dest *src; src ; dest; } *dest *src; 请注意通常还会看到以下类型的实现其中包括在表达式测试中执行所有操作包括复制 nul 字节。 while( (*dest *src )) {};如何编写一个 strdup 替代品 // Use strlen1 to find the zero byte... char* mystrdup(char*source) {char *p (char *) malloc ( strlen(source)1 );strcpy(p,source);return p; }如何在堆上取消分配内存使用 free int *n (int *) malloc(sizeof(int)); *n 10; //Do some work free(n);什么是双重释放错误如何避免什么是悬空指针如何避免双重释放错误是当您意外地尝试两次释放相同的分配时发生的。 int *p malloc(sizeof(int)); free(p);*p 123; // Oops! - Dangling pointer! Writing to memory we dont own anymorefree(p); // Oops! - Double free!修复首先是编写正确的程序其次一旦内存被释放重置指针是良好的编程习惯。这确保了指针在没有程序崩溃的情况下不能被错误使用。修复 p NULL; // Now you cant use this pointer by mistake缓冲区溢出的一个例子是什么著名的例子心脏出血将一个 memcpy 复制到一个不足大小的缓冲区。简单的例子实现一个 strcpy 并忘记在确定所需内存大小时添加一个 strlen。 “typedef”是什么你如何使用它声明类型的别名。通常与结构一起使用以减少必须将“struct”写为类型的一部分的视觉混乱。 typedef float real; real gravity 10; // Also typedef gives us an abstraction over the underlying type used. // For example in the future we only need to change this typedef if we // wanted our physics library to use doubles instead of floats.typedef struct link link_t; //With structs, include the keyword struct as part of the original types在这个课程中我们经常使用 typedef 函数。例如函数的 typedef 可以是这样的 typedef int (*comparator)(void*,void*);int greater_than(void* a, void* b){return a b; } comparator gt greater_than;这声明了一个接受两个void*参数并返回整数的比较器函数类型。哇这是很多 C 的内容别担心还有更多要来的下一步C 编程第二部分文本输入和输出 C 编程第二部分文本输入和输出打印到流如何将字符串、整数、字符打印到标准输出流中使用 printf。第一个参数是格式字符串其中包括要打印的数据的占位符。常见的格式说明符是 %s 将参数视为 C 字符串指针一直打印到达到 NULL 字符为止%d 将参数打印为整数%p 将参数打印为内存地址。下面显示了一个简单的示例 char *name ... ; int score ...; printf(Hello %s, your result is %d\n, name, score); printf(Debug: The string and int are stored at: %p and %p\n, name, score ); // name already is a char pointer and points to the start of the array. // We need to get the address of the int variable默认情况下为了性能printf 实际上并不会写任何东西通过调用 write直到它的缓冲区满或打印换行符。我还可以如何打印字符串和单个字符使用 puts( name ); 和 putchar( c )其中 name 是指向 C 字符串的指针c 只是一个 char 如何将内容打印到其他文件流中使用 fprintf( _file_ , Hello %s, score: %d, name, score); 其中 file 是预定义的 ‘stdout’ ‘stderr’ 或者是由 fopen 或 fdopen 返回的 FILE 指针我可以使用文件描述符吗是的只需使用 dprintf(int fd, char* format_string, ...); 只需记住流可能是缓冲的所以您需要确保数据被写入文件描述符。如何将数据打印到 C 字符串中使用 sprintf 或更好的 snprintf。 char result[200]; int len snprintf(result, sizeof(result), %s:%d, name, score);snprintf 返回写入的字符数不包括终止字节。在上面的示例中这将是最多 199 个。如果我真的非常想要 printf 调用 write 而不换行怎么办使用 fflush( FILE* inp )。文件的内容将被写入。如果我想要写入 “Hello World” 而不换行我可以这样写。 int main(){fprintf(stdout, Hello World);fflush(stdout);return 0; }perror 有什么帮助假设您有一个函数调用刚刚失败了因为您检查了 man 页面并且它是一个失败的返回代码。perror(const char* message) 将把错误的英文版本打印到 stderr int main(){int ret open(IDoNotExist.txt, O_RDONLY);if(ret 0){perror(Opening IDoNotExist:);}//...return 0; }解析输入如何从字符串中解析数字使用 long int strtol(const char *nptr, char **endptr, int base); 或 long long int strtoll(const char *nptr, char **endptr, int base);。这些函数的作用是获取指向您的字符串 *nptr 和一个 base即二进制、八进制、十进制、十六进制等以及一个可选的指针 endptr并返回解析的整数。 int main(){const char *num 1A2436;char* endptr;long int parsed strtol(num, endptr, 16);return 0; }但要小心错误处理有点棘手因为该函数不会返回错误代码。出错时它将返回 0您必须手动检查 errno但这可能会导致麻烦。 int main(){const char *zero 0;char* endptr;printf(Parsing number); //printf sets errnolong int parsed strtol(num, endptr, 16);if(parsed 0){perror(Error: ); //oops strtol actually worked!}return 0; }如何使用 scanf 解析输入为参数使用 scanf或 fscanf 或 sscanf从默认输入流、任意文件流或 C 字符串中获取输入。检查返回值以查看解析了多少项是个好主意。scanf 函数需要有效的指针。将错误的指针值传入是一个常见的错误来源。例如 int *data (int *) malloc(sizeof(int)); char *line v 10; char type; // Good practice: Check scanf parsed the line and read two values: int ok 2 sscanf(line, %c %d, type, data); // pointer error我们想要将字符值写入 c将整数值写入 malloc’d 内存。然而我们传递的是数据指针的地址而不是指针指向的内容所以 sscanf 将会改变指针本身。也就是说指针现在将指向地址 10所以这段代码以后会失败例如当调用 free(data) 时。如何阻止 scanf 导致缓冲区溢出以下代码假设 scanf 不会读取超过 10 个字符包括终止字节到缓冲区中。 char buffer[10]; scanf(%s,buffer);您可以包含一个可选的整数来指定多少个字符不包括终止字节 char buffer[10]; scanf(%9s, buffer); // reads upto 9 charactes from input (leave room for the 10th byte to be the terminating byte)为什么 gets 是危险的我应该用什么代替以下代码容易受到缓冲区溢出的影响。它假定或信任输入行不会超过 10 个字符包括终止字节。 char buf[10]; gets(buf); // Remember the array name means the first byte of the arraygets 在 C99 标准中已被弃用并且已从最新的 C 标准C11中删除。程序应该使用 fgets 或 getline 代替。它们分别具有以下结构 char *fgets (char *str, int num, FILE *stream); ssize_t getline(char **lineptr, size_t *n, FILE *stream);下面是一种简单、安全的读取单行的方法。超过 9 个字符的行将被截断 char buffer[10]; char *result fgets(buffer, sizeof(buffer), stdin);如果出现错误或者到达文件末尾结果将为 NULL。请注意与gets不同fgets会将换行符复制到缓冲区中您可能希望将其丢弃- if (!result) { return; /* no data - dont read the buffer contents */}int i strlen(buffer) - 1; if (buffer[i] \n) buffer[i] \0;我如何使用getline getline的优点之一是它将自动重新分配足够大小的堆上的缓冲区。 // ssize_t getline(char **lineptr, size_t *n, FILE *stream);/* set buffer and size to 0; they will be changed by getline */ char *buffer NULL; size_t size 0;ssize_t chars getline(buffer, size, stdin);// Discard newline character if it is present, if (chars 0 buffer[chars-1] \n) buffer[chars-1] \0;// Read another line. // The existing buffer will be re-used, or, if necessary, // It will be freed and a new larger buffer will mallocd chars getline(buffer, size, stdin);// Later... dont forget to free the buffer! free(buffer);C 编程第三部分常见陷阱 C 程序员常犯哪些常见错误内存错误字符串常量是常量 char array[] Hi!; // array contains a mutable copy strcpy(array, OK);char *ptr Cant change me; // ptr points to some immutable memory strcpy(ptr, Will not work);字符串文字是存储在程序的代码段中的字符数组是不可变的。两个字符串文字可能共享内存中的相同空间。以下是一个例子 char * str1 Brandon Chong is the best TA; char * str2 Brandon Chong is the best TA;由str1和str2指向的字符串实际上可能驻留在内存中的相同位置。但是char 数组包含了从代码段复制到堆栈或静态内存中的文字值。以下 char 数组不驻留在内存中的相同位置。 char arr1[] Brandon Chong didnt write this; char arr2[] Brandon Chong didnt write this;缓冲区溢出/下溢 #define N (10) int i N, array[N]; for( ; i 0; i--) array[i] i;C 语言不检查指针是否有效。上面的例子写入了array[10]这超出了数组边界。这可能会导致内存损坏因为该内存位置可能正在用于其他用途。实际上这可能更难发现因为溢出/下溢可能发生在库调用中。 gets(array); // Lets hope the input is shorter than my array!返回指向自动变量的指针 int *f() {int result 42;static int imok;return imok; // OK - static variables are not on the stackreturn result; // Not OK }自动变量仅绑定到函数的堆栈内存函数的生命周期结束后继续使用内存是错误的。内存分配不足 struct User {char name[100]; }; typedef struct User user_t;user_t *user (user_t *) malloc(sizeof(user));在上面的例子中我们需要为结构体分配足够的字节。相反我们分配了足够的字节来容纳一个指针。一旦我们开始使用用户指针就会破坏内存。正确的代码如下所示。 struct User {char name[100]; }; typedef struct User user_t;user_t * user (user_t *) malloc(sizeof(user_t));字符串需要strlen(s)1字节每个字符串在最后一个字符后必须有一个空字节。存储字符串Hi需要 3 个字节[H] [i] [\0]。 char *strdup(const char *input) { /* return a copy of input */char *copy;copy malloc(sizeof(char*)); /* nope! this allocates space for a pointer, not a string */copy malloc(strlen(input)); /* Almost...but what about the null terminator? */copy malloc(strlen(input) 1); /* Thats right. */strcpy(copy, input); /* strcpy will provide the null terminator */return copy; }使用未初始化的变量 int myfunction() {int x;int y x 2; ...自动变量保存垃圾内存中发生的任何位模式。假设它总是初始化为零是错误的。假设未初始化的内存将被清零 void myfunct() {char array[10];char *p malloc(10);自动临时变量不会自动初始化为零。使用 malloc 进行堆分配不会自动初始化为零。双重释放 char *p malloc(10);free(p); // .. later ...free(p); 多次释放同一块内存是错误的。悬空指针 char *p malloc(10);strcpy(p, Hello);free(p); // .. later ...strcpy(p,World); 不应使用指向释放内存的指针。一种防御性编程实践是在释放内存后立即将指针设置为 null。将免费转换为以下片段是一个好主意它会自动将释放的变量设置为 nullvim - ultisnips snippet free free(something) b free(${1}); $1 NULL; ${2} endsnippet逻辑和程序流错误忘记 break int flag 1; // Will print all three lines. switch(flag) {case 1: printf(Im printed\n);case 2: printf(Me too\n);case 3: printf(Me three\n); }没有 break 的 case 语句将继续执行下一个 case 语句的代码。正确的代码如下所示。最后一个语句的 break 是不必要的因为在最后一个语句之后没有更多的要执行的情况。但是如果添加了更多的情况可能会导致一些错误。 int flag 1; // Will print only Im printed\n switch(flag) {case 1: printf(Im printed\n);break;case 2: printf(Me too\n);break;case 3: printf(Me three\n);break; //unnecessary }等号和相等 int answer 3; // Will print out the answer. if (answer 42) { printf(Ive solved the answer! Its %d, answer);}未声明或错误声明的函数 time_t start time();系统函数’time’实际上需要一个参数一个指向可以接收 time_t 结构的一些内存的指针。编译器没有捕获到这个错误因为程序员没有通过包含time.h提供有效的函数原型。额外的分号 for(int i 0; i 5; i) ; printf(Im printed once); while(x 10); x ; // X is never incremented然而以下代码是完全可以的。 for(int i 0; i 5; i){printf(%d\n, i);;;;;;;;;;;;; }这种代码是可以的因为 C 语言使用分号;来分隔语句。如果分号之间没有语句那么就没有要做的事情编译器会继续执行下一条语句。其他陷阱预处理器预处理器是什么它是编译器在实际编译程序之前执行的操作。它是一个复制和粘贴命令。这意味着如果我做以下操作。 #define MAX_LENGTH 10 char buffer[MAX_LENGTH]预处理后它会变成这样。 char buffer[10]C 预处理宏和副作用 #define min(a,b) ((a)(b) ? (a) : (b)) int x 4; if(min(x, 100)) printf(%d is six, x);宏是简单的文本替换因此上面的例子会扩展为x 100 ? x : 100为了清晰起见省略了括号 C 预处理宏和优先级 #define min(a,b) ab ? a : b int x 99; int r 10 min(99, 100); // r is 100!宏是简单的文本替换因此上面的例子会扩展为10 99 100 ? 99 : 100 C 预处理逻辑陷阱 #define ARRAY_LENGTH(A) (sizeof((A)) / sizeof((A)[0])) int static_array[10]; // ARRAY_LENGTH(static_array) 10 int* dynamic_array malloc(10); // ARRAY_LENGTH(dynamic_array) 2 or 1宏有什么问题如果我们有一个像第一个数组那样的静态数组它就能工作因为静态数组的 sizeof 返回数组占用的字节数将其除以 sizeof(an_element)将给出条目的数量。但是如果我们使用指向内存块的指针取指针的 sizeof 并将其除以第一个条目的大小并不总是会给出数组的大小。 sizeof 有什么作用吗 int a 0; size_t size sizeof(a); printf(size: %lu, a: %d, size, a);代码打印出什么 size: 4, a: 0 因为 sizeof 实际上不是在运行时评估的。编译器为所有表达式分配类型并丢弃表达式的额外结果。 C 编程第四部分字符串和结构字符串、结构和陷阱那么什么是字符串在 C 中们使用空终止字符串而不是长度前缀出于历史原因。对于你平常的编程来说这意味着你需要记住空字符在 C 中字符串被定义为一堆字节直到你达到’\0’或空字节为止。字符串的两个位置每当你定义一个常量字符串即形式为char* str constant的字符串时该字符串存储在数据或代码段中这是只读的这意味着任何尝试修改字符串都会导致段错误。然而如果有人malloc空间就可以更改该字符串为他们想要的任何内容。内存管理不善一个常见的陷阱是当你写下面的内容时 char* hello_string malloc(14);___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ // hello_string ---- | g | a | r | b | a | g | e | g | a | r | b | a | g | e |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ hello_string Hello Bhuvan!; // (constant string in the text segment) // hello_string ---- [ H , e , l , l , o , , B , h , u , v , a , n , ! , \0 ]___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ // memory_leak ----- | g | a | r | b | a | g | e | g | a | r | b | a | g | e |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ hello_string[9] t; //segfault!!我们做了什么我们为 14 个字节分配了空间重新分配了指针成功地导致了段错误记住跟踪你的指针在做什么。你可能想要做的是使用string.h函数strcpy。 strcpy(hello_string, Hello Bhuvan!);记住空字节忘记对字符串进行空终止会对字符串产生重大影响边界检查很重要。前面在 wikibook 中提到的 heartbleed 漏洞部分是因为这个原因。我在哪里可以找到所有这些函数的深入和全面的解释就在这里字符串信息/比较strlen strcmp int strlen(const char *s) 返回字符串的长度不包括空字节 int strcmp(const char *s1, const char *s2) 返回一个整数确定字符串的词典顺序。如果 s1 在字典中出现在 s2 之前则返回-1。如果两个字符串相等则返回 0。否则返回 1。对于大多数这些函数它们期望字符串是可读的而不是NULL但是当你传递NULL时会出现未定义的行为。字符串修改strcpy strcat strdup char *strcpy(char *dest, const char *src) 将src的字符串复制到dest。假设 dest 有足够的空间容纳 src char *strcat(char *dest, const char *src) 将src的字符串连接到目的地的末尾。此函数假定目的地末尾有足够的空间容纳src包括空字节 char *strdup(const char *dest) 返回字符串的malloc副本。字符串搜索strchr strstr char *strchr(const char *haystack, int needle) 返回haystack中needle第一次出现的指针。如果找不到则返回NULL。 char *strstr(const char *haystack, const char *needle) 与上面相同但这次是一个字符串字符串标记化strtok 一个危险但有用的函数strtok接受一个字符串并对其进行标记化。这意味着它将把字符串转换为单独的字符串。这个函数有很多规范所以请阅读 man 页面下面是一个人为的例子。 #include stdio.h #include string.hint main(){char* upped strdup(strtok,is,tricky,!!);char* start strtok(upped, ,);do{printf(%s\n, start);}while((start strtok(NULL, ,)));return 0; }输出 strtok is tricky !!当我像这样改变upped时会发生什么 char* upped strdup(strtok,is,tricky,,,!!);内存移动memcpy和memmove 为什么memcpy和memmove都在string.h中因为字符串本质上是带有空字节的原始内存 void *memcpy(void *dest, const void *src, size_t n) 将从str开始的n个字节移动到dest。小心当内存区域重叠时会出现未定义的行为。这是一个经典的“在我的机器上工作”的例子因为很多时候 valgrind 无法检测到它因为在你的机器上它看起来是有效的。当自动评分器出现时会失败。考虑更安全的版本。 void *memmove(void *dest, const void *src, size_t n) 做与上述相同的事情但如果内存区域重叠则保证所有字节都会正确复制过去。那么struct是什么从低级别来看一个结构体只是一块连续的内存仅此而已。就像数组一样结构体有足够的空间来存储所有的成员。但与数组不同它可以存储不同的类型。考虑上面声明的 contact 结构。 struct contact {char firstname[20];char lastname[20];unsigned int phone; };struct contact bhuvan;简短的插曲 /* a lot of times we will do the following typdefso we can just write contact contact1 */typedef struct contact contact; contact bhuvan;/* You can also declare the struct like this to getit done in one statement */ typedef struct optional_name {... } contact;如果你在没有任何优化和重新排序的情况下编译代码你可以期望每个变量的地址看起来像这样。 bhuvan // 0x100 bhuvan.firstname // 0x100 0x1000x00 bhuvan.lastname // 0x114 0x1000x14 bhuvan.phone // 0x128 0x1000x28因为你的编译器所做的就是说’嘿保留这么多空间我会去计算你想要写入的任何变量的偏移量’。这些偏移量是什么意思偏移量是变量开始的地方。电话变量从第0x128字节开始持续 sizeof(int)字节但并非总是如此。偏移量并不决定变量的结束位置。考虑在许多内核代码中看到的以下黑客行为。 typedef struct {int length;char c_str[0]; } string;const char* to_convert bhuvan; int length strlen(to_convert);// Lets convert to a c string string* bhuvan_name; bhuvan_name malloc(sizeof(string) length1); /* Currently, our memory looks like this with junk in those black spaces___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___bhuvan_name | | | | | | | | | | | |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ */bhuvan_name-length length; /* This writes the following values to the first four bytes The rest is still garbage___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___bhuvan_name | 0 | 0 | 0 | 6 | | | | | | | |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ */strcpy(bhuvan_name-c_str, to_convert); /* Now our string is filled in correctly at the end of the struct___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ____bhuvan_name | 0 | 0 | 0 | 6 | b | h | u | v | a | n | \0 |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾‾ */strcmp(bhuvan_name-c_str, bhuvan) 0 //The strings are equal!但并不是所有的结构都是完美的结构体可能需要一些叫做填充教程的东西。**我们不指望你在这门课程中对结构体进行打包只是知道它存在。这是因为在早期甚至现在当你必须从内存中获取一个地址时你必须以 32 位或 64 位块的方式进行。这也意味着你只能请求那些是它的倍数的地址。这意味着 struct picture{int height;pixel** data;int width;char* enconding; } // You think picture looks like thisheight data width encoding___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ picture | | | | |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾概念上可能看起来像这样 struct picture{int height;char slop1[4];pixel** data;int width;char slop2[4];char* enconding; }height slop1 data width slop2 encoding___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ picture | | | | | | |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾这是在 64 位系统上这并不总是这样因为有时处理器支持不对齐访问。这是什么意思嗯有两种选择你可以设置一个属性 struct __attribute__((packed, aligned(4))) picture{int height;pixel** data;int width;char* enconding; } // Will look like thisheight data width encoding___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ picture | | | | |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾但现在每次我想要访问data或encoding我都必须进行两次内存访问。你可以做的另一件事是重新排列结构尽管这并不总是可能的 struct picture{int height;int width;pixel** data;char* enconding; } // You think picture looks like thisheight width data encoding___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ ___ picture | | | | |‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾ ‾‾‾C 编程第五部分调试《C 程序调试指南》这将是一个帮助您调试 C 程序的大型指南。您可以检查错误的不同级别我们将逐个介绍。请随时添加您在调试 C 程序中发现有用的任何内容包括但不限于调试器的使用识别常见错误类型陷阱和有效的搜索技巧。在代码中调试清洁代码使用辅助函数使您的代码模块化。如果有重复的任务例如在 MP2 中获取连续块的指针请将它们制作为辅助函数。确保每个函数都非常擅长做一件事这样您就不必两次调试。假设我们正在通过每次迭代找到最小元素来进行选择排序如下所示 void selection_sort(int *a, long len){for(long i len-1; i 0; --i){long max_index i;for(long j len-1; j 0; --j){if(a[max_index] a[j]){max_index j;}}int temp a[i];a[i] a[max_index];a[max_index] temp;}}许多人可以看到代码中的错误但将上述方法重构为 long max_index(int *a, long start, long end); void swap(int *a, long idx1, long idx2); void selection_sort(int *a, long len);而错误特别在一个函数中。最后我们不是一个关于重构/调试代码的课程–事实上大多数系统代码都很糟糕你不想读它。但是为了调试长远来看采用一些实践可能对你有好处。断言使用断言来确保您的代码在某个特定点之前工作–并且重要的是确保您以后不会破坏它。例如如果您的数据结构是双向链表您可以这样做assert(node-size node-next-prev-size)来断言下一个节点指向当前节点。您还可以检查指针是否指向预期的内存地址范围而不是 null-size 是合理的等等。NDEBUG 宏将禁用所有断言因此在调试完成后不要忘记设置它。www.cplusplus.com/reference/cassert/assert/ 使用 assert 的一个快速示例是假设我正在使用 memcpy 编写代码 assert(!(src destn dest srcn)); //Checks overlap memcpy(dest, src, n);这个检查可以在编译时关闭但会帮助您避免大量的调试麻烦 printfs 当一切都失败时疯狂地打印您的每个函数都应该知道它要做什么例如find_min 最好找到最小的元素。您希望测试每个函数是否正在做它设定的事情并确切地查看代码在哪里出错。在竞态条件的情况下tsan 可能有所帮助但让每个线程在特定时间打印数据可能有助于您识别竞态条件。 Valgrind 待办事项 Tsan ThreadSanitizer 是 Google 的一个工具内置在 clang和 gcc中可以帮助您检测代码中的竞态条件。有关该工具的更多信息请参阅 Github 维基。请注意使用 tsan 会使您的代码变慢一些。 #include pthread.h #include stdio.hint Global;void *Thread1(void *x) {Global;return NULL; }int main() {pthread_t t[2];pthread_create(t[0], NULL, Thread1, NULL);Global 100;pthread_join(t[0], NULL); } // compile with gcc -fsanitizethread -pie -fPIC -ltsan -g simple_race.c我们可以看到变量 Global 存在竞态条件。主线程和使用 pthread_create 创建的线程将尝试同时更改值。但是ThreadSantizer 能否捕捉到它呢 $ ./a.outWARNING: ThreadSanitizer: data race (pid28888)Read of size 4 at 0x7f73ed91c078 by thread T1:#0 Thread1 /home/zmick2/simple_race.c:7 (exe0x000000000a50)#1 :0 (libtsan.so.00x00000001b459)Previous write of size 4 at 0x7f73ed91c078 by main thread:#0 main /home/zmick2/simple_race.c:14 (exe0x000000000ac8)Thread T1 (tid28889, running) created by main thread at:#0 :0 (libtsan.so.00x00000001f6ab)#1 main /home/zmick2/simple_race.c:13 (exe0x000000000ab8)SUMMARY: ThreadSanitizer: data race /home/zmick2/simple_race.c:7 Thread1ThreadSanitizer: reported 1 warnings 如果我们使用调试标志编译那么它将给我们变量名。 GDB 介绍www.cs.cmu.edu/~gilpin/tutorial/ 以编程方式设置断点在使用 GDB 调试复杂的 C 程序时一个非常有用的技巧是在源代码中设置断点。 int main() {int val 1;val 42;asm(int $3); // set a breakpoint hereval 7; }$ gcc main.c -g -o main ./main (gdb) r [...] Program received signal SIGTRAP, Trace/breakpoint trap. main () at main.c:6 6 val 7; (gdb) p val $1 42检查内存内容 www.delorie.com/gnu/docs/gdb/gdb_56.html 例如 int main() {char bad_string[3] {C, a, t};printf(%s, bad_string); }$ gcc main.c -g -o main ./main $ Cat ZVQ $(gdb) l 1 #include stdio.h 2 int main() { 3 char bad_string[3] {C, a, t}; 4 printf(%s, bad_string); 5 } (gdb) b 4 Breakpoint 1 at 0x100000f57: file main.c, line 4. (gdb) r [...] Breakpoint 1, main () at main.c:4 4 printf(%s, bad_string); (gdb) x/16xb bad_string 0x7fff5fbff9cd: 0x63 0x61 0x74 0xe0 0xf9 0xbf 0x5f 0xff 0x7fff5fbff9d5: 0x7f 0x00 0x00 0xfd 0xb5 0x23 0x89 0xff(gdb)在这里通过使用带有参数16xb的x命令我们可以看到从内存地址0x7fff5fbff9cbad_string的值开始printf 实际上会看到以下字节序列作为字符串因为我们提供了一个没有空终止符的格式不正确的字符串。 0x43 0x61 0x74 0xe0 0xf9 0xbf 0x5f 0xff 0x7f 0x00 C 编程复习问题主题 C 字符串表示 C 字符串作为指针 char p[]vs char* p 简单的 C 字符串函数strcmpstrcatstrcpy sizeof char sizeof x vs x* 堆内存寿命堆分配调用解引用指针取地址运算符指针算术字符串复制字符串截断双重释放错误字符串字面值打印格式。内存越界错误静态内存 fileio POSIX v C 库 C io fprintf 和 printf POSIX 文件 io读|写|打开 stdout 的缓冲问题/练习以下打印出什么 int main(){fprintf(stderr, Hello );fprintf(stdout, Its a small );fprintf(stderr, World\n);fprintf(stdout, place\n);return 0; }以下两个声明之间有什么区别其中一个的sizeof返回什么 char str1[] bhuvan; char *str2 another one;C 中的字符串是什么编写一个简单的my_strcmp。my_strcatmy_strcpy或my_strdup呢奖励只通过字符串一次编写函数。以下通常应该返回什么 int *ptr; sizeof(ptr); sizeof(*ptr);什么是malloc它与calloc有什么不同。一旦内存被malloc我如何使用realloc 运算符是什么*呢指针算术。假设以下地址。以下移位是什么 char** ptr malloc(10); //0x100 ptr[0] malloc(20); //0x200 ptr[1] malloc(20); //0x300* ptr 2* ptr 4* ptr[0] 4* ptr[1] 2000* *((int)(ptr 1)) 3 我们如何防止双重释放错误打印字符串int或char的 printf 格式说明符是什么以下代码有效吗如果是为什么output位于哪里 char *foo(int var){static char output[20];snprintf(output, 20, %d, var);return output; }编写一个接受字符串并打开该文件的函数每次打印出文件的 40 个字节但每隔一次打印都会颠倒字符串尝试使用 POSIX API 实现。 POSIX 文件描述符模型和 C 的FILE*之间有哪些区别即使用了哪些函数调用哪个是缓冲的POSIX 内部使用 C 的FILE*还是反之亦然返回C 编程第五部分调试二、进程进程第一部分介绍概述进程是正在运行的程序有点。进程也只是计算机程序运行的一个实例。进程有很多可用的东西。在每个程序开始时您会得到一个进程但每个程序都可以创建更多的进程。事实上您的操作系统只启动一个进程所有其他进程都是从那个进程分叉出来的——在启动时都是在后台完成的。在开始时当您的 Linux 机器上的操作系统启动时会创建一个名为init.d的进程。该进程是一个特殊的进程处理信号、中断和某些内核元素的持久性模块。每当您想要创建一个新进程时都会调用fork将在后面的部分讨论并使用另一个函数来加载另一个程序。进程隔离进程非常强大但它们是隔离的这意味着默认情况下没有进程可以与另一个进程通信。这非常重要因为如果您有一个庞大的系统比如 EWS那么您希望一些进程具有更高的特权监控、管理而您绝对不希望普通用户能够故意或者意外地通过修改进程来使整个系统崩溃。如果我运行以下代码 int secrets; //maybe defined in the kernel or else where secrets; printf(%d\n, secrets); 在两个不同的终端上正如您所猜测的它们都会打印出 1 而不是 2。即使我们改变代码以执行一些非常巧妙的操作除了直接读取内存也没有办法改变另一个进程的状态好吧也许这个但那就有点太深入了。进程内容内存布局当一个进程启动时它会得到自己的地址空间。这意味着每个进程都会得到对于内存堆栈。堆栈是存储自动变量和函数调用返回地址的地方。每次声明一个新变量程序都会将堆栈指针向下移动以保留变量的空间。堆栈的这一部分是可写的但不可执行。如果堆栈增长得太远意味着它要么超出了预设的边界要么与堆相交您很可能会得到堆栈溢出最终导致段错误或类似的错误。默认情况下堆栈是静态分配的这意味着只有一定数量的空间可以写入堆。堆是一个不断扩大的内存区域。如果要分配一个大对象它就会放在这里。堆从文本段的顶部开始向上增长这意味着有时当您调用malloc时它会要求操作系统将堆边界向上推。这个区域也是可写的但不可执行。如果系统受限或者地址用完了在 32 位系统上更常见就可能用完堆内存。数据段。这包含了所有的全局变量。这一部分从文本段的末尾开始大小是静态的因为全局变量的数量在编译时就已知。这一部分是可写的但不可执行没有其他太花哨的东西。文本段。这可以说是地址中最重要的部分。这是存储所有代码的地方。由于汇编编译成了 1 和 0这就是 1 和 0 存储的地方。程序计数器在这个段中执行指令并向下移动到下一个指令。重要的是要注意这是代码中唯一可执行的部分。如果您尝试在运行时更改代码很可能会导致段错误虽然有办法绕过但假设它会导致段错误。为什么它不从零开始这超出了本课程的范围但这是出于安全考虑。文件描述符正如小册子所示操作系统跟踪文件描述符及其指向的内容。我们将在后面看到文件描述符不一定指向实际文件操作系统会为您跟踪它们。另外请注意在进程之间文件描述符可能会被重用但在进程内部它们是唯一的。文件描述符也有位置的概念。您可以完全从磁盘上读取文件因为操作系统跟踪文件中的位置并且该位置也属于您的进程。安全/权限进程功能/限制奖励当您复习期末考试时您可以回来看看进程也具有所有这些东西。第一次看时 - 它可能不太有意义。进程 IDPID 为了跟踪所有这些进程您的操作系统为每个进程分配一个数字该进程称为 PID即进程 ID。进程还可以包含映射状态文件描述符权限分叉第一部分介绍分叉第一部分介绍警告进程分叉是一个非常强大也非常危险的工具。如果出错并导致分叉炸弹稍后在本页解释你可能会导致整个系统崩溃。为了减少这种可能性通过在命令行中输入ulimit -u 40来将最大进程数限制为一个小数字例如 40。请注意此限制仅适用于用户这意味着如果你引发了分叉炸弹那么你将无法杀死你刚刚创建的所有进程因为调用killall需要你的 shell 来fork()…讽刺吧那么我们该怎么办呢一个解决方案是提前生成另一个用户例如 root的另一个 shell 实例并从那里杀死进程。另一个方法是使用内置的exec命令杀死所有用户进程小心你只有一次机会。最后你可以重新启动系统在测试fork()代码时请确保你有根用户和/或物理访问权限。如果你必须远程处理fork()代码请记住在紧急情况下kill -9 -1会帮助你。总结如果你没有准备好fork可能会非常危险。你已经被警告过了。分叉介绍 fork做什么 fork系统调用克隆当前进程以创建一个新进程。它通过复制现有进程的状态创建一个新进程子进程有一些细微的差异下面讨论。子进程不是从 main 开始。相反它像父进程一样从fork()返回。什么是最简单的fork()例子这是一个非常简单的例子… printf(Im printed once!\n); fork(); // Now there are two processes running // and each process will print out the next line. printf(You see this line twice!\n);为什么这个例子会打印两次 42 以下程序打印出 42 两次 - 但fork()在printf之后为什么 #include unistd.h /*fork declared here*/ #include stdio.h /* printf declared here*/ int main() {int answer 84 1;printf(Answer: %d, answer);fork();return 0; }printf行*只执行一次但请注意打印的内容没有刷新到标准输出没有打印换行我们没有调用fflush或更改缓冲模式。因此输出文本仍然在进程内存中等待发送。当执行fork()时整个进程内存被复制包括缓冲区。因此子进程从一个非空输出缓冲区开始该缓冲区将在程序退出时刷新。如何编写针对父进程和子进程不同的代码检查fork()的返回值。返回值-1 失败0 在子进程中正数在父进程中返回值是子进程 id。以下是记住哪个是哪个的一种方法子进程可以通过调用getppid()找到其父进程 - 被复制的原始进程 - 因此不需要从fork()获得任何额外的返回信息。然而父进程只能从fork的返回值中找到新子进程的 id pid_t id fork(); if (id -1) exit(1); // fork failed if (id 0) { // Im the original parent and // I just created a child process with id id // Use waitpid to wait for the child to finish } else { // returned zero // I must be the newly made child process }什么是分叉炸弹分叉炸弹’是指尝试创建无限数量的进程。下面是一个简单的例子 while (1) fork();这通常会使系统几乎停滞因为它试图为大量准备运行的进程分配 CPU 时间和内存。评论系统管理员不喜欢分叉炸弹可能会设置每个用户可以拥有的进程数量的上限或者可能会撤销登录权限因为它会为其他用户的程序带来麻烦。你也可以使用setrlimit()来限制创建的子进程数量。分叉炸弹并不一定是恶意的 - 它们偶尔会由于学生编码错误而发生。 Angrave 建议《黑客帝国》三部曲机器和人最终共同努力击败不断增殖的 Agent-Smith是基于一个基于 AI 驱动的分叉炸弹的电影情节。等待和执行父进程如何等待子进程完成使用waitpid或wait。 pid_t child_id fork(); if (child_id -1) { perror(fork); exit(EXIT_FAILURE);} if (child_id 0) { // We have a child! Get their exit codeint status; waitpid( child_id, status, 0 );// code not shown to get exit status from child } else { // In child ...// start calculationexit(123); }我可以让子进程执行另一个程序吗是的。在 fork 后使用其中一个exec函数。exec函数集用正在调用的进程映像替换进程映像。这意味着exec调用后的任何代码行都将被替换。任何其他要求子进程执行的工作都应该在exec调用之前完成。 Wikipedia 文章在帮助您理解 exec 系列名称方面做得很好。命名方案可以缩短如下每个的基础都是 exec执行后面跟着一个或多个字母 e - 指向环境变量的指针数组被显式传递给新的进程映像。 l - 命令行参数被逐个传递列表给函数。 p - 使用 PATH 环境变量来查找要执行的文件名。 v - 命令行参数作为指针数组向量传递给函数。 #include unistd.h #include sys/types.h #include sys/wait.h #include stdlib.h #include stdio.hint main(int argc, char**argv) {pid_t child fork();if (child -1) return EXIT_FAILURE;if (child) { /* I have a child! */int status;waitpid(child , status ,0);return EXIT_SUCCESS;} else { /* I am the child */// Other versions of exec pass in arguments as arrays// Remember first arg is the program name// Last arg must be a char pointer to NULLexecl(/bin/ls, ls,-alh, (char *) NULL);// If we get to this line, something went wrong!perror(exec failed!);} }执行另一个程序的简单方法使用system。以下是如何使用它的方法 #include unistd.h #include stdlib.hint main(int argc, char**argv) {system(ls);return 0; }system调用将分叉执行由参数传递的命令原始父进程将等待其完成。这也意味着system是一个阻塞调用父进程在由system启动的进程退出之前无法继续。这可能有用也可能没有。此外system实际上创建了一个 shell然后给出字符串这比直接使用exec更耗费资源。标准 shell 将使用PATH环境变量搜索与命令匹配的文件名。对于许多简单的运行此命令问题使用 system 通常足够了但对于更复杂或微妙的问题它可能很快变得有限并且它隐藏了分叉-执行-等待模式的机制因此我们鼓励您学习并使用fork exec和waitpid。最愚蠢的 fork 示例是什么下面显示了一个稍微愚蠢的例子。它会打印什么尝试使用多个参数运行您的程序。 #include unistd.h #include stdio.h int main(int argc, char **argv) {pid_t id;int status; while (--argc (idfork())) {waitpid(id,status,0); /* Wait for child*/}printf(%d:%s\n, argc, argv[argc]);return 0; }令人惊奇的并行明显 O(N) sleepsort是今天的愚蠢赢家。首次发布于2011 年的 4chan。下面显示了这种糟糕但有趣的排序算法的一个版本。 int main(int c, char **v) {while (--c 1 !fork());int val atoi(v[c]);sleep(val);printf(%d\n, val);return 0; }注意由于系统调度程序的工作方式该算法实际上并不是 O(N)。虽然有并行算法可以在每个进程中以 O(log(N))运行但这不幸地不是其中之一。子进程与父进程有什么不同关键区别包括由getpid()返回的进程 ID。由getppid()返回的父进程 ID。当子进程完成时父进程通过信号 SIGCHLD 被通知但反之则不然。子进程不会继承未决信号或定时器警报。完整列表请参阅fork man page 子进程共享打开的文件句柄吗是的实际上两个进程都使用相同的底层内核文件描述符。例如如果一个进程将随机访问位置倒回到文件的开头那么两个进程都会受到影响。子进程和父进程都应该close或fclose它们的文件描述符或文件句柄。如何获取更多信息阅读 man 页面 fork exec wait 分叉第二部分分叉执行等待模式以下的’exec’示例是做什么的 #include unistd.h #include fcntl.h // O_CREAT, O_APPEND etc. defined hereint main() {close(1); // close standard outopen(log.txt, O_RDWR | O_CREAT | O_APPEND, S_IRUSR | S_IWUSR);puts(Captains log);chdir(/usr/include);// execl( executable, arguments for executable including program name and NULL at the end)execl(/bin/ls, /* Remaining items sent to ls*/ /bin/ls, ., (char *) NULL); // ls .perror(exec failed);return 0; // Not expected }上述代码中没有错误检查我们假设 close、open、chdir 等都按预期工作。 open将使用最低可用的文件描述符即 1因此标准输出现在转到日志文件。 chdir将当前目录更改为/usr/include execl用/bin/ls 替换程序图像并调用它的 main()方法 perror我们不希望到达这里 - 如果到达了那么 exec 失败了。微妙的 fork 炸弹错误这段代码有什么问题 #include unistd.h #define HELLO_NUMBER 10int main(){pid_t children[HELLO_NUMBER];int i;for(i 0; i HELLO_NUMBER; i){pid_t child fork();if(child -1){break;}if(child 0){ //I am the childexeclp(ehco, echo, hello, NULL);}else{children[i] child;}}int j;for(j 0; j i; j){waitpid(children[j], NULL, 0);}return 0; } 我们拼错了ehco所以我们无法exec它。这是什么意思我们只创建了 2**10 个进程而不是 10 个进程炸毁了我们的机器。我们如何防止这种情况在 exec 后立即放置一个退出这样如果 exec 失败我们就不会炸毁我们的机器。子进程从父进程继承了什么打开文件句柄。如果父进程稍后寻求比如回到文件的开头那么这也会影响子进程反之亦然。信号处理程序当前工作目录环境变量有关更多详细信息请参阅fork man page。子进程与父进程有什么不同进程 ID 是不同的。在子进程中调用getppid()注意两个’p’将得到与在父进程中调用 getpid()相同的结果。有关更多详细信息请参阅 fork man page。我如何等待我的子进程完成使用waitpid或wait。父进程将暂停直到wait或waitpid返回。请注意此解释忽略了重新启动的讨论。 fork-exec-wait 模式是什么一个常见的编程模式是调用fork然后是exec和wait。原始进程调用 fork创建一个子进程。然后子进程使用 exec 来启动一个新程序的执行。与此同时父进程使用wait或waitpid来等待子进程完成。请参阅下面的完整代码示例。我如何启动一个同时运行的后台进程不要等待它们您的父进程可以继续执行代码而无需等待子进程。请注意在实践中通过在调用 exec 之前关闭打开的文件描述符后台进程也可以与父进程的输入和输出流断开连接。然而在父进程完成之前完成的子进程可能会变成僵尸。有关更多信息请参阅僵尸页面。僵尸好的父母不会让他们的孩子变成僵尸当一个子进程完成或终止时它仍然占据内核进程表中的一个槽。只有在子进程被“等待”后该槽才会再次可用。一个长时间运行的程序可能会通过不断创建进程而永远不等待它们来创建许多僵尸。太多僵尸会有什么影响最终内核进程表中会没有足够的空间来创建新进程。因此fork()会失败并且可能使系统难以/无法使用 - 例如仅登录就需要一个新进程系统如何帮助防止僵尸一旦一个进程完成它的任何子进程都将被分配给“init” - 具有 pid 为 1 的第一个进程。因此这些子进程将看到 getppid()返回值为 1。这些孤儿最终会完成并在短暂的时刻成为僵尸。幸运的是init 进程会自动等待它的所有子进程从而将这些僵尸从系统中移除。我如何防止僵尸警告简化的答案等待你的孩子 waitpid(child, status, 0); // Clean up and wait for my child process to finish.请注意我们假设获得 SIGCHLD 事件的唯一原因是子进程已经完成这并不完全正确 - 有关更多详细信息请参阅 man page。一个健壮的实现还会检查中断状态并在循环中包含上述内容。继续阅读了解更健壮的实现的讨论。我如何使用 SIGCHLD 异步等待我的子进程高级警告本节使用了我们尚未完全介绍的信号。当子进程完成时父进程会收到 SIGCHLD 信号因此信号处理程序可以等待该进程。下面显示了一个稍微简化的版本。 pid_t child;void cleanup(int signal) {int status;waitpid(child, status, 0);write(1,cleanup!\n,9); } int main() {// Register signal handler BEFORE the child can finishsignal(SIGCHLD, cleanup); // or better - sigactionchild fork();if (child -1) { exit(EXIT_FAILURE);}if (child 0) { /* I am the child!*/// Do background stuff e.g. call exec } else { /* Im the parent! */sleep(4); // so we can see the cleanupputs(Parent is done);}return 0; } 然而上面的例子忽略了一些微妙的地方可能有多个子进程已经完成但父进程只会收到一个 SIGCHLD 信号信号不会排队 SIGCHLD 信号可能是因为其他原因而发送的例如子进程暂时停止下面显示了一个更健壮的代码来清除僵尸进程。 void cleanup(int signal) {int status;while (waitpid((pid_t) (-1), 0, WNOHANG) 0) {} }那么什么是环境变量环境变量是系统为所有进程保留的变量。您的系统现在已经设置了这些在 Bash 中您可以检查其中一些 $ echo $HOME /home/bhuvy $ echo $PATH /usr/local/sbin:/usr/bin:... 如何在 C/C中获取这些您可以使用getenv和setenv函数 char* home getenv(HOME); // Will return /home/bhuvy setenv(HOME, /home/bhuvan, 1 /*set overwrite to true*/ );那么这些环境变量对父进程/子进程有什么意义呢每个进程都有自己的环境变量字典这些变量会被复制到子进程中。这意味着如果父进程更改其环境变量它不会传递给子进程反之亦然。如果您想要使用不同的环境变量执行程序这在 fork-exec-wait 三部曲中很重要。例如您可以编写一个 C 程序循环遍历所有时区并执行date命令以打印出所有本地的日期和时间。环境变量用于各种程序因此修改它们很重要。进程控制第一部分等待宏使用信号等待宏我可以找出我的子进程的退出值吗您可以找到子进程的最低 8 位退出值main()的返回值或包含在exit()中的值使用“等待宏” - 通常您将使用“WIFEXITED”和“WEXITSTATUS”。有关更多信息请参阅wait/waitpid手册页。 int status; pid_t child fork(); if (child -1) return 1; //Failed if (child 0) { /* I am the parent - wait for the child to finish */pid_t pid waitpid(child, status, 0);if (pid ! -1 WIFEXITED(status)) {int low8bits WEXITSTATUS(status);printf(Process %d returned %d , pid, low8bits);} } else { /* I am the child */// do something interestingexecl(/bin/ls, /bin/ls, ., (char *) NULL); // ls . }一个进程只能有 256 个返回值其余的位是信息性的。位移请注意没有必要记住这些这只是信息存储在状态变量内部的高级概述 Android 源代码 /* 如果 WIFEXITED(STATUS)则为状态的低 8 位。 */ #define __WEXITSTATUS(status) (((status) 0xff00) 8) /* 如果 WIFSIGNALED(STATUS)则为终止信号。 */ #define __WTERMSIG(status) ((status) 0x7f) /* 如果 WIFSTOPPED(STATUS)则为停止子进程的信号。 */ #define __WSTOPSIG(status) __WEXITSTATUS(status) /* 如果 STATUS 指示正常终止则为非零。 */ #define __WIFEXITED(status) (__WTERMSIG(status) 0)内核有一种内部方式来跟踪已发出、已退出或已停止的信号。该 API 被抽象化以便内核开发人员可以随意更改。小心。请记住如果前提条件得到满足宏才有意义。这意味着如果进程被发出信号进程的退出状态将不会被定义。宏不会为您检查因此需要编程确保逻辑正确。信号什么是信号信号是内核提供给我们的一种构造。它允许一个进程异步地向另一个进程发送信号类似于消息。如果该进程希望接受该信号它可以并且对于大多数信号可以决定如何处理该信号。这里是一个信号的简短列表非全面。名称默认操作通常用例SIGINT终止进程可以被捕获告诉进程停止运行SIGQUIT终止进程可以被捕获告诉进程停止运行SIGSTOP停止进程无法被捕获停止进程以便继续SIGCONT继续进程继续运行进程SIGKILL终止进程无法被忽略你想让你的进程消失我可以暂停我的子进程吗是的您可以通过发送 SIGSTOP 信号临时暂停正在运行的进程。如果成功它将冻结一个进程即进程将不再分配任何 CPU 时间。要允许进程恢复执行请发送 SIGCONT 信号。例如这里有一个程序每秒慢慢打印一个点最多 59 个点。 #include unistd.h #include stdio.h int main() {printf(My pid is %d\n, getpid() );int i 60;while(--i) { write(1, .,1);sleep(1);}write(1, Done!,5);return 0; }我们首先将进程在后台启动注意末尾的。然后通过使用 kill 命令从 shell 进程向其发送信号。 ./program My pid is 403 ... kill -SIGSTOP 403 kill -SIGCONT 403 如何在 C 中杀死/停止/暂停我的子进程在 C 中使用kill POSIX 调用向子进程发送信号 kill(child, SIGUSR1); // Send a user-defined signal kill(child, SIGSTOP); // Stop the child process (the child cannot prevent this) kill(child, SIGTERM); // Terminate the child process (the child can prevent this) kill(child, SIGINT); // Equivalent to CTRL-C (by default closes the process)正如我们上面所看到的在 shell 中也有一个 kill 命令例如获取正在运行的进程列表然后终止进程 45 和进程 46 ps kill -l kill -9 45 kill -s TERM 46 如何检测“CTRL-C”并优雅地清理我们稍后会回到信号 - 这只是一个简短的介绍。在 Linux 系统上如果您有兴趣了解更多信息例如系统和库调用的异步信号安全列表请参阅man -s7 signal。信号处理程序内的可执行代码受到严格限制。大多数库和系统调用都不是“异步信号安全”的 - 它们不能在信号处理程序内使用因为它们不是可重入安全的。在单线程程序中信号处理会暂时中断程序执行以执行信号处理程序代码。假设您的原始程序在执行malloc库代码时被中断malloc 使用的内存结构将不处于一致状态。在信号处理程序中调用printf它使用malloc是不安全的并将导致“未定义行为”即它不再是一个有用的、可预测的程序。实际上您的程序可能会崩溃、计算或生成不正确的结果或者停止运行“死锁”具体取决于在执行信号处理程序代码时您的程序正在执行什么。信号处理程序的一个常见用途是设置一个布尔标志该标志偶尔被轮询读取作为程序正常运行的一部分。例如 int pleaseStop ; // See notes on why volatile sig_atomic_t is bettervoid handle_sigint(int signal) {pleaseStop 1; }int main() {signal(SIGINT, handle_sigint);pleaseStop 0;while ( ! pleaseStop) { /* application logic here */ }/* cleanup code here */ }上述代码在纸上看起来可能是正确的。然而我们需要向编译器和将执行main()循环的 CPU 核心提供一个提示。我们需要防止编译器优化表达式! pleaseStop似乎是一个循环不变量即永远为真因此可以简化为true。其次我们需要确保pleaseStop的值不会被缓存在 CPU 寄存器中而是始终从主存中读取和写入。sig_atomic_t类型意味着变量的所有位可以作为“原子操作”进行读取或修改 - 一个不可中断的操作。不可能读取由一些新位值和旧位值组成的值。通过使用正确类型的volatile sig_atomic_t来指定pleaseStop我们可以编写可移植的代码其中主循环将在信号处理程序返回后退出。sig_atomic_t类型在大多数现代平台上可以与int一样大但在嵌入式系统上可能只能表示(-127 至 127)的值并且只能表示(-127 至 127)的值。 volatile sig_atomic_t pleaseStop;这种模式的两个示例可以在“COMP”中找到这是一个基于终端的 1Hz 4 位计算机github.com/gto76/comp-cpp/blob/1bf9a77eaf8f57f7358a316e5bbada97f2dc8987/src/output.c#L121。使用了两个布尔标志。一个用于标记SIGINTCTRL-C的传递并优雅地关闭程序另一个用于标记SIGWINCH信号以检测终端调整大小并重新绘制整个显示。进程复习问题主题正确使用 fork、exec 和 waitpid 使用带有路径的 exec 理解 fork、exec 和 waitpid 的作用。例如如何使用它们的返回值。 SIGKILL 与 SIGSTOP 与 SIGINT。按下 CTRL-C 时发送了什么信号从 shell 或 kill POSIX 调用使用 kill。进程内存隔离。进程内存布局堆在哪里栈等无效的内存地址。什么是 fork 炸弹、僵尸进程和孤儿进程如何创建/删除它们。 getpid 与 getppid 如何使用 WAIT 退出状态宏 WIFEXITED 等。问题/练习带有 p 和不带 p 的 execs 有什么区别操作系统是什么如何将命令行参数传递给execl*execv*呢按照惯例第一个命令行参数应该是什么如何知道exec或fork失败了传递给 wait 的int *status指针是什么wait 何时失败 SIGKILL、SIGSTOP、SIGCONT、SIGINT之间有哪些区别默认行为是什么哪些可以设置信号处理程序按下CTRL-C时发送了什么信号我的终端锚定在 PID 1337并且刚刚变得无响应。给我写一个终端命令和 C 代码向其发送SIGQUIT。一个进程能否通过正常手段改变另一个进程的内存为什么堆、栈、数据和文本段在哪里哪些段可以写入无效的内存地址是什么用 C 语言编写一个 fork 炸弹请不要运行它。什么是孤儿进程它如何变成僵尸进程如何成为一个好的父进程当父母告诉你不能做某事时你是不是很讨厌给我写一个程序向你的父进程发送SIGSTOP。编写一个 fork exec 等待可执行文件的函数并使用等待宏告诉我进程是否正常退出或被信号中断。如果进程正常退出则打印返回值。如果不是则打印导致进程终止的信号编号。三、内存和分配器内存第一部分堆内存介绍 C 动态内存分配当我调用 malloc 时会发生什么函数malloc是一个 C 库调用用于保留一块连续的内存。与堆栈内存不同内存保持分配状态直到使用相同指针调用free。还有calloc和realloc下面将讨论它们。 malloc 可能失败吗如果malloc无法保留更多内存则返回NULL。健壮的程序应该检查返回值。如果您的代码假设malloc成功但实际上没有成功那么当它尝试写入地址 0 时您的程序很可能会崩溃段错误。堆在哪里有多大堆是进程内存的一部分它没有固定的大小。当您调用malloccallocrealloc和free时C 库将执行堆内存分配。首先快速回顾一下进程内存进程是程序的运行实例。每个进程都有自己的地址空间。例如在 32 位机器上您的进程大约有 40 亿个地址可供使用但并非所有这些地址都是有效的甚至映射到实际的物理内存RAM。在进程的内存中您将找到可执行代码、堆栈空间、环境变量、全局静态变量和堆。通过调用sbrkC 库可以根据程序对堆内存的需求增加堆的大小。由于堆和堆栈每个线程一个需要增长我们将它们放在地址空间的相对两端。因此对于典型的架构堆将向上增长堆栈向下增长。真相现代操作系统内存分配器不再需要sbrk-相反它们可以请求独立的虚拟内存区域并维护多个内存区域。例如大量请求可以放置在与小分配请求不同的内存区域中。但是这个细节是一个不需要的复杂性碎片化和有效分配内存的问题仍然存在因此我们将忽略这个实现细节并将其写成堆是一个单一区域的样子。如果我们编写一个多线程程序稍后会详细介绍我们将需要多个堆栈每个线程一个但只有一个堆。在典型的架构中堆是数据段的一部分它从代码和全局变量的上方开始。程序需要调用 brk 或 sbrk 吗通常不需要尽管调用sbrk(0)可能会很有趣因为它告诉您堆当前的结束位置。相反程序使用malloccallocrealloc和free它们是 C 库的一部分。当需要额外的堆内存时这些函数的内部实现将调用sbrk。 void *top_of_heap sbrk(0); malloc(16384); void *top_of_heap2 sbrk(0); printf(The top of heap went from %p to %p \n, top_of_heap, top_of_heap2);示例输出堆的顶部从 0x4000 到 0xa000 什么是 calloc 与malloc不同calloc将内存内容初始化为零并且还接受两个参数项目的数量和每个项目的字节大小。一个朴素但可读的calloc实现如下 void *calloc(size_t n, size_t size) {size_t total n * size; // Does not check for overflow!void *result malloc(total);if (!result) return NULL;// If were using new memory pages // just allocated from the system by calling sbrk // then they will be zero so zero-ing out is unnecessary,memset(result, 0, total);return result; }有关这些限制的高级讨论在这里。程序员通常使用calloc而不是在malloc后显式调用memset以将内存内容设置为零。请注意calloc(x,y)与calloc(y,x)相同但您应该遵循手册的约定。 // Ensure our memory is initialized to zero link_t *link malloc(256); memset(link, 0, 256); // Assumes malloc returned a valid address!link_t *link calloc(1, 256); // safer: calloc(1, sizeof(link_t));为什么 sbrk 首次返回的内存初始化为零如果操作系统没有清零物理 RAM 的内容可能会导致一个进程了解到先前使用过该内存的另一个进程的内存。这将是一个安全漏洞。不幸的是这意味着对于在释放任何内存之前进行的malloc请求和简单程序最终使用系统中新保留的内存来说内存通常是零。然后程序员错误地编写了假设 malloc’d 内存将始终为零的 C 程序。 char* ptr malloc(300); // contents is probably zero because we get brand new memory // so beginner programs appear to work! // strcpy(ptr, Some data); // work with the data free(ptr); // later char *ptr2 malloc(308); // Contents might now contain existing data and is probably not zero为什么 malloc 不总是将内存初始化为零性能我们希望 malloc 尽可能快。清零内存可能是不必要的。 realloc 是什么什么时候会用到它 realloc允许你调整之前通过 malloc、calloc 或 realloc 在堆上分配的现有内存分配的大小。realloc 最常见的用途是调整用于保存值数组的内存。下面建议一个朴素但可读的 realloc 版本 void * realloc(void * ptr, size_t newsize) {// Simple implementation always reserves more memory// and has no error checkingvoid *result malloc(newsize); size_t oldsize ... //(depends on allocators internal data structure)if (ptr) memcpy(result, ptr, newsize oldsize ? newsize : oldsize);free(ptr);return result; }下面显示了 realloc 的错误用法 int *array malloc(sizeof(int) * 2); array[0] 10; array[1] 20; // Ooops need a bigger array - so use realloc.. realloc (array, 3); // ERRORS! array[2] 30; 上面的代码包含两个错误。首先我们需要 3*sizeof(int)字节而不是 3 字节。其次realloc 可能需要将内存的现有内容移动到新位置。例如可能没有足够的空间因为相邻的字节已经被分配。下面显示了 realloc 的正确用法。 array realloc(array, 3 * sizeof(int)); // If array is copied to a new location then old allocation will be freed.一个健壮的版本还会检查NULL返回值。注意realloc可以用来增加和缩小分配。我在哪里可以读到更多信息参见man 页面内存分配的速度有多重要非常重要在大多数应用程序中分配和释放堆内存是常见操作。分配简介最愚蠢的 malloc 和 free 实现是什么有什么问题 void* malloc(size_t size) // Ask the system for more bytes by extending the heap space. // sbrk Returns -1 on failurevoid *p sbrk(size); if(p (void *) -1) return NULL; // No space leftreturn p; } void free() {/* Do nothing */}上述实现遭受两个主要缺点系统调用很慢与库调用相比。我们应该保留大量内存只偶尔向系统请求更多。不重用释放的内存。我们的程序从不重用堆内存-它只是不断地要求更大的堆。如果这个分配器在一个典型的程序中使用进程将很快耗尽所有可用的内存。相反我们需要一个能够有效利用堆空间并且只在必要时请求更多内存的分配器。什么是放置策略在程序执行期间内存被分配和释放因此堆内存中会有间隙空洞可以重新用于未来的内存请求。内存分配器需要跟踪堆的哪些部分当前被分配哪些部分是可用的。假设我们当前的堆大小是 64K尽管并非所有都在使用因为一些先前通过程序释放的 malloc 内存已经被释放了 16KB free10KB allocated1KB free1KB allocated30KB free4KB allocated2KB free 如果执行一个新的 2KB 的 malloc 请求malloc(2048)malloc 应该在哪里保留内存它可以使用最后的 2KB 空洞恰好是完美的大小或者它可以分割其他两个空闲空洞中的一个。这些选择代表不同的放置策略。无论选择哪个空洞分配器都需要将空洞分成两部分新分配的空间将返回给程序和一个较小的空洞如果有剩余空间。完美拟合策略找到足够大的最小空洞至少 2KB 16KB free10KB allocated1KB free1KB allocated30KB free4KB allocated2KB HERE! 最坏的拟合策略找到足够大的最大空洞所以将 30KB 的空洞分成两部分 16KB free10KB allocated1KB free1KB allocated2KB HERE!28KB free4KB allocated2KB free 第一个适合策略找到第一个足够大的可用空洞将 16KB 的空洞分成两部分 2KB HERE!14KB free10KB allocated1KB free1KB allocated30KB free4KB allocated2KB free 什么是外部碎片在下面的例子中64KB 的堆内存中有 17KB 被分配47KB 是空闲的。然而最大的可用块只有 30KB因为我们的可用未分配堆内存被分成了更小的块。 16KB free10KB allocated1KB free1KB allocated30KB free4KB allocated2KB free 放置策略对外部碎片和性能有什么影响不同的策略以不明显的方式影响堆内存的碎片化这只能通过数学分析或在真实条件下进行仔细模拟例如模拟数据库或 Web 服务器的内存分配请求来发现。例如最佳适配乍看起来似乎是一个很好的策略但是如果我们找不到一个完全大小合适的空洞那么这种放置会产生许多微小的无法使用的空洞导致高度碎片化。它还需要扫描所有可能的空洞。首次适配的优势在于它不会评估所有可能的放置因此更快。由于最坏适配针对最大的未分配空间如果需要大量分配则这是一个不好的选择。在实践中首次适配和下次适配这里没有讨论通常是常见的放置策略。还有混合方法和许多其他选择请参见实现内存分配器页面。编写堆分配器的挑战是什么主要挑战是需要最小化碎片化即最大化内存利用需要高性能繁琐的实现使用链表和指针算术进行大量指针操作一些额外的评论碎片化和性能都取决于应用程序的分配配置文件这可以进行评估但无法预测并且在实践中在特定的使用条件下专用分配器通常可以胜过通用实现。分配器事先不知道程序的内存分配请求。即使我们知道这也是著名的 NP 难题背包问题如何实现内存分配器好问题。实现内存分配器内存第二部分实现内存分配器内存分配器教程内存分配器需要跟踪哪些字节当前已分配哪些可供使用。本页介绍了构建分配器的实现和概念细节即实现malloc和free的实际代码。这个页面讨论了块的链接 - 我应该为它们分配内存吗尽管在概念上我们考虑创建链接列表和块列表但我们不需要“malloc 内存”来创建它们相反我们将整数和指针写入我们已经控制的内存中以便以后可以一致地从一个地址跳到下一个地址。这些内部信息代表了一些开销。因此即使我们从系统请求了 1024 KB 的连续内存我们也无法将所有内存提供给运行的程序。块思考我们可以将我们的堆内存看作是一个块的列表其中每个块都是已分配或未分配的。我们不是存储一个显式的指针列表而是存储关于块大小的信息作为块的一部分。因此在概念上有一个空闲块的列表但它是隐式的即以每个块的大小信息的形式存储。我们可以通过添加块的大小来从一个块导航到下一个块。例如如果您有一个指向块起始位置的指针p那么next_block将在((char *)p) *(size_t *) p如果您将块的大小以字节存储。将char *强制转换为确保指针算术是以字节计算的。将size_t *强制转换为确保在p处读取的内存是一个大小值如果p是void *或char *类型则必须。调用程序永远不会看到这些值它们是内存分配器实现的内部值。例如假设您的分配器被要求保留 80 字节malloc(80)并需要 8 字节的内部头数据。分配器需要找到至少 88 字节的未分配空间。在更新堆数据后它将返回一个指向该块的指针。但是返回的指针并不指向块的起始位置因为那里存储着内部大小数据相反我们将返回块的起始位置8 字节。在实现中记住指针算术取决于类型。例如p 8添加的是8 * sizeof(p)而不一定是 8 字节实现 malloc 最简单的实现使用首次适配从第一个块开始假设存在迭代直到找到表示足够大小的未分配空间的块或者我们已经检查了所有的块。如果找不到合适的块现在是调用 sbrk()的时候了以充分扩展堆的大小。一个快速的实现可能会显著地扩展它这样我们在不久的将来就不需要再请求更多的堆内存。当找到一个空闲块时它可能比我们需要的空间大。如果是这样我们将在我们的隐式列表中创建两个条目。第一个条目是已分配的块第二个条目是剩余的空间。有两种简单的方法可以确定块是否正在使用或可用。第一种是将其存储为头信息中的一个字节以及大小的最低位编码为 1因此块大小信息将仅限于偶数值 // Assumes p is a reasonable pointer type, e.g. size_t *. isallocated (*p) 1; realsize (*p) ~1; // mask out the lowest bit 对齐和向上取整的考虑许多体系结构希望多字节原语对齐到 2^n 的某个倍数。例如通常要求 4 字节类型对齐到 4 字节边界64 位系统上的 8 字节类型对齐到 8 字节边界。如果多字节原语未存储在合理的边界上例如从奇数地址开始则性能可能会受到显着影响因为可能需要两个内存读取请求而不是一个。在某些体系结构上惩罚甚至更大-程序将因总线错误而崩溃。由于malloc不知道用户将如何使用分配的内存双精度数组字符数组因此返回给程序的指针需要对最坏情况进行对齐这取决于体系结构。根据 glibc 文档glibc malloc使用以下启发式方法“malloc 给您的块保证对齐以便它可以容纳任何类型的数据。在 GNU 系统上大多数系统的地址始终是 8 的倍数在 64 位系统上是 16 的倍数。” 例如如果您需要计算需要多少个 16 字节单位请不要忘记四舍五入- int s (requested_bytes tag_overhead_bytes 15) / 16 附加的常数确保不完整的单元被四舍五入。请注意实际代码更有可能使用符号大小例如sizeof(x) - 1而不是编码数值常数 15。如果您有进一步兴趣这是一篇关于内存对齐的好文章关于内部碎片的说明内部碎片发生在您提供的块大于其分配大小时。假设我们有一个大小为 16B 的空闲块不包括元数据。如果它们分配了 7 个字节您可能希望将其四舍五入为 16B 并返回整个块。当您实现合并和分割时下一节情况会变得非常阴险。如果您两者都不实现那么您可能会为 7B 的分配返回一个大小为 64B 的块这种分配会产生大量的开销而我们正试图避免这种情况。实施释放当调用free时我们需要重新应用偏移量以返回到块的“真实”起始位置记住我们没有给用户指向块实际起始位置的指针即我们存储大小信息的位置。一个天真的实现只会将块标记为未使用。如果我们将块分配状态存储在最低大小位中那么我们只需要清除该位 *p (*p) ~1; // Clear lowest bit 然而我们还有更多的工作要做如果当前块和下一个块如果存在都是空闲的我们需要将这些块合并成一个单一的块。同样我们也需要检查前一个块。如果存在并表示未分配的内存那么我们需要将这些块合并成一个单一的大块。为了能够将一个空闲块与前一个空闲块合并我们还需要找到前一个块因此我们也将块的大小存储在块的末尾。这些被称为“边界标记”参考 Knuth73。由于块是连续的一个块的末尾就紧邻着下一个块的开始。因此当前块除了第一个块可以向后查找几个字节以查找前一个块的大小。有了这些信息您现在可以向后跳转了性能有了上述描述就可以构建一个内存分配器。它的主要优势是简单性 - 至少与其他分配器相比是简单的分配内存是最坏情况下的线性时间操作搜索链表以找到足够大的空闲块而释放是常数时间最多只需要将 3 个块合并成一个块。使用这个分配器可以尝试不同的放置策略。例如可以从上次释放块的位置开始搜索或者从上次分配的位置开始搜索。如果您存储块的指针您需要非常小心确保它们始终保持有效例如在合并块或其他更改堆结构的 malloc 或 free 调用时。显式空闲列表分配器通过实现一个显式的双向链表可以实现更好的性能。在这种情况下我们可以立即遍历到下一个空闲块和上一个空闲块。这可以减半搜索时间因为链表只包括未分配的块。第二个优势是我们现在对链表的排序有一定的控制。例如当一个块被释放时我们可以选择将其插入到链表的开头而不总是在其邻居之间。这将在下面讨论。我们在哪里存储链表的指针一个简单的技巧是意识到块本身没有被使用并将下一个和上一个指针存储为块的一部分尽管现在你必须确保空闲块始终足够大以容纳两个指针。我们仍然需要实现边界标签即使用大小的隐式列表以便我们可以正确地释放块并将它们与它们的两个邻居合并。因此显式空闲列表需要更多的代码和复杂性。使用显式链表使用快速简单的“查找第一个”算法来查找第一个足够大的链接。然而由于链接顺序可以被修改这对应于不同的放置策略。例如如果链接从大到小维护那么这将产生“最坏适合”放置策略。显式链表插入策略新释放的块可以轻松地插入到两个可能的位置在开头或按地址顺序通过使用边界标签首先找到邻居。在开头插入会创建一个 LIFO后进先出策略最近释放的空间将被重复使用。研究表明碎片化比使用地址顺序更严重。按地址顺序插入“按地址顺序策略”插入释放的块以便以递增的地址顺序访问块。这种策略需要更多的时间来释放块因为必须使用边界标签大小数据来找到下一个和上一个未分配的块。然而碎片化较少。案例研究Buddy Allocator分离列表的一个示例分离的分配器是将堆分成由不同子分配器处理的不同区域的分配器这取决于分配请求的大小。大小被分组为类例如2 的幂每个大小由不同的子分配器处理每个大小维护其自己的空闲列表。这种类型的一个众所周知的分配器是伙伴分配器。我们将讨论二进制伙伴分配器它将分配分成 2^nn 1, 2, 3…倍一些基本单位字节数的块但也存在其他类型例如斐波那契分割 - 你能看出为什么它被命名了吗。基本概念很简单如果没有大小为 2^n 的空闲块就转到下一个级别并窃取该块并将其分成两个。如果两个相邻的相同大小的块变为未分配状态则它们可以合并成一个两倍大小的单个大块。伙伴分配器之所以快速是因为可以从释放的块的地址计算出要合并的相邻块而不是遍历大小标签。最终的性能通常需要少量的汇编代码来使用专门的 CPU 指令来找到最低的非零位。伙伴分配器的主要缺点是它们受到内部碎片的影响因为分配被舍入到最近的块大小。例如68 字节的分配将需要一个 128 字节的块。进一步阅读和参考资料参见软件技术和理论计算机科学基础 1999 年会议论文集Google 图书第 85 页 UIUC 讲座幻灯片pptxpdf和维基百科的伙伴内存分配页面其他分配器有许多其他分配方案。例如SLUB维基百科- Linux 内核内部使用的三种分配器之一。内存第三部分破坏堆栈示例每个线程使用堆栈内存。堆栈“向下增长” - 如果一个函数调用另一个函数那么堆栈会扩展到更小的内存地址。堆栈内存包括非静态自动临时变量参数值和返回地址。如果缓冲区太小一些数据例如来自用户的输入值那么其他堆栈变量甚至返回地址可能会被覆盖。堆栈内容的精确布局和自动变量的顺序取决于体系结构和编译器。然而通过一些调查工作我们可以学会如何故意破坏特定体系结构的堆栈。下面的示例演示了返回地址存储在堆栈上的方式。对于特定的 32 位体系结构Live Linux Machine我们确定返回地址存储在自动变量地址的两个指针8 字节以上的地址。代码故意改变堆栈值以便当输入函数返回时不是继续在主方法内部进行而是跳转到利用函数。 // Overwrites the return address on the following machine: // http://cs-education.github.io/sys/ #include stdio.h #include stdlib.h #include unistd.hvoid breakout() {puts(Welcome. Have a shell...);system(/bin/sh); } void input() {void *p;printf(Address of stack variable: %p\n, p);printf(Something that looks like a return address on stack: %p\n, *((p)2));// Lets change it to point to the start of our sneaky function.*((p)2) breakout; } int main() {printf(main() code starts at %p\n,main);input();while (1) {puts(Hello);sleep(1);}return 0; }计算机通常有很多种方法来解决这个问题。内存复习问题主题最佳适配最差适配首次适配伙伴分配器内部碎片外部碎片 sbrk 自然对齐边界标签合并分割 Slab 分配/内存池问题/练习什么是内部碎片它何时成为一个问题什么是外部碎片它何时成为一个问题什么是最佳适配策略它与外部碎片有什么关系时间复杂度是多少什么是最差适配策略它在外部碎片方面有所改善吗时间复杂度是多少什么是首次适配放置策略它在碎片方面稍微好一点对吧预期时间复杂度是多少假设我们正在使用一个新的 64kb 大小的伙伴分配器。它如何分配 1.5kb 当 5 行sbrk实现 malloc 时有什么用处自然对齐是什么什么是合并/分割它们如何增加/减少碎片何时可以合并或分割边界标签是如何工作的它们如何用于合并或分割四、Pthreads 简介 Pthreads第一部分介绍线程简介什么是线程线程是“执行线程”的缩写。它表示 CPU 已经并将执行的指令序列。为了记住如何从函数调用返回并存储自动变量和参数的值线程使用堆栈。轻量级进程LWP是什么它与线程有什么关系对于所有目的和意图来说线程就是一个进程意味着创建线程类似于fork只是没有复制意味着没有写时复制。这允许进程共享相同的地址空间、变量、堆、文件描述符等。创建线程的实际系统调用类似于fork它是clone。我们不会深入讨论但您可以阅读man pages请记住这超出了本课程的直接范围。在许多情况下LWP 或线程比 forking 更受欢迎因为创建它们的开销要少得多。但在某些情况下特别是 Python 使用这种方式多进程是使代码更快的方法。线程的堆栈是如何工作的您的主函数以及您可能调用的其他函数具有自动变量。我们将使用堆栈将它们存储在内存中并使用简单指针“堆栈指针”跟踪堆栈的大小。如果线程调用另一个函数我们将将堆栈指针向下移动以便我们有更多的空间用于参数和自动变量。一旦从函数返回我们可以将堆栈指针移回到其先前的值。我们在堆栈上保留旧的堆栈指针值的副本这就是为什么从函数返回非常快速的原因-释放自动变量使用的内存很容易-我们只需要更改堆栈指针。在多线程程序中有多个堆栈但只有一个地址空间。pthread 库分配一些堆栈空间可以在堆中分配也可以使用主程序的堆栈的一部分并使用clone函数调用在该堆栈地址启动线程。总地址空间可能看起来像这样。我的进程可以有多少个线程您可以在一个进程内运行多个线程。您可以免费获得第一个线程它运行您在“main”内编写的代码。如果您需要更多线程可以使用 pthread 库调用pthread_create创建一个新线程。您需要传递一个指向函数的指针以便线程知道从哪里开始。您创建的所有线程都存在于相同的虚拟内存中因为它们是同一进程的一部分。因此它们都可以看到堆、全局变量和程序代码等。因此您可以让两个或更多CPU 同时在同一进程中运行您的程序。由操作系统来分配线程给 CPU。如果活动线程多于 CPU则内核将为线程分配一个 CPU 进行短暂的持续时间或直到它没有要做的事情然后将自动切换 CPU 以处理另一个线程。例如一个 CPU 可能正在处理游戏 AI而另一个线程正在计算图形输出。简单用法 Hello world pthread 示例要使用 pthread您需要包括pthread.h并且需要使用-pthread或-lpthread编译器选项进行编译。此选项告诉编译器您的程序需要线程支持要创建线程请使用函数pthread_create。此函数有四个参数 int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine) (void *), void *arg);第一个是指向将保存新创建的线程的 ID 的变量的指针。第二个是指向属性的指针我们可以使用它来调整和调优一些 pthread 的高级特性。第三个是指向我们想要运行的函数的指针第四个是将赋予我们的函数的指针 void *(*start_routine) (void *) 这个参数很难理解它表示一个接受 void * 指针并返回 void * 指针的指针。它看起来像一个函数声明只是函数的名称被 (* .... ) 包裹起来。以下是最简单的例子 #include stdio.h #include pthread.h // remember to set compilation option -pthreadvoid *busy(void *ptr) { // ptr will point to Hiputs(Hello World);return NULL; } int main() {pthread_t id;pthread_create(id, NULL, busy, Hi);while (1) {} // Loop forever }如果我们想要等待线程完成可以使用 pthread_join。 void *result; pthread_join(id, result);在上面的例子中result 将会是 null因为忙碌的函数返回了 null。我们需要传递结果的地址因为 pthread_join 将会写入指针的内容。参见Pthreads Part 2 Pthreads第二部分实际应用更多的 pthread 函数如何创建一个 pthread 参见Pthreads Part 1介绍了 pthread_create 和 pthread_join 如果我调用 pthread_create 两次我的进程会有多少个堆栈你的进程将包含三个堆栈 - 每个线程一个。第一个线程在进程启动时创建然后你创建了另外两个。实际上可能会有更多的堆栈但现在让我们忽略这个复杂性。重要的想法是每个线程都需要一个堆栈因为堆栈包含自动变量和旧的 CPU PC 寄存器以便在函数完成后可以返回执行调用函数。一个完整进程和一个线程之间的区别是什么此外与进程不同同一进程中的线程可以共享相同的全局内存数据和堆段。 pthread_cancel 是做什么的停止一个线程。请注意线程可能不会立即停止。例如当线程进行操作系统调用例如 write时它可以被终止。在实践中pthread_cancel 很少被使用因为它不给线程一个机会在自身之后进行清理例如它可能已经打开了一些文件。另一种实现方法是使用一个布尔int变量其值用于通知其他线程它们应该完成并进行清理。 exit 和 pthread_exit 之间有什么区别 exit(42) 退出整个进程并设置进程的退出值。这相当于在主方法中返回 42。进程内的所有线程都会停止。 pthread_exit(void *) 只会停止调用线程即调用 pthread_exit 后线程永远不会返回。如果没有其他线程在运行pthread 库将自动完成进程。pthread_exit(...) 等同于从线程函数返回两者都会完成线程并为线程设置返回值void *指针。在 main 线程中调用 pthread_exit 是简单程序确保所有线程完成的常见方法。例如在下面的程序中myfunc 线程可能没有时间开始。 int main() {pthread_t tid1, tid2;pthread_create(tid1, NULL, myfunc, Jabberwocky);pthread_create(tid2, NULL, myfunc, Vorpel);exit(42); //or return 42;// No code is run after exit }接下来的两个程序将等待新线程完成- int main() {pthread_t tid1, tid2;pthread_create(tid1, NULL, myfunc, Jabberwocky);pthread_create(tid2, NULL, myfunc, Vorpel);pthread_exit(NULL); // No code is run after pthread_exit// However process will continue to exist until both threads have finished }或者我们可以在每个线程上进行连接即等待它完成然后从主函数返回或调用 exit。 int main() {pthread_t tid1, tid2;pthread_create(tid1, NULL, myfunc, Jabberwocky);pthread_create(tid2, NULL, myfunc, Vorpel);// wait for both threads to finish :void* result;pthread_join(tid1, result);pthread_join(tid2, result); return 42; }请注意pthread_exit 版本会创建线程僵尸但这不是长时间运行的进程所以我们不在乎。线程如何被终止从线程函数返回调用 pthread_exit 使用 pthread_cancel 取消线程终止进程例如 SIGTERMexit()从 main 返回 pthread_join 的目的是什么等待线程完成清理线程资源获取线程的返回值如果不调用 pthread_join 会发生什么已完成的线程将继续消耗资源。最终如果创建了足够多的线程pthread_create 将失败。在实践中这只是长时间运行进程的问题但对于简单的短暂进程来说并不是问题因为当进程退出时所有线程资源都会被自动释放。我应该使用 pthread_exit 还是 pthread_join pthread_exit 和 pthread_join 都会让其他线程自行完成即使在主线程中调用。但是只有 pthread_join 会在指定线程完成时返回。pthread_exit 不会等待它会立即结束线程并且不会给你继续执行的机会。你能把指针从一个线程传递给另一个线程的堆栈变量吗是的。但是你需要非常小心关于堆栈变量的生命周期。 pthread_t start_threads() {int start 42;pthread_t tid;pthread_create(tid, 0, myfunc, start); // ERROR!return tid; } 上面的代码是无效的因为函数start_threads很可能会在myfunc开始之前返回。该函数传递了start的地址但是当myfunc执行时start已经不在作用域内其地址将被重新用于另一个变量。以下代码是有效的因为栈变量的生命周期比后台线程长。 void start_threads() {int start 42;void *result;pthread_t tid;pthread_create(tid, 0, myfunc, start); // OK - start will be valid!pthread_join(tid, result); } 竞争条件简介我怎样才能创建十个具有不同起始值的线程。以下代码应该启动十个值为 0,1,2,3,…9 的线程但运行时打印出1 7 8 8 8 8 8 8 8 10你能看出为什么吗 #include pthread.h void* myfunc(void* ptr) {int i *((int *) ptr);printf(%d , i);return NULL; }int main() {// Each thread gets a different value of i to processint i;pthread_t tid;for(i 0; i 10; i) {pthread_create(tid, NULL, myfunc, i); // ERROR}pthread_exit(NULL); }上面的代码存在“竞争条件” - i 的值正在改变。新线程稍后启动在示例输出中最后一个线程在循环结束后启动。为了克服这种竞争条件我们将为每个线程提供一个指向其自己数据区域的指针。例如对于每个线程我们可能希望存储 id、起始值和输出值 struct T {pthread_t id;int start;char result[100]; };这些可以存储在数组中 - struct T *info calloc(10 , sizeof(struct T)); // reserve enough bytes for ten T structures 并且每个数组元素都传递给每个线程 - pthread_create(info[i].id, NULL, func, info[i]); 为什么有些函数例如 asctime、getenv、strtok、strerror不是线程安全的为了回答这个问题让我们看一个简单的函数它也不是“线程安全”的 char *to_message(int num) {char static result [256];if (num 10) sprintf(result, %d : blah blah , num);else strcpy(result, Unknown);return result; }在上面的代码中结果缓冲区存储在全局内存中。这很好 - 我们不希望返回指向栈上无效地址的指针但整个内存中只有一个结果缓冲区。如果两个线程同时使用它那么一个线程将破坏另一个时间线程 1线程 2注释1to_m(5)2to_m(99)现在两个线程都会看到结果缓冲区中存储的是“未知” 什么是条件变量、信号量、互斥锁这些是同步锁用于防止竞争条件并确保同一程序中运行的线程之间的正确同步。此外这些锁在概念上与内核内部使用的原语相同。使用线程而不是分叉进程有什么优势吗是的在线程之间共享信息很容易因为线程同一进程的线程存在于相同的虚拟内存空间中。此外创建线程比创建分叉进程要快得多。使用线程而不是分叉进程有什么缺点吗是的没有隔离因为线程存在于同一个进程中一个线程可以访问与其他线程相同的虚拟内存。一个线程可以终止整个进程例如尝试读取地址零。您可以使用多个线程分叉一个进程吗是的但是子进程只有一个线程这是调用fork的线程的克隆。我们可以将其视为一个简单的例子后台线程在子进程中从不打印出第二条消息。 #include pthread.h #include stdio.h #include unistd.hstatic pid_t child -2;void *sleepnprint(void *arg) {printf(%d:%s starting up...\n, getpid(), (char *) arg);while (child -2) {sleep(1);} /* Later we will use condition variables */printf(%d:%s finishing...\n,getpid(), (char*)arg);return NULL; } int main() {pthread_t tid1, tid2;pthread_create(tid1,NULL, sleepnprint, New Thread One);pthread_create(tid2,NULL, sleepnprint, New Thread Two);child fork();printf(%d:%s\n,getpid(), fork()ing complete);sleep(3);printf(%d:%s\n,getpid(), Main thread finished);pthread_exit(NULL);return 0; /* Never executes */ }8970:New Thread One starting up... 8970:fork()ing complete 8973:fork()ing complete 8970:New Thread Two starting up... 8970:New Thread Two finishing... 8970:New Thread One finishing... 8970:Main thread finished 8973:Main thread finished 实际上在分叉之前创建线程可能会导致意外错误因为如上所示其他线程在分叉时立即终止。另一个线程可能刚刚锁定了互斥锁例如通过调用 malloc并且再也不会解锁。高级用户可能会发现pthread_atfork有用但我们建议您通常尽量避免在分叉之前创建线程除非您完全了解这种方法的限制和困难。还有其他情况下fork可能比创建线程更可取吗。创建单独的进程很有用当需要更多安全性时例如Chrome 浏览器为不同的标签使用不同的进程在运行现有和完整的程序时需要一个新进程例如启动’gcc’ 当您遇到同步原语并且每个进程都在系统中操作某些东西时我怎样才能找到更多信息在man 页面中查看完整示例并在pthread 参考指南中查看。另外简明的第三方示例代码解释创建、连接和退出 Pthreads第三部分并行问题奖励概述下一节将讨论当 pthread 发生冲突时会发生什么但如果每个线程做的事情完全不同没有重叠呢我们找到了最大加速并行问题吗尴尬的并行问题并行算法的研究在过去几年里迅速发展。一个尴尬的并行问题是指需要很少的工作就可以转换为并行的问题。其中很多问题都涉及一些同步概念但并非总是如此。你已经知道一个可并行化的算法归并排序 void merge_sort(int *arr, size_t len){if(len 1){//Mergesort the left half//Mergesort the right half//Merge the two halves}有了对线程的新理解你只需要为左半部分创建一个线程为右半部分创建一个线程。鉴于你的 CPU 有多个真实核心你将看到与Amdahl’s Law相符的加速。时间复杂度分析在这里也变得有趣。并行算法的运行时间为 O(log^3(n))因为我们假设有很多核心。然而在实践中我们通常会做两个改变。一是一旦数组变得足够小我们就会放弃并行归并排序算法转而使用快速排序或其他在小数组上运行快速的算法某种缓存一致性。另一件我们知道的事情是CPU 并不拥有无限的核心。为了解决这个问题我们通常会保留一个工作池。工作池我们知道 CPU 的核心数量是有限的。很多时候我们会启动一些线程并在它们空闲时给它们任务。另一个问题Parallel Map 假设我们想要对整个数组应用一个函数一次处理一个元素。 int *map(int (*func)(int), int *arr, size_t len){int *ret malloc(len*sizeof(*arr));for(size_t i 0; i len; i) ret[i] func(arr[i]);return ret; }由于没有任何元素依赖于其他元素你会如何并行化这个问题你认为在线程之间如何分配工作最好调度有几种方法可以分解工作。静态调度将问题分解成固定大小的块预先确定的并让每个线程处理其中的每个块。当每个子问题花费的时间大致相同时这种方法效果很好因为没有额外的开销。你只需要编写一个循环并将 map 函数分配给每个子数组。动态调度当一个新问题可用时让一个线程处理它。当你不知道调度需要多长时间时这是很有用的。引导调度这是上述两种方法的混合具有各自的优点和权衡。你可以从静态调度开始如果需要的话慢慢转向动态调度。运行时调度你完全不知道问题需要多长时间。与其自己决定不如让程序决定该做什么来源但不需要记住。一些缺点你不会立即看到加速因为缓存一致性和调度额外的线程等原因。其他问题从Wikipedia 在 Web 服务器上为多个用户提供静态文件。曼德勃罗集、Perlin 噪声和类似的图像其中每个点都是独立计算的。计算机图形的渲染。在计算机动画中每一帧可能是独立渲染的参见并行渲染。在密码学中的暴力搜索。值得注意的现实世界例子包括 distributed.net 和加密货币中使用的工作证明系统。生物信息学中用于多个查询的 BLAST 搜索但不适用于单个大查询[9] 大规模人脸识别系统将数千个任意获取的人脸例如通过闭路电视的安全或监控视频与同样大量的先前存储的人脸例如罪犯库或类似的观察名单进行比较。比较许多独立场景的计算机模拟例如气候模型。进化计算元启发式如遗传算法。数值天气预报的集合计算。粒子物理中的事件模拟和重建。 Marching squares 算法二次筛和数域筛的筛选步骤。随机森林机器学习技术中的树生长步骤。离散傅立叶变换其中每个谐波都是独立计算的。 Pthread 复习问题主题 pthread 生命周期每个线程都有一个堆栈从线程中捕获返回值使用pthread_join 使用pthread_create 使用pthread_exit 在什么条件下进程会退出问题当创建一个 pthread 时会发生什么你不需要进入超级细节每个线程的堆栈在哪里如何在给定pthread_t的情况下获得返回值线程可以如何设置返回值如果丢弃返回值会发生什么为什么pthread_join很重要考虑堆栈空间、寄存器、返回值在正常情况下pthread_exit做什么即你不是最后一个线程调用 pthread_exit 时会调用哪些其他函数给我三个多线程进程将退出的条件。你还能想到其他条件吗什么是尴尬并行问题五、同步同步第一部分互斥锁解决临界区什么是临界区临界区是一段代码只能由一个线程同时执行如果程序要正确运行。如果两个线程或进程同时在临界区内执行代码那么可能程序可能不再具有正确的行为。仅仅递增一个变量是否是临界区可能。递增变量i是通过三个单独的步骤执行的将内存内容复制到 CPU 寄存器。增加 CPU 中的值。将新值存储在内存中。如果内存位置只能由一个线程访问例如下面的自动变量i则不可能发生竞争条件也没有与i相关的临界区。但是sum变量是全局变量并且被两个线程访问。可能两个线程可能同时尝试递增变量。 #include stdio.h #include pthread.h // Compile with -pthreadint sum 0; //sharedvoid *countgold(void *param) {int i; //local to each threadfor (i 0; i 10000000; i) {sum 1;}return NULL; }int main() {pthread_t tid1, tid2;pthread_create(tid1, NULL, countgold, NULL);pthread_create(tid2, NULL, countgold, NULL);//Wait for both threads to finish:pthread_join(tid1, NULL);pthread_join(tid2, NULL);printf(ARRRRG sum is %d\n, sum);return 0; }上述代码的典型输出是ARGGGH sum is 8140268每次运行程序时都会打印不同的总和因为存在竞争条件代码无法阻止两个线程同时读写sum。例如两个线程都将当前的 sum 值复制到运行每个线程的 CPU 中假设为 123。两个线程都将其自己的副本增加一。两个线程写回该值124。如果线程在不同时间访问了 sum则计数将为 125。如何确保一次只有一个线程可以访问全局变量你的意思是“帮助 - 我需要一个互斥体”如果一个线程当前正在临界区内我们希望另一个线程等到第一个线程完成。为此我们可以使用互斥体Mutual Exclusion 的缩写。对于简单的示例我们需要添加的代码最少只有三行 pthread_mutex_t m PTHREAD_MUTEX_INITIALIZER; // global variable pthread_mutex_lock(m); // start of Critical Section pthread_mutex_unlock(m); //end of Critical Section一旦我们完成了互斥体我们还应该调用pthread_mutex_destroy(m)。请注意您只能销毁未锁定的互斥体。对已销毁的锁调用 destroy初始化已初始化的锁锁定已锁定的锁解锁未锁定的锁等都是不受支持的至少对于默认的互斥体通常会导致未定义的行为。如果我锁定了互斥体是否会阻止所有其他线程不其他线程将继续。只有当一个线程尝试锁定已经锁定的互斥体时线程才必须等待。一旦原始线程解锁互斥体第二个等待的线程将获取锁并能够继续。还有其他创建互斥体的方法吗可以。您可以仅对全局“静态”变量使用宏 PTHREAD_MUTEX_INITIALIZER。m PTHREAD_MUTEX_INITIALIZER 等同于更通用的pthread_mutex_init(m,NULL)。init 版本包括用于在性能和额外错误检查以及高级共享选项之间进行权衡的选项。 pthread_mutex_t *lock malloc(sizeof(pthread_mutex_t)); pthread_mutex_init(lock, NULL); //later pthread_mutex_destroy(lock); free(lock);关于“init”和“destroy”需要记住的事情多个线程的初始化/销毁具有未定义的行为销毁锁定的互斥体具有未定义的行为基本上尝试遵循一个线程初始化一个互斥体而且只有一个线程初始化一个互斥体的模式。互斥体陷阱所以 pthread_mutex_lock在其他线程读取相同变量时会停止吗不互斥体不是那么聪明 - 它与代码线程一起工作而不是数据。只有当另一个线程在锁定的互斥体上调用lock时第二个线程才需要等待直到互斥体被解锁。考虑 int a; pthread_mutex_t m1 PTHREAD_MUTEX_INITIALIZER,m2 PTHREAD_MUTEX_INITIALIZER; // later // Thread 1 pthread_mutex_lock(m1); a; pthread_mutex_unlock(m1);// Thread 2 pthread_mutex_lock(m2); a; pthread_mutex_unlock(m2);仍会导致竞争条件。我可以在 fork 之前创建互斥体吗是的 - 但是子进程和父进程将不共享虚拟内存并且每个进程都将拥有独立于其他进程的互斥体。高级说明使用共享内存有高级选项允许子进程和父进程共享互斥体如果使用正确的选项并使用共享内存段。请参阅stackoverflow 示例如果一个线程锁定了一个互斥锁另一个线程能解锁它吗不行。同一个线程必须解锁它。我可以使用两个或更多的互斥锁吗是的事实上通常每个需要更新的数据结构都有一个锁。如果你只有一个锁那么两个线程之间可能会对锁有显著的争用这是不必要的。例如如果两个线程正在更新两个不同的计数器可能不需要使用相同的锁。然而简单地创建许多锁是不够的重要的是能够推理关于临界区的问题例如一个线程不能在更新期间读取两个数据结构而这两个数据结构暂时处于不一致的状态。调用 lock 和 unlock 会有任何开销吗调用pthread_mutex_lock和_unlock会有一些开销然而这是你为了程序正确运行所付出的代价最简单的完整示例下面显示了一个完整的示例 #include stdio.h #include pthread.h// Compile with -pthread // Create a mutex this ready to be locked! pthread_mutex_t m PTHREAD_MUTEX_INITIALIZER;int sum 0;void *countgold(void *param) {int i;//Same thread that locks the mutex must unlock it//Critical section is just sum 1//However locking and unlocking a million times//has significant overhead in this simple answerpthread_mutex_lock(m);// Other threads that call lock will have to wait until we call unlockfor (i 0; i 10000000; i) {sum 1;}pthread_mutex_unlock(m);return NULL; }int main() {pthread_t tid1, tid2;pthread_create(tid1, NULL, countgold, NULL);pthread_create(tid2, NULL, countgold, NULL);//Wait for both threads to finish:pthread_join(tid1, NULL);pthread_join(tid2, NULL);printf(ARRRRG sum is %d\n, sum);return 0; }在上面的代码中线程在进入计数室之前获取了锁。关键部分只有sum1所以下一个版本也是正确的但更慢 - for (i 0; i 10000000; i) {pthread_mutex_lock(m);sum 1;pthread_mutex_unlock(m);}return NULL; }这个过程运行得更慢因为我们一百万次锁定和解锁互斥锁这是昂贵的 - 至少与递增一个变量相比是昂贵的。在这个简单的例子中我们并不真正需要线程 - 我们可以加两次一个更快的多线程示例是使用一个自动本地变量添加一百万然后在计算循环结束后将其添加到共享总数中 int local 0;for (i 0; i 10000000; i) {local 1;}pthread_mutex_lock(m);sum local;pthread_mutex_unlock(m);return NULL; }如果我忘记解锁会发生什么死锁我们稍后会谈论死锁但如果多个线程调用这个循环会有什么问题。 while(not_stop){//stdin may not be thread safepthread_mutex_lock(m);char *line getline(...);if(rand() % 2) { /* randomly skip lines */continue;}pthread_mutex_unlock(m);process_line(line); }我什么时候可以销毁互斥锁你只能销毁一个未锁定的互斥锁我可以将 pthread_mutex_t 复制到新的内存位置吗不行将互斥锁的字节复制到新的内存位置然后使用副本是不支持的。互斥锁的简单实现会是什么样的下面显示了一个简单但不正确的建议。unlock函数只是解锁互斥锁并返回。lock 函数首先检查锁是否已经被锁定。如果当前已经被锁定它将继续检查直到另一个线程解锁互斥锁。 // Version 1 (Incorrect!)void lock(mutex_t *m) {while(m-locked) { /*Locked? Nevermind - just loop and check again!*/ }m-locked 1; } void unlock(mutex_t *m) {m-locked 0; }版本 1 使用了“忙等待”不必要地浪费 CPU 资源但更严重的问题是我们有一个竞争条件如果两个线程同时调用lock有可能两个线程都会将’m_locked’读取为零。因此两个线程都会认为它们对锁有独占访问权然后两个线程都会继续。哎呀我们可以尝试通过在循环内调用pthread_yield()来减少一点 CPU 开销 - pthread_yield 建议操作系统暂时不使用 CPU因此 CPU 可能被分配给等待运行的线程。但这并不能解决竞争条件。我们需要一个更好的实现 - 你能想出如何防止竞争条件吗我怎样才能了解更多玩阅读 man page pthread_mutex_lock man page pthread_mutex_unlock man page pthread_mutex_init man page pthread_mutex_destroy man page 同步第二部分计数信号量什么是计数信号量计数信号量包含一个值并支持两个操作“等待”和“发布”。发布增加信号量并立即返回。“等待”将在计数为零时等待。如果计数不为零则信号量将减少计数并立即返回。一个类比是饼干罐中的饼干数量或者宝箱中的金币数量。在拿饼干之前调用“等待”。如果没有剩下饼干那么等待将不会返回它将等待直到另一个线程通过调用 post 增加信号量。简而言之“发布”增加并立即返回而“等待”将在计数为零时等待。在返回之前它将减少计数。我如何创建一个信号量本页介绍了未命名信号量。不幸的是Mac OS X 目前还不支持这些。首先决定初始值是零还是其他值例如数组中剩余空间的数量。与 pthread 互斥锁不同创建信号量没有捷径 - 使用sem_init #include semaphore.hsem_t s; int main() {sem_init(s, 0, 10); // returns -1 (FAILED) on OS Xsem_wait(s); // Could do this 10 times without blockingsem_post(s); // Announce that weve finished (and one more resource item is available; increment count)sem_destroy(s); // release resources of the semaphore }我可以从不同的线程调用 wait 和 post 吗可以与互斥锁不同增量和减量可以来自不同的线程。可以使用信号量代替互斥锁吗是的 - 虽然信号量的开销更大。要使用信号量用计数为一初始化信号量。用...lock替换sem_wait 用...unlock替换sem_post 互斥锁是一个在“发布”之前始终“等待”的信号量 sem_t s; sem_init(s, 0, 1);sem_wait(s); // Critical Section sem_post(s);我可以在信号处理程序中使用 sem_post 吗是的sem_post是少数几个可以在信号处理程序中正确使用的函数之一。这意味着我们可以释放一个等待的线程该线程现在可以进行所有我们不允许在信号处理程序本身内调用的调用例如printf。 #include stdio.h #include pthread.h #include signal.h #include semaphore.h #include unistd.hsem_t s;void handler(int signal) {sem_post(s); /* Release the Kraken! */ }void *singsong(void *param) {sem_wait(s);printf(I had to wait until your signal released me!\n); }int main() {int ok sem_init(s, 0, 0 /* Initial value of zero*/); if (ok -1) {perror(Could not create unnamed semaphore);return 1;}signal(SIGINT, handler); // Too simple! See note belowpthread_t tid;pthread_create(tid, NULL, singsong, NULL);pthread_exit(NULL); /* Process will exit when there are no more threads */ }请注意健壮的程序不会在多线程程序中使用signal()“在多线程进程中使用 signal()的效果是未指定的。”- 信号手册页一个更正确的程序将需要使用sigaction。我如何找到更多信息阅读手册页 sem_init sem_wait sem_post sem_destroy 同步第三部分使用互斥锁和信号量线程安全的堆栈什么是原子操作用维基百科的话来说如果一个操作或一组操作在系统的其他部分看起来是瞬间发生的那么它就是原子的或不可中断的。没有锁只有简单的 CPU 指令“从内存中读取这个字节”是原子的不可分割的。在单 CPU 系统中可以暂时禁用中断这样一系列操作就不能被中断但实际上原子性是通过使用同步原语来实现的通常是互斥锁。递增变量i不是原子的因为它需要三个不同的步骤将位模式从内存复制到 CPU使用 CPU 的寄存器进行计算将位模式复制回内存。在这个递增序列期间另一个线程或进程仍然可以读取旧值并且当递增序列完成时对同一内存的其他写入也会被覆盖。我如何使用互斥锁使我的数据结构线程安全请注意这只是一个介绍 - 编写高性能的线程安全数据结构需要自己的书这是一个简单的数据结构堆栈它不是线程安全的 // A simple fixed-sized stack (version 1) #define STACK_SIZE 20 int count; double values[STACK_SIZE];void push(double v) { values[count] v; }double pop() {return values[--count]; }int is_empty() {return count 0; }堆栈的版本 1 不是线程安全的因为如果两个线程同时调用 push 或 pop那么结果或堆栈可能是不一致的。例如想象一下如果两个线程同时调用 pop那么两个线程可能读取相同的值两个线程可能读取原始计数值。要将其转换为线程安全的数据结构我们需要确定我们代码的关键部分即哪些部分的代码必须一次只有一个线程。在上面的例子中pushpop和is_empty函数访问相同的变量即内存并且堆栈的所有关键部分。当push和pop正在执行时数据结构处于不一致状态例如计数可能尚未写入因此可能仍然包含原始值。通过用互斥锁包装这些方法我们可以确保一次只有一个线程可以更新或读取堆栈。以下是一个候选的“解决方案”。它正确吗如果不是它将如何失败 // An attempt at a thread-safe stack (version 2) #define STACK_SIZE 20 int count; double values[STACK_SIZE];pthread_mutex_t m1 PTHREAD_MUTEX_INITIALIZER; pthread_mutex_t m2 PTHREAD_MUTEX_INITIALIZER;void push(double v) { pthread_mutex_lock(m1);values[count] v;pthread_mutex_unlock(m1); }double pop() {pthread_mutex_lock(m2);double v values[--count];pthread_mutex_unlock(m2);return v; }int is_empty() {pthread_mutex_lock(m1);return count 0;pthread_mutex_unlock(m1); } 上面的代码“版本 2”至少包含一个错误。花点时间看看你能不能找到错误并弄清楚后果。如果三个线程同时调用push()锁m1确保只有一个线程在操作堆栈两个线程将需要等待直到第一个线程完成调用解锁然后第二个线程将被允许继续进入临界区最后第三个线程将在第二个线程完成后被允许继续。类似的论点也适用于并发调用同时调用pop。然而版本 2 不会阻止push和pop同时运行因为push和pop使用两个不同的互斥锁。在这种情况下修复很简单 - 对 push 和 pop 函数都使用相同的互斥锁。代码还有第二个错误is_empty在比较后返回不会解锁互斥锁。然而错误不会立即被发现。例如假设一个线程调用is_empty稍后第二个线程调用push。这个线程会神秘地停止。使用调试器你可以发现线程在push方法内的 lock()方法处被卡住因为之前的is_empty调用没有解锁。因此一个线程的疏忽导致了任意其他线程在以后的时间出现问题。以下是更好的版本 - // An attempt at a thread-safe stack (version 3) int count; double values[count]; pthread_mutex_t m PTHREAD_MUTEX_INITIALIZER;void push(double v) { pthread_mutex_lock(m); values[count] v;pthread_mutex_unlock(m); } double pop() {pthread_mutex_lock(m);double v values[--count];pthread_mutex_unlock(m);return v; } int is_empty() {pthread_mutex_lock(m);int result count 0;pthread_mutex_unlock(m);return result; }版本 3 是线程安全的我们已经确保了所有关键部分的互斥但有两点需要注意 is_empty是线程安全的但它的结果可能已经过时即在线程得到结果时堆栈可能不再为空没有保护免受下溢在空堆栈上弹出或上溢在已满堆栈上推入后一点可以使用计数信号量来修复。该实现假定为单个堆栈。更通用的版本可能会将互斥锁作为内存结构的一部分并使用 pthread_mutex_init 来初始化互斥锁。例如 // Support for multiple stacks (each one has a mutex) typedef struct stack {int count;pthread_mutex_t m; double *values; } stack_t;stack_t* stack_create(int capacity) {stack_t *result malloc(sizeof(stack_t));result-count 0;result-values malloc(sizeof(double) * capacity);pthread_mutex_init(result-m, NULL);return result; } void stack_destroy(stack_t *s) {free(s-values);pthread_mutex_destroy(s-m);free(s); } // Warning no underflow or overflow checks!void push(stack_t *s, double v) { pthread_mutex_lock(s-m); s-values[(s-count)] v; pthread_mutex_unlock(s-m); }double pop(stack_t *s) { pthread_mutex_lock(s-m); double v s-values[--(s-count)]; pthread_mutex_unlock(s-m); return v; }int is_empty(stack_t *s) { pthread_mutex_lock(s-m); int result s-count 0; pthread_mutex_unlock(s-m);return result; }示例用法 int main() {stack_t *s1 stack_create(10 /* Max capacity*/);stack_t *s2 stack_create(10);push(s1, 3.141);push(s2, pop(s1));stack_destroy(s2);stack_destroy(s1); }堆栈信号量如果堆栈为空或已满我如何强制我的线程等待使用计数信号量使用计数信号量来跟踪剩余空间的数量另一个信号量来跟踪堆栈中项目的数量。我们将称这两个信号量为’sremain’和’sitems’。记住sem_wait会在信号量的计数被另一个线程调用sem_post减少到零时等待。 // Sketch #1sem_t sitems; sem_t sremain; void stack_init(){sem_init(sitems, 0, 0);sem_init(sremain, 0, 10); }double pop() {// Wait until theres at least one itemsem_wait(sitems);...void push(double v) {// Wait until theres at least one spacesem_wait(sremain);...草图2 已经实现了太早的post。在 push 中等待的另一个线程可能会错误地尝试写入一个已满的堆栈同样等待 pop()的线程可能会过早地继续。 // Sketch #2 (Error!) double pop() {// Wait until theres at least one itemsem_wait(sitems);sem_post(sremain); // error! wakes up pushing() thread too earlyreturn values[--count]; } void push(double v) {// Wait until theres at least one spacesem_wait(sremain);sem_post(sitems); // error! wakes up a popping() thread too earlyvalues[count] v; }草图 3 实现了正确的信号量逻辑但你能发现错误吗 // Sketch #3 (Error!) double pop() {// Wait until theres at least one itemsem_wait(sitems);double v values[--count];sem_post(sremain);return v; }void push(double v) {// Wait until theres at least one spacesem_wait(sremain);values[count] v;sem_post(sitems); }草图 3 正确地使用信号量强制执行了缓冲区满和缓冲区空的条件。然而没有互斥两个线程可以同时处于临界区这将破坏数据结构或至少导致数据丢失。修复方法是在临界区周围包装一个互斥锁 // Simple single stack - see above example on how to convert this into a multiple stacks. // Also a robust POSIX implementation would check for EINTR and error codes of sem_wait.// PTHREAD_MUTEX_INITIALIZER for statics (use pthread_mutex_init() for stack/heap memory)pthread_mutex_t m PTHREAD_MUTEX_INITIALIZER; int count 0; double values[10]; sem_t sitems, sremain;void init() {sem_init(sitems, 0, 0);sem_init(sremains, 0, 10); // 10 spaces }double pop() {// Wait until theres at least one itemsem_wait(sitems);pthread_mutex_lock(m); // CRITICAL SECTIONdouble v values[--count];pthread_mutex_unlock(m);sem_post(sremain); // Hey world, theres at least one spacereturn v; }void push(double v) {// Wait until theres at least one spacesem_wait(sremain);pthread_mutex_lock(m); // CRITICAL SECTIONvalues[count] v;pthread_mutex_unlock(m);sem_post(sitems); // Hey world, theres at least one item } // Note a robust solution will need to check sem_waits result for EINTR (more about this later)常见的互斥锁陷阱是什么由于愚蠢的拼写错误而锁定/解锁错误的互斥锁未解锁互斥锁由于在错误条件下提前返回资源泄漏未调用pthread_mutex_destroy 使用未初始化的互斥锁或使用已被销毁的互斥锁在线程上两次锁定互斥锁未首先解锁死锁和优先级反转我们稍后会讨论这些同步第四部分关键部分问题候选解决方案什么是关键部分问题如已在Synchronization, Part 3: Working with Mutexes And Semaphores中讨论的我们的代码中有一些关键部分只能由一个线程同时执行。我们将这种要求描述为“互斥排他”只有一个线程或进程可以访问共享资源。在多线程程序中我们可以使用互斥锁和解锁调用来包装关键部分 pthread_mutex_lock() - one thread allowed at a time! (others will have to wait here) ... Do Critical Section stuff here! pthread_mutex_unlock() - let other waiting threads continue我们如何实现这些锁定和解锁调用我们能创建一个保证互斥的算法吗下面显示了一个不正确的实现 pthread_mutex_lock(p_mutex_t *m) { while(m-lock) {}; m-lock 1;} pthread_mutex_unlock(p_mutex_t *m) { m-lock 0; }乍一看代码似乎是有效的如果一个线程尝试锁定互斥量稍后的线程必须等到锁被释放。然而这种实现不能满足互斥。让我们从两个大致同时运行的线程的角度仔细观察这个“实现”。在下表中时间从上到下依次进行- 时间线程 1线程 21while(lock) {}2while(lock) {}3lock 1lock 1 哎呀存在竞争条件。不幸的是两个线程都检查了锁并读取了一个错误的值因此能够继续执行。关键部分问题的候选解决方案。为了简化讨论我们只考虑两个线程。请注意这些论点适用于线程和进程经典的 CS 文献讨论了这些问题涉及到需要对关键部分或共享资源进行独占访问即互斥的两个进程。提高标志表示线程/进程进入关键部分的意图。请记住下面概述的伪代码是较大程序的一部分线程或进程通常需要在进程的生命周期中多次进入关键部分。因此想象每个示例都包裹在一个循环中在循环中线程或进程在其他事务上工作了一段随机时间。下面描述的候选解决方案有什么问题吗 // Candidate #1 wait until your flag is lowered raise my flag // Do Critical Section stuff lower my flag 答案候选解决方案1 也存在竞争条件即它不能满足互斥排他因为两个线程/进程都可以读取对方的标志值降低并继续。这表明我们应该在检查其他线程的标志之前提高标志 - 这是下面的候选解决方案2。 // Candidate #2 raise my flag wait until your flag is lowered // Do Critical Section stuff lower my flag 候选方案2 满足互斥 - 不可能同时有两个线程在关键部分内。然而这段代码存在死锁问题假设两个线程希望同时进入关键部分时间线程 1线程 21raise my flag2raise my flag | 3 | wait... | wait... | 哎呀现在两个线程/进程都在等待对方降低他们的标志。现在两者都将永远无法进入关键部分这表明我们应该使用轮流变量来尝试解决谁应该继续的问题。轮流解决方案以下候选解决方案3 使用轮流变量礼貌地允许一个线程然后另一个线程继续 // Candidate #3 wait until my turn is myid // Do Critical Section stuff turn yourid 候选方案3 满足互斥每个线程或进程都可以独占访问关键部分但是两个线程/进程必须采取严格的轮流方式来使用关键部分即它们被迫进入交替的关键部分访问模式。例如如果线程 1 希望每毫秒读取一个哈希表但另一个线程每秒写入一个哈希表那么读取线程必须再等待 999 毫秒才能再次从哈希表中读取。这种“解决方案”是不有效的因为我们的线程应该能够取得进展并在没有其他线程当前在关键部分时进入关键部分。对关键部分问题的解决方案的期望属性在解决关键部分问题中我们希望的有三个主要的理想属性互斥 - 线程/进程获得独占访问权其他线程/进程必须等待直到它退出关键部分。有界等待 - 如果线程/进程必须等待那么它只能等待有限的时间不允许无限等待时间。有界等待的确切定义是在给定进程进入之前任何其他进程可以进入其关键部分的次数有一个上限非无限。进度 - 如果没有线程/进程在关键部分内那么线程/进程应该能够继续进行取得进展而无需等待。在考虑这些想法的基础上让我们检查另一个候选解决方案只有在两个线程同时需要访问时才使用基于轮换的标志。轮换和标志解决方案以下是 CSP 的正确解决方案吗 \\ Candidate #4 raise my flag if your flag is raised, wait until my turn // Do Critical Section stuff turn yourid lower my flag 一位教师和另一位 CS 教师最初也是这样认为的然而分析这些解决方案是棘手的。甚至关于这个特定主题的同行评审论文中也包含不正确的解决方案乍一看它似乎满足互斥、有界等待和进度基于轮换的标志仅在出现平局时使用因此允许进度和有界等待并且似乎满足互斥。然而…也许你可以找到一个反例候选#4 失败因为一个线程不会等到另一个线程降低他们的标志。经过一番思考或灵感可以创建以下场景来演示互斥不满足。想象第一个线程运行这段代码两次所以轮换标志现在指向第二个线程。当第一个线程仍然在关键部分内时第二个线程到达。第二个线程可以立即继续进入关键部分时间轮换线程#1线程#212raise my flag22if your flag is raised, wait until my turnraise my flag32// Do Critical Section stuffif your flag is raised, wait until my turn真的42// Do Critical Section stuff// Do Critical Section stuff - 糟糕有效的解决方案 Peterson 的解决方案是什么 Peterson 在 1981 年的一篇两页论文中发表了他的小说和令人惊讶的简单解决方案。下面显示了他算法的一个版本使用了共享变量turn \\ Candidate #5 raise my flag turn your_id wait until your flag is lowered and turn is yourid // Do Critical Section stuff lower my flag 该解决方案满足互斥、有界等待和进度。如果线程#2 将轮换设置为 2 并且当前在关键部分内。线程#1 到达将轮换设置回 1现在等待直到线程 2 降低标志。 Peterson 原始文章 pdf 的链接G. L. Peterson: “关于互斥问题的神话”信息处理通讯 12(3) 1981, 115–116 Peterson 的解决方案是第一个解决方案吗不Dekkers 算法1962 年是第一个可以证明正确的解决方案。以下是该算法的一个版本。 raise my flag while(your flag is raised) :if its your turn to win :lower my flagwait while your turnraise my flag // Do Critical Section stuff set your turn to win lower my flag 请注意无论循环迭代零次、一次还是多次进程的标志在关键部分始终被提升。此外该标志可以被解释为立即意图进入关键部分。只有在另一个进程也提升了标志时一个进程才会推迟降低他们的意图标志并等待。我可以只在 C 或汇编中实现 Peterson 的或 Dekkers算法吗是的 - 通过一点搜索甚至今天也可以在特定简单的移动处理器上找到它的生产应用Peterson 的算法用于实现 Tegra 移动处理器的低级 Linux 内核锁由 Nvidia 的系统级芯片 ARM 处理器和 GPU 核心android.googlesource.com/kernel/tegra.git//android-tegra-3.10/arch/arm/mach-tegra/sleep.S#58 然而一般来说CPU 和 C 编译器可以重新排序 CPU 指令或使用 CPU 核心特定的本地缓存值如果另一个核心更新共享变量则这些值可能是过时的。因此对于大多数平台来说简单的伪代码到 C 的实现太天真了。你现在可以停止阅读了。哦… 你决定继续阅读。好吧这里有龙别说我们没警告过你。考虑这是一个高级和棘手的话题但剧透有一个美好的结局。考虑以下代码 while(flag2 ) { /* busy loop - go around again */一个高效的编译器会推断flag2变量在循环内部永远不会改变因此测试可以优化为while(true)。使用volatile可以在一定程度上防止这种类型的编译器优化。独立指令可以被优化编译器重新排序或者在运行时由 CPU 的乱序执行优化重新排序。如果代码需要变量被修改和检查以及精确的顺序这些复杂的优化。一个相关的挑战是 CPU 核心包括数据缓存用于存储最近读取或修改的主内存值。修改后的值可能不会立即写回主内存或重新从内存中读取。因此数据更改例如上面示例中的标志和转换变量的状态可能不会在两个 CPU 核心之间共享。但是有一个美好的结局。幸运的是现代硬件使用“内存栅栏”也称为内存屏障CPU 指令来解决这些问题以确保主内存和 CPU 缓存处于合理和一致的状态。更高级别的同步原语如pthread_mutex_lock将调用这些 CPU 指令作为其实现的一部分。因此在实践中使用互斥锁的临界区周围的锁定和解锁调用足以忽略这些低级问题。进一步阅读我们建议阅读以下网帖讨论在 x86 进程上实现 Peterson 算法以及关于内存屏障的 Linux 文档。 bartoszmilewski.com/2008/11/05/who-ordered-memory-fences-on-an-x86/ lxr.free-electrons.com/source/Documentation/memory-barriers.txt 硬件解决方案我们如何在硬件上实现临界区问题我们可以使用 C11 原子操作来完美地做到这一点完整的解决方案在这里详细说明这是一个自旋锁互斥体futex的实现可以在网上找到。 typedef struct mutex_{atomic_int_least8_t lock;pthread_t owner; } mutex;#define UNLOCKED 0 #define LOCKED 1 #define UNASSIGNED_OWNER 0int mutex_init(mutex* mtx){if(!mtx){return 0;}atomic_init(mtx-lock, UNLOCKED); // Not thread safe the user has to take care of thismtx-owner UNASSIGNED_OWNER;return 1; }这是初始化代码这里没有什么花哨的。我们将互斥体的状态设置为未锁定并将所有者设置为已锁定。 int mutex_lock(mutex* mtx){int_least8_t zero UNLOCKED;while(!atomic_compare_exchange_weak_explicit(mtx-lock, zero, LOCKED,memory_order_relaxed,memory_order_relaxed)){zero UNLOCKED;sched_yield(); //Use system calls for scheduling speed}//We have the lock now!!!!mtx-owner pthread_self();return 1; }天啊这段代码是做什么的首先它初始化一个变量我们将保持为未锁定状态。原子比较和交换是大多数现代架构支持的指令在 x86 上是lock cmpxchg。这个操作的伪代码看起来像这样 int atomic_compare_exchange_pseudo(int* addr1, int* addr2, int val){if(*addr1 *addr2){*addr1 val;return 1;}else{*addr2 *addr1;return 0;} }除了它是原子完成的意味着在一个不可中断的操作中完成。弱部分是什么意思原子指令也容易出现虚假失败这意味着这些原子函数有两个版本一个强和一个弱强保证成功或失败而弱可能失败。我们使用弱部分是因为弱部分更快而且我们在一个循环中这意味着如果它失败得更频繁我们也没关系因为我们会继续旋转。这个内存顺序是什么我们之前讨论过内存栅栏这就是它我们不会详细讨论因为这超出了本课程的范围但不超出本文的范围。在 while 循环内我们未能获取到锁我们将零重置为 unlocked 并睡一会儿。当我们醒来时我们再次尝试获取锁。一旦成功交换我们就进入了临界区我们为解锁方法设置了互斥体的所有者并返回成功。在使用原子操作时这如何保证互斥性我们并不完全确定但在这个简单的例子中我们可以因为能够成功期望锁处于 UNLOCKED0状态并将其交换到 LOCKED1状态的线程被认为是赢家。我们如何实现解锁 int mutex_unlock(mutex* mtx){if(unlikely(pthread_self() ! mtx-owner)){return 0; //You cant unlock a mutex if you arent the owner}int_least8_t one 1;//Critical section ends after this atomicmtx-owner UNASSIGNED_OWNER;if(!atomic_compare_exchange_strong_explicit(mtx-lock, one, UNLOCKED,memory_order_relaxed,memory_order_relaxed)){//The mutex was never locked in the first placereturn 0;}return 1; }为了满足 API除非你是拥有它的人否则你不能解锁互斥体。然后我们取消互斥体所有者因为在原子操作之后临界区已经结束。我们希望进行强交换因为我们不想阻塞pthread_mutex_unlock 不会阻塞。我们期望互斥体被锁住然后将其交换到解锁状态。如果交换成功我们就解锁了互斥体。如果交换失败这意味着互斥体是 UNLOCKED我们试图将其从 UNLOCKED 切换到 UNLOCKED保持解锁的非阻塞。同步第五部分条件变量条件变量简介热身给这些属性命名 “一次只有一个进程/线程可以进入 CS” “如果等待那么另一个进程只能进入 CS 有限次数” “如果没有其他进程在 CS 中那么进程可以立即进入 CS” 参见Synchronization, Part 4: The Critical Section Problem获取答案。什么是条件变量如何使用它们什么是虚假唤醒条件变量允许一组线程睡眠直到被唤醒您可以唤醒一个线程或所有正在睡眠的线程。如果只唤醒一个线程那么操作系统将决定唤醒哪个线程。您不直接唤醒线程而是’信号’条件变量然后将唤醒一个或所有正在条件变量内睡眠的线程。条件变量与互斥锁和循环一起使用用于检查条件。偶尔一个等待的线程可能会出现无缘无故地唤醒这称为虚假唤醒这不是问题因为您总是在循环内使用wait该循环测试必须为真才能继续。在条件变量中睡眠的线程通过调用pthread_cond_broadcast唤醒所有或pthread_cond_signal唤醒一个来唤醒。请注意尽管函数名中有signal但这与 POSIX 的signal无关 pthread_cond_wait做什么调用pthread_cond_wait执行三个动作解锁互斥锁等待睡眠直到在同一条件变量上调用pthread_cond_signal 在返回之前锁定互斥锁高级话题为什么条件变量也需要互斥锁条件变量需要互斥锁有三个原因。最容易理解的是它可以防止早期唤醒消息signal或broadcast函数被“丢失”。想象一下以下事件序列时间向下运行页面其中条件在调用pthread_cond_wait之前 _ 刚好 _ 满足。在这个例子中唤醒信号丢失了线程 1线程 2while( answer 42) {answerp_cond_signal(cv)p_cond_wait(cv,m) 如果两个线程都锁定了互斥锁则在调用pthread_cond_wait(cv, m)之后然后在内部解锁互斥锁之后才能发送信号第二个常见的原因是更新程序状态answer变量通常需要互斥锁 - 例如多个线程可能正在更新answer的值。第三个微妙的原因是满足实时调度的考虑我们在这里只概述在时间关键的应用程序中等待的线程应该允许具有最高优先级的线程先继续。为了满足这个要求调用pthread_cond_signal或pthread_cond_broadcast之前也必须锁定互斥锁。对于好奇的人可以在这里找到更长的历史讨论。为什么会存在虚假唤醒出于性能考虑。在多 CPU 系统上可能会发生竞争条件导致唤醒信号请求被忽略。内核可能不会检测到这个丢失的唤醒调用但可以检测到可能发生的情况。为了避免潜在的丢失信号唤醒线程以便程序代码可以再次测试条件。例子条件变量总是与互斥锁一起使用。在调用wait之前必须锁定互斥锁并且wait必须用循环包装。 pthread_cond_t cv; pthread_mutex_t m; int count;// Initialize pthread_cond_init(cv, NULL); pthread_mutex_init(m, NULL); count 0;pthread_mutex_lock(m); while (count 10) {pthread_cond_wait(cv, m); /* Remember that cond_wait unlocks the mutex before blocking (waiting)! */ /* After unlocking, other threads can claim the mutex. */ /* When this thread is later woken it will */ /* re-lock the mutex before returning */ } pthread_mutex_unlock(m);//later clean up with pthread_cond_destroy(cv); and mutex_destroy // In another thread increment count: while (1) {pthread_mutex_lock(m);count;pthread_cond_signal(cv);/* Even though the other thread is woken up it cannot not return *//* from pthread_cond_wait until we have unlocked the mutex. This is *//* a good thing! In fact, it is usually the best practice to call *//* cond_signal or cond_broadcast before unlocking the mutex */pthread_mutex_unlock(m); }实现计数信号量我们可以使用条件变量实现计数信号量。每个信号量都需要一个计数、一个条件变量和一个互斥锁 typedef struct sem_t {int count; pthread_mutex_t m;pthread_condition_t cv; } sem_t;实现sem_init以初始化互斥锁和条件变量 int sem_init(sem_t *s, int pshared, int value) {if (pshared) { errno ENOSYS /* Not implemented*/; return -1;}s-count value;pthread_mutex_init(s-m, NULL);pthread_cond_init(s-cv, NULL);return 0; }我们的sem_post实现需要增加计数。我们还将唤醒任何在条件变量内睡眠的线程。请注意我们锁定并解锁互斥锁因此一次只有一个线程可以在临界区内。 sem_post(sem_t *s) {pthread_mutex_lock(s-m);s-count;pthread_cond_signal(s-cv); /* See note *//* A woken thread must acquire the lock, so it will also have to wait until we call unlock*/pthread_mutex_unlock(s-m); }我们的sem_wait实现可能需要睡眠如果信号量的计数为零。就像sem_post一样我们使用锁来包装临界区这样一次只有一个线程可以执行我们的代码。请注意如果线程确实需要等待那么互斥锁将被解锁允许另一个线程进入sem_post并唤醒我们的睡眠请注意即使线程被唤醒在从pthread_cond_wait返回之前它必须重新获取锁因此它将不得不等待一小段时间例如直到sem_post完成。 sem_wait(sem_t *s) {pthread_mutex_lock(s-m);while (s-count 0) {pthread_cond_wait(s-cv, s-m); /*unlock mutex, wait, relock mutex*/}s-count--;pthread_mutex_unlock(s-m); }等待sem_post不断调用pthread_cond_signal会不会破坏sem_wait 答案不会在计数非零之前我们无法跳出循环。实际上这意味着sem_post即使没有等待的线程也会不必要地调用pthread_cond_signal。更高效的实现只会在必要时调用pthread_cond_signal即 /* Did we increment from zero to one- time to signal a thread sleeping inside sem_post */if (s-count 1) /* Wake up one waiting thread!*/pthread_cond_signal(s-cv);其他信号量考虑真正的信号量实现包括队列和调度问题以确保公平性和优先级例如唤醒最高优先级的最长睡眠线程。另外sem_init的高级用法允许信号量在进程之间共享。我们的实现仅适用于同一进程内的线程。同步第六部分实现屏障如何等待 N 个线程在继续下一步之前到达某一点假设我们想要执行一个多线程计算它有两个阶段但我们不想在第一阶段完成之前进入第二阶段。我们可以使用一种称为屏障的同步方法。当一个线程到达屏障时它将在屏障处等待直到所有线程到达屏障然后它们将一起继续。想象一下就像和一些朋友一起去远足。你们约定在每个山顶等待彼此并且你心里记下了你的团队有多少人。假设你是第一个到达第一个山顶的人。你会在山顶等待你的朋友。他们一个接一个地到达山顶但直到你的团队中的最后一个人到达之前没有人会继续前进。一旦他们到达你们就会一起继续。 Pthreads 有一个实现这一点的函数pthread_barrier_wait()。您需要声明一个pthread_barrier_t变量并使用pthread_barrier_init()对其进行初始化。pthread_barrier_init()将参与屏障的线程数作为参数。这里有一个例子。现在让我们实现自己的屏障并使用它在大型计算中同步所有线程。 double data[256][8192]1 Threads do first calculation (use and change values in data)2 Barrier! Wait for all threads to finish first calculation before continuing3 Threads do second calculation (use and change values in data)线程函数有四个主要部分- void *calc(void *arg) {/* Do my part of the first calculation *//* Am I the last thread to finish? If so wake up all the other threads! *//* Otherwise wait until the other threads has finished part one *//* Do my part of the second calculation */ }我们的主线程将创建 16 个线程并将每个计算分成 16 个单独的部分。每个线程将被赋予一个唯一的值0,1,2,…15以便它可以处理自己的块。由于(void*)类型可以保存小整数我们将通过将其转换为 void 指针来传递i的值。 #define N (16) double data[256][8192] ; int main() {pthread_t ids[N];for(int i 0; i N; i) pthread_create(ids[i], NULL, calc, (void *) i);请注意我们永远不会将此指针值解引用为实际的内存位置-我们只会将其直接转换回整数 void *calc(void *ptr) { // Thread 0 will work on rows 0..15, thread 1 on rows 16..31int x, y, start N * (int) ptr;int end start N; for(x start; x end; x) for (y 0; y 8192; y) { /* do calc #1 */ }第 1 个计算完成后我们需要等待较慢的线程除非我们是最后一个线程。因此跟踪已经到达我们的屏障也称为“检查点”的线程数量 // Global: int remain N;// After calc #1 code: remain--; // We finished if (remain 0) {/*Im last! - Time for everyone to wake up! */ } else {while (remain ! 0) { /* spin spin spin*/ } }然而上述代码存在竞争条件两个线程可能尝试递减remain并且循环是一个忙循环。我们可以做得更好让我们使用条件变量然后我们将使用广播/信号函数唤醒睡眠的线程。提醒一下条件变量类似于一个房子线程在那里睡觉pthread_cond_wait。您可以选择唤醒一个线程pthread_cond_signal或所有线程pthread_cond_broadcast。如果当前没有线程在等待那么这两个调用将不起作用。条件变量版本通常与忙循环不正确的解决方案非常相似-接下来我们将展示。首先让我们添加一个互斥锁和条件全局变量不要忘记在main中初始化它们… //global variables pthread_mutex_t m; pthread_cond_t cv;main() {pthread_mutex_init(m, NULL);pthread_cond_init(cv, NULL);我们将使用互斥锁来确保只有一个线程在一次修改remain。最后到达的线程需要唤醒所有睡眠的线程-因此我们将使用pthread_cond_broadcast(cv)而不是pthread_cond_signal pthread_mutex_lock(m); remain--; if (remain 0) { pthread_cond_broadcast(cv); } else {while(remain ! 0) { pthread_cond_wait(cv, m); } } pthread_mutex_unlock(m);当线程进入pthread_cond_wait时它释放互斥锁并进入睡眠状态。在将来的某个时刻它将被唤醒。一旦我们将线程从睡眠中唤醒它在返回之前必须等待直到可以锁定互斥锁。请注意即使一个睡眠的线程提前醒来它也会检查 while 循环条件并在必要时重新进入等待。上述屏障不可重用这意味着如果我们将其放入任何旧的计算循环中代码很可能会遇到屏障死锁或线程比一个迭代更快的情况。思考一下如何使上述屏障可重用这意味着如果多个线程在循环中调用barrier_wait则可以保证它们处于相同的迭代。同步第七部分读者写者问题读者写者问题是什么想象一下您有一个键值映射数据结构被许多线程使用。只要数据结构没有被写入多个线程应该能够同时查找读取值。写者不那么合群-为了避免数据损坏一次只有一个线程可以修改write数据结构此时不能有读者正在读取。这是读者写者问题的一个例子。也就是说我们如何有效地同步多个读者和写者以便多个读者可以一起阅读但写者可以获得独占访问下面显示了一个不正确的尝试“锁”是pthread_mutex_lock的简写尝试1 read() {lock(m)// do read stuffunlock(m) } write() {lock(m)// do write stuffunlock(m) } 至少我们的第一次尝试不会遭受数据损坏读者必须在写者写作时等待反之亦然但是读者也必须等待其他读者。所以让我们尝试另一种实现… 尝试2 read() {while(writing) {/*spin*/}reading 1// do read stuffreading 0 } write() {while(reading #124;#124; writing) {/*spin*/}writing 1// do write stuffwriting 0 } 我们的第二次尝试遭受了竞争条件的影响-想象一下如果两个线程同时调用read和write或同时调用 write。两个线程都将能够继续进行其次我们可以有多个读者和多个写者因此让我们跟踪读者或写者的总数。这就是我们尝试3 尝试3 请记住pthread_cond_wait执行三个动作。首先它会原子解锁互斥锁然后休眠直到被pthread_cond_signal或pthread_cond_broadcast唤醒。第三唤醒的线程必须在返回之前重新获取互斥锁。因此只有一个线程实际上可以在由 lock 和 unlock()方法定义的临界区域内运行。下面的实现3 确保如果有任何写者在写作读者将进入 cond_wait。 read() {lock(m)while (writing)cond_wait(cv, m)reading;/* Read here! */reading--cond_signal(cv)unlock(m) }但是因为候选3 在读取之前没有解锁互斥锁所以一次只能有一个读者读取。更好的版本在读取之前解锁 read() {lock(m);while (writing)cond_wait(cv, m)reading;unlock(m) /* Read here! */lock(m)reading--cond_signal(cv)unlock(m) }这是否意味着写者和读者可以同时读和写不首先记住 cond_wait 要求线程在返回之前重新获取互斥锁。因此只有一个线程可以在临界区域用**标记内执行代码 read() {lock(m); ** while (writing) ** cond_wait(cv, m) ** reading;unlock(m) /* Read here! */lock(m) ** reading-- ** cond_signal(cv)unlock(m) }写者必须等待所有人。互斥由锁来保证。 write() {lock(m); ** while (reading || writing) ** cond_wait(cv, m); ** writing; ** ** /* Write here! */ ** writing--; ** cond_signal(cv);unlock(m); }上述候选3 还使用pthread_cond_signal这只会唤醒一个线程。例如如果许多读者正在等待写者完成那么只有一个正在睡眠的读者将被唤醒。读者和写者应该使用cond_broadcast以便所有线程都应该唤醒并检查它们的 while 循环条件。饥饿的写者上述候选3 遭受饥饿。如果读者不断到来那么写者将永远无法继续进行“读取”计数永远不会减少到零。这被称为饥饿并且在重负载下会被发现。我们的修复方法是为写者实现有界等待。如果写者到达他们仍然需要等待现有的读者但是未来的读者必须被放置在“等待区”中等待写者完成。可以使用变量和条件变量来实现“等待区”以便我们可以在写者完成后唤醒线程。我们的计划是当写者到达并在等待当前读者完成之前注册我们的写入意图通过增加计数器’writer’。下面是草图- write() {lock()writerwhile (reading || writing)cond_waitunlock()... }并且当写者为非零时传入的读者将不被允许继续。请注意“写者”表示写者已到达而“读取”和“写入”计数器表示有活动读者或写者。 read() {lock()// readers that arrive *after* the writer arrived will have to wait here!while(writer)cond_wait(cv,m)// readers that arrive while there is an active writer// will also wait.while (writing) cond_wait(cv,m)readingunlock... }尝试4 以下是我们对读者-写者问题的第一个工作解决方案。请注意如果你继续阅读关于“读者写者问题”的内容你会发现我们通过给予写者对锁的优先访问来解决了“第二个读者写者问题”。这个解决方案并不是最佳的。然而它满足了我们最初的问题N 个活跃读者单个活跃写者避免了如果有持续的读者流的话写者饥饿。你能识别出任何改进吗例如你会如何改进代码以便我们只唤醒读者或一个写者 int writers; // Number writer threads that want to enter the critical section (some or all of these may be blocked) int writing; // Number of threads that are actually writing inside the C.S. (can only be zero or one) int reading; // Number of threads that are actually reading inside the C.S. // if writing !0 then reading must be zero (and vice versa)reader() {lock(m)while (writers)cond_wait(turn, m)// No need to wait while(writing here) because we can only exit the above loop// when writing is zeroreadingunlock(m)// perform reading herelock(m)reading--cond_broadcast(turn)unlock(m) }writer() {lock(m) writers while (reading || writing) cond_wait(turn, m) writing unlock(m) // perform writing here lock(m) writing-- writers-- cond_broadcast(turn) unlock(m) }同步第八部分环形缓冲区示例什么是环形缓冲区环形缓冲区是一种简单的、通常是固定大小的存储机制其中连续的内存被视为循环的并且两个索引计数器跟踪队列的当前开始和结束。由于数组索引不是循环的所以当移动到数组的末尾时索引计数器必须回绕到零。当数据被添加入队到队列的前端或从队列的尾部移除出队时缓冲区中的当前项目形成一个似乎环绕轨道的列车一个简单的单线程实现如下所示。请注意enqueue 和 dequeue 没有防止下溢或上溢——当队列已满时可能添加一个项目当队列为空时可能移除一个项目。例如如果我们向队列中添加了 20 个整数1,2,3…并且没有移除任何项目那么值17,18,19,20将覆盖1,2,3,4。我们现在不会解决这个问题而是在创建多线程版本时我们将确保在环形缓冲区已满或为空时enqueue 和 dequeue 线程被阻塞。 void *buffer[16]; int in 0, out 0;void enqueue(void *value) { /* Add one item to the front of the queue*/buffer[in] value;in; /* Advance the index for next time */if (in 16) in 0; /* Wrap around! */ }void *dequeue() { /* Remove one item to the end of the queue.*/void *result buffer[out];out;if (out 16) out 0;return result; }实现环形缓冲区的注意事项是什么很容易写出 enqueue 或 dequeue 方法的以下紧凑形式N 是缓冲区的容量例如 16 void enqueue(void *value)b[ (in) % N ] value; }这种方法似乎可以工作通过简单的测试等但包含一个微妙的错误。通过足够多的 enqueue 操作略多于 20 亿次in的 int 值将溢出并变为负数模运算符保留符号。因此你可能会写入b[-14]例如一个紧凑的形式是正确的使用位掩码提供 N 是 2^x16,32,64,… b[ (in) (N-1) ] value;这个缓冲区还没有防止缓冲区下溢或上溢。为此我们将转向我们的多线程尝试它将阻塞一个线程直到有空间或至少有一个项目可以移除。检查多线程实现的正确性示例 1 以下代码是一个不正确的实现。会发生什么enqueue和/或dequeue会阻塞吗互斥性是否得到满足缓冲区会下溢吗缓冲区会上溢吗为了清晰起见pthread_mutex缩写为p_m我们假设 sem_wait 不会被中断。 #define N 16 void *b[N] int in 0, out 0 p_m_t lock sem_t s1,s2 void init() { p_m_init(lock, NULL)sem_init(s1, 0, 16)sem_init(s2, 0, 0) }enqueue(void *value) {p_m_lock(lock)// Hint: Wait while zero. Decrement and returnsem_wait( s1 ) b[ (in) (N-1) ] value// Hint: Increment. Will wake up a waiting thread sem_post(s1) p_m_unlock(lock) } void *dequeue(){p_m_lock(lock)sem_wait(s2)void *result b[(out) (N-1) ]sem_post(s2)p_m_unlock(lock)return result }分析在继续阅读之前看看你能找到多少错误。然后确定如果线程调用 enqueue 和 dequeue 方法会发生什么。 enqueue 方法在同一个信号量s1上等待和发布equeue 也是如此s2即我们减少值然后立即增加值因此在函数结束时信号量值不变 s1 的初始值为 16因此信号量永远不会减少到零——如果环形缓冲区已满enqueue 不会阻塞——因此可能会发生溢出。 s2 的初始值为零因此调用 dequeue 将始终阻塞并且永远不会返回互斥锁和 sem_wait 的顺序需要交换但是这个示例是如此破碎以至于这个错误没有影响##检查多线程实现的正确性示例 1 以下代码是一个不正确的实现。会发生什么enqueue和/或dequeue会阻塞吗互斥性是否得到满足缓冲区会下溢吗缓冲区会上溢吗为了清晰起见pthread_mutex缩写为p_m我们假设 sem_wait 不会被中断。 void *b[16] int in 0, out 0 p_m_t lock sem_t s1, s2 void init() {sem_init(s1,0,16)sem_init(s2,0,0) }enqueue(void *value){sem_wait(s2)p_m_lock(lock)b[ (in) (N-1) ] valuep_m_unlock(lock)sem_post(s1) }void *dequeue(){sem_wait(s1)p_m_lock(lock)void *result b[(out) 15]p_m_unlock(lock)sem_post(s2)return result; }分析 s2 的初始值为 0。因此在第一次调用 sem_wait 时enqueue 将阻塞即使缓冲区为空 s1 的初始值为 16。因此在第一次调用 sem_wait 时dequeue 不会阻塞即使缓冲区为空——糟糕下溢dequeue 方法将返回无效数据。该代码不满足互斥性两个线程可以同时修改 in 或 out 该代码似乎使用了互斥锁。不幸的是该锁从未使用 pthread_mutex_init() 或 PTHREAD_MUTEX_INITIALIZER 进行初始化 - 因此该锁可能无效pthread_mutex_lock 可能什么也不做正确实现环形缓冲区伪代码pthread_mutex 缩写为 p_m 等如下所示。由于互斥锁存储在全局静态内存中因此可以使用 PTHREAD_MUTEX_INITIALIZER 进行初始化。如果我们在堆上为互斥锁分配了空间那么我们将使用 pthread_mutex_init(ptr, NULL) #include pthread.h #include semaphore.h // N must be 2^i #define N (16)void *b[N] int in 0, out 0 p_m_t lock PTHREAD_MUTEX_INITIALIZER sem_t countsem, spacesemvoid init() {sem_init(countsem, 0, 0)sem_init(spacesem, 0, 16) }enqueue 方法如下所示。请注意该锁仅在临界区对数据结构的访问期间保持。完整的实现需要防止由于 POSIX 信号而导致 sem_wait 提前返回。 enqueue(void *value){// wait if there is no space left:sem_wait( spacesem )p_m_lock(lock)b[ (in) (N-1) ] valuep_m_unlock(lock)// increment the count of the number of itemssem_post(countsem) }dequeue 实现如下所示。请注意 enqueue 的同步调用的对称性。在两种情况下如果空间计数或项目计数为零函数首先会等待。 void *dequeue(){// Wait if there are no items in the buffersem_wait(countsem)p_m_lock(lock)void *result b[(out) (N-1)]p_m_unlock(lock)// Increment the count of the number of spacessem_post(spacesem)return result }思考如果 pthread_mutex_unlock 和 sem_post 调用的顺序被交换会发生什么如果 sem_wait 和 pthread_mutex_lock 调用的顺序被交换会发生什么同步复习问题主题原子操作临界区生产者消费者问题使用条件变量使用计数信号量实现一个屏障实现环形缓冲区使用 pthread_mutex 实现生产者消费者分析多线程代码问题什么是原子操作为什么以下内容在并行代码中不起作用 //In the global section size_t a; //In pthread function for(int i 0; i 100000000; i) a;这将会是什么 //In the global section atomic_size_t a; //In pthread function for(int i 0; i 100000000; i) atomic_fetch_add(a, 1);原子操作有哪些缺点哪个更快保留一个本地变量还是进行多个原子操作什么是临界区一旦确定了临界区保证只有一个线程会进入该区域的一种方法是什么在这里确定临界区 struct linked_list; struct node; void add_linked_list(linked_list *ll, void* elem){node* packaged new_node(elem);if(ll-head){ll-head }else{packaged-next ll-head;ll-head packaged;ll-size;}}void* pop_elem(linked_list *ll, size_t index){if(index ll-size) return NULL;node *i, *prev;for(i ll-head; i index; i i-next, index--){prev i;}//i points to the element we need to pop, prev beforeif(prev-next) prev-next prev-next-next;ll-size--;void* elem i-elem;destroy_node(i);return elem; }临界区可以有多紧凑什么是生产者消费者问题以上述部分如何成为生产者消费者问题生产者消费者问题与读者写者问题有什么关系什么是条件变量为什么使用条件变量比使用“while”循环更有优势为什么这段代码很危险 if(not_ready){pthread_cond_wait(cv, mtx); }什么是计数信号量给我一个类似于饼干罐/比萨盒/有限食物的比喻。什么是线程屏障使用计数信号量来实现屏障。编写一个生产者/消费者队列再来一个生产者/消费者栈给我一个使用条件变量的读者-写者锁的实现使用你需要的任何结构它只需要支持以下函数 void reader_lock(rw_lock_t* lck); void writer_lock(rw_lock_t* lck); void reader_unlock(rw_lock_t* lck); void writer_unlock(rw_lock_t* lck);唯一的规定是在“reader_lock”和“reader_unlock”之间没有写者可以写。在写者锁之间只有一个写者可以一次写作。编写代码使用仅三个计数信号量实现生产者消费者。假设可以有多个线程调用 enqueue 和 dequeue。确定每个信号量的初始值。编写代码使用条件变量和互斥锁实现生产者消费者。假设可以有多个线程调用 enqueue 和 dequeue。使用 CVs 实现 add(unsigned int)和 subtract(unsigned int)阻塞函数永远不允许全局值大于 100。使用 CVs 为 15 个线程实现一个屏障。以下陈述有多少是真的可以有多个活跃的读者可以有多个活跃的写者当有活跃的写者时活跃的读者数量必须为零如果有活跃的读者则活跃的写者数量必须为零一个写者必须等到当前活跃的读者完成待办事项分析多线程代码片段六、死锁死锁第一部分资源分配图什么是资源分配图资源分配图跟踪哪个进程持有哪个资源以及哪个进程正在等待特定类型的资源。这是一个非常强大而简单的工具用来说明交互进程如何发生死锁。如果一个进程使用一个资源就从资源节点到进程节点画一个箭头。如果一个进程请求一个资源就从进程节点到资源节点画一个箭头。如果资源分配图中有一个循环并且循环中的每个资源只提供一个实例那么进程将发生死锁。例如如果进程 1 持有资源 A进程 2 持有资源 B进程 1 正在等待 B进程 2 正在等待 A那么进程 1 和 2 将发生死锁。这里有另一个例子显示了进程 1 和 2 获取资源 1 和 2而进程 3 正在等待获取这两个资源。在这个例子中没有死锁因为没有循环依赖。死锁很多时候我们不知道资源可能被获取的具体顺序所以我们可以绘制有向图。作为可能性矩阵。然后我们可以画箭头看看是否有一个有向版本会导致死锁。考虑以下资源分配图假设进程请求对文件的独占访问。如果有一堆进程在运行并且它们请求资源操作系统最终处于这种状态你就会发生死锁你可能看不到这一点因为操作系统可能会抢占一些进程来打破循环但你的三个孤独进程仍然有可能发生死锁。你也可以使用make和规则依赖关系例如我们的 parmake MP制作这种类型的图表。死锁第二部分死锁条件 Coffman 条件死锁有四个必要和充分条件。这些被称为 Coffman 条件。互斥循环等待持有并等待无抢占如果打破其中任何一个就不会发生死锁所有这些条件都是死锁所必需的所以让我们依次讨论每一个。首先是简单的- 互斥资源不能被共享循环等待资源分配图中存在一个循环。存在一组进程{P1P2…}使得 P1 正在等待 P2 持有的资源P2 正在等待 P3…P3 正在等待 P1 持有的资源。持有并等待一个进程获取了一个不完整的资源集并在等待其他资源时保持它们。无抢占一旦一个进程获取了一个资源该资源就不能被从一个进程那里拿走而且进程也不会自愿放弃一个资源。打破 Coffman 条件两个学生需要一支笔和一张纸学生们共享一支笔和一张纸。避免了死锁因为不需要互斥。学生们都同意先拿笔再拿纸。避免了死锁因为不会有循环等待。学生们一次拿起笔和纸“要么都拿要么都不拿”。避免了死锁因为没有持有并等待学生们是朋友会要求对方放弃持有的资源。避免了死锁因为允许抢占。活锁活锁不是死锁- 考虑以下的“解决方案” 如果他们无法在 10 秒内拿起另一个资源学生们会放下一个持有的资源。这个解决方案避免了死锁但可能会遭受活锁。活锁发生在一个进程继续执行但无法取得进展。在实践中活锁可能是因为程序员已经采取措施避免死锁。在上面的例子中在繁忙的系统中学生将不断释放第一个资源因为他们永远无法获得第二个资源。系统不是死锁学生进程仍在执行但也没有取得任何进展。死锁预防/避免 vs 死锁检测死锁预防是确保死锁不会发生这意味着你打破了 Coffman 条件。这在单个程序内效果最好软件工程师可以选择打破某个 Coffman 条件。考虑银行家算法。这是另一个用于避免死锁的算法。整个实现超出了本课程的范围只需知道操作系统有更通用的算法。另一方面死锁检测允许系统进入死锁状态。进入后系统使用其拥有的信息来打破死锁。例如考虑多个进程访问文件。操作系统能够通过文件描述符在某个级别通过 API 或直接跟踪所有文件/资源。如果操作系统在操作系统文件描述符表中检测到一个有向循环它可能会打破一个进程的持有例如通过调度并让系统继续进行。餐桌哲学家餐桌哲学家问题是一个经典的同步问题。想象我邀请 N假设为 5位哲学家共进晚餐。我们将他们安排在一张桌子旁放置 5 根筷子每位哲学家之间各有一根。哲学家交替地想要吃饭或思考。为了吃饭哲学家必须拿起他们位置两侧的两根筷子原始问题要求每位哲学家有两把叉子。然而这些筷子是与他的邻居共享的。设计一种有效的解决方案使所有哲学家都能吃饭吗或者会有一些哲学家挨饿永远得不到第二根筷子吗或者他们全部陷入僵局例如想象每个客人都拿起左边的筷子然后等待右边的筷子空闲。哎呀 - 我们的哲学家陷入了僵局死锁第三部分餐桌上的哲学家背景故事所以你的哲学家们围坐在桌子周围都想吃点意大利面或者其他什么他们真的很饿。每个哲学家本质上都是一样的这意味着每个哲学家都有相同的指令集基于其他哲学家也就是说你不能让每个偶数哲学家做一件事每个奇数哲学家做另一件事。失败的解决方案左右死锁我们该怎么办让我们尝试一个简单的解决方案 void* philosopher(void* forks){info phil_info forks;pthread_mutex_t* left_fork phil_info-left_fork;pthread_mutex_t* right_fork phil_info-right_fork;while(phil_info-simulation){pthread_mutex_lock(left_fork);pthread_mutex_lock(right_fork);eat(left_fork, right_fork);pthread_mutex_unlock(left_fork);pthread_mutex_unlock(right_fork);} }但是这会遇到一个问题如果每个人都拿起他们的左手叉子正在等待他们的右手叉子呢我们已经死锁了程序。重要的是要注意死锁并不总是发生而且这个解决方案死锁的概率随着哲学家的数量增加而降低。真正重要的是最终这个解决方案会死锁让线程挨饿这是不好的。 Trylock更像是活锁所以现在你在考虑打破柯夫曼条件之一。我们有互斥没有抢占持有并等待循环等待嗯我们不能让两个哲学家同时使用一个叉子互斥被排除在外。在我们当前的简单模型中我们不能让哲学家一旦拿到互斥锁就放开它所以我们现在就排除这个解决方案——关于这个解决方案有一些注释在页面底部。让我们打破持有并等待 void* philosopher(void* forks){info phil_info forks;pthread_mutex_t* left_fork phil_info-left_fork;pthread_mutex_t* right_fork phil_info-right_fork;while(phil_info-simulation){pthread_mutex_lock(left_fork);int failed pthread_mutex_trylock(right_fork);if(!failed){eat(left_fork, right_fork);pthread_mutex_unlock(right_fork);}pthread_mutex_unlock(left_fork);} }现在我们的哲学家拿起左边的叉子试图抓住右边的叉子。如果右边的叉子可用他们就吃。如果不可用他们放下左边的叉子再试一次。没有死锁但是有一个问题。如果所有的哲学家同时拿起他们的左手试图抓住他们的右手放下他们的左手再拿起他们的左手试图抓住他们的右手……我们现在活锁了我们的解决方案我们可怜的哲学家们仍然饿着所以让我们给他们一些合适的解决方案。可行的解决方案仲裁者天真和高级。天真的仲裁者解决方案是有一个仲裁者例如一个互斥锁。让每个哲学家请求仲裁者的许可来吃饭。这个解决方案一次只允许一个哲学家吃饭。当他们吃完后另一个哲学家可以请求吃饭的许可。这可以防止死锁因为没有循环等待没有哲学家需要等待其他哲学家。高级仲裁者解决方案是实现一个类确定哲学家的叉子是否在仲裁者的控制下。如果是他们把叉子给哲学家让他吃然后拿回叉子。这有一个额外的好处就是能够让多个哲学家同时吃饭。问题这些解决方案很慢他们有一个单一的故障点仲裁者使其成为一个瓶颈仲裁者在第二个解决方案中也需要公平并且能够确定死锁在实际系统中仲裁者倾向于重复地将叉子交给刚刚吃过的哲学家因为进程调度离开桌子Stallings 的解决方案为什么第一个解决方案会死锁嗯有 n 个哲学家和 n 根筷子。如果桌子上只有 1 个哲学家怎么办我们会死锁吗不会。 2 个哲学家怎么样3 个……你可以看出这是怎么回事。Stallings 的解决方案是从桌子上移除哲学家直到死锁不可能发生——想想桌子上的哲学家的魔数是多少。在实际系统中通过信号量来实现这一点并让一定数量的哲学家通过。问题解决方案需要大量的上下文切换这对 CPU 来说非常昂贵你需要提前知道资源的数量以便只让那么多的哲学家再次优先考虑那些已经吃过的进程。部分排序Dijkstra 的解决方案这是 Dijkstra 的解决方案他是在考试中提出这个问题的人。为什么第一个解决方案会死锁Dijkstra 认为最后一个拿起他左边叉子的哲学家导致解决方案死锁应该拿起他的右边叉子。他通过给叉子编号 1…n并告诉每个哲学家拿起他较小编号的叉子来实现这一点。让我们再次运行死锁条件。每个人都试图先拿起他们较小编号的叉子。哲学家 1 拿到叉子 1哲学家 2 拿到叉子 2依此类推直到我们到达哲学家 n。他们必须在叉子 1 和 n 之间做出选择。叉子 1 已经被哲学家 1 拿起所以他们不能拿起那个叉子这意味着他不会拿起叉子 n。我们打破了循环等待这意味着死锁是不可能的。问题哲学家在抓取任何资源之前需要知道资源的集合顺序。您需要为所有资源定义一个偏序。优先考虑已经吃过饭的哲学家。高级解决方案还有许多更高级的解决方案非穷尽列表包括干净/脏叉子钱德拉/米斯拉解决方案演员模型其他消息传递模型超级仲裁者复杂的管道死锁复习问题主题 Coffman 条件资源分配图餐厅哲学家失败的 DP 解决方案活锁 DP 解决方案工作的 DP 解决方案优缺点问题科夫曼条件是什么科夫曼条件的每个意思是什么例如你能提供每个条件的定义吗举一个打破科夫曼条件的真实例子。一个需要考虑的情况画家油漆画笔等。你如何确保工作会完成能够识别餐厅哲学家代码何时导致死锁或者不导致。例如如果你看到以下代码片段哪个科夫曼条件没有满足 // Get both locks or none. pthread_mutex_lock( a ); if( pthread_mutex_trylock( b ) ) { /*failed*/pthread_mutex_unlock( a );... }如果一个线程调用 pthread_mutex_lock(m1) // successpthread_mutex_lock(m2) // blocks还有另一个线程调用 pthread_mutex_lock(m2) // successpthread_mutex_lock(m1) // blocks发生了什么为什么如果第三个线程调用pthread_mutex_lock(m1)会发生什么有多少进程被阻塞通常情况下假设一个进程能够完成如果它能够获取下面列出的所有资源。 P1 获取 R1 P2 获取 R2 P1 获取 R3 P2 等待 R3 P3 获取 R5 P1 等待 R4 P3 等待 R1 P4 等待 R5 P5 等待 R1 画出资源图七、进程间通信和调度虚拟内存第一部分虚拟内存简介什么是虚拟内存在非常简单的嵌入式系统和早期计算机中进程直接访问内存即“地址 1234”对应于物理内存的特定部分中存储的特定字节。在现代系统中情况已经不再是这样。相反每个进程都是隔离的并且存在着一个地址转换过程将进程的特定 CPU 指令或数据的地址与物理内存“RAM”的实际字节对应起来。内存地址不再是“真实的”进程在虚拟内存中运行。虚拟内存不仅可以保护进程的安全因为一个进程不能直接读取或修改另一个进程的内存还允许系统有效地分配和重新分配内存的部分给不同的进程。 MMU 是什么内存管理单元是 CPU 的一部分。它将虚拟内存地址转换为物理地址。如果当前没有从特定虚拟地址到物理地址的映射或者当前 CPU 指令尝试写入进程只有读取访问权限的位置MMU 也可能中断 CPU。那么我们如何将虚拟地址转换为物理地址想象一下你有一台 32 位的机器。指针可以保存 32 位即它们可以寻址 2^32 个不同的位置即 4GB 的内存我们将遵循一个地址可以保存一个字节的标准约定。想象我们有一个大表 - 这是聪明的部分 - 存储在内存中对于每个可能的地址共 40 亿个我们将存储“真实”即物理地址。每个物理地址将需要 4 个字节以容纳 32 位。这种方案将需要 160 亿字节来存储所有条目。哎呀 - 我们的查找方案将消耗我们可能为我们的 4GB 机器购买的所有内存。我们需要做得比这更好。我们的查找表最好比我们拥有的内存小否则我们将没有空间留给我们的实际程序和操作系统数据。解决方案是将内存分成称为“页面”和“帧”的小区域并为每个页面使用查找表。什么是页面有多少个页面页面是一块虚拟内存。Linux 操作系统上的典型块大小为 4KB即 2^12 个地址尽管您可以找到更大块的示例。因此我们不再谈论单个字节而是谈论 4KB 的块每个块称为一个页面。我们还可以对我们的页面进行编号“页面 0”“页面 1”等例如32 位机器有多少页假设页面大小为 4KB 答案2^32 地址 / 2^12 2^20 页。记住 2^10 是 1024所以 2^20 略大于一百万。对于 64 位机器2^64 / 2^12 2^52大约是 10^15 页。什么是帧帧有时称为“页帧”是一块物理内存或 RAM随机存取存储器。这种内存有时被称为“主存储器”与较慢的辅助存储器相对例如具有较低访问时间的旋转磁盘一个帧的字节数与虚拟页面相同。如果 32 位机器有 2^324GB的 RAM那么在机器的可寻址空间中将有相同数量的帧。64 位机器不太可能有 2^64 字节的 RAM - 你能看出为什么吗什么是页面表它有多大页面表是页面到帧之间的映射。例如页面 1 可能映射到帧 45页面 2 映射到帧 30。其他帧可能目前未使用或分配给其他正在运行的进程或者由操作系统内部使用。一个简单的页面表就是一个数组int frame table[ page_num ]; 对于一个 32 位机器每个 4KB 页面的条目需要保存一个帧号-即 20 位因为我们计算出有 2^20 个帧。每个条目需要 2.5 个字节实际上我们将每个条目四舍五入到 4 个字节并找到这些多余位的用途。每个条目需要 4 个字节 x 2^20 个条目 4MB 的物理内存用于存储页表。对于一个 64 位机器每个 4KB 页面的条目需要 52 位。让我们将每个条目四舍五入到 64 位8 字节。有 2^52 个条目大约需要 2^55 字节大约 40PB…哎呀我们的页表太大了。在 64 位体系结构中内存地址是稀疏的因此我们需要一种机制来减小页表的大小因为大多数条目永远不会被使用。这里有一个页表的视觉示例。想象访问一个数组并获取数组元素。偏移量是什么它是如何使用的记住我们的页表将页面映射到帧但每个页面都是一块连续的地址。我们如何计算在特定帧内使用哪个特定字节解决方案是直接重用虚拟内存地址的最低位。例如假设我们的进程正在读取以下地址- VirtualAddress 11110000111100001111000010101010二进制在页面大小为 256 字节的机器上最低的 8 位10101010将被用作偏移量。剩下的上位位将是页号111100001111000011110000。多级页表多级页面是 64 位体系结构的页表大小问题的一种解决方案。我们将看看最简单的实现-两级页表。每个表都是指向下一级表的指针列表不需要所有子表都存在。下面是 32 位体系结构的两级页表的示例- VirtualAddress 11110000111111110000000010101010 (binary)|_Index1_|| || | 10 bit Directory index|_Index2_|| | 10 bit Sub-table index|__________| 12 bit offset (passed directly to RAM) 在上述方案中确定帧号需要两次内存读取使用顶部的 10 位在页表目录中。如果每个条目使用 2 个字节我们只需要 2KB 来存储整个目录。每个子表将指向物理帧即需要 4 个字节来存储 20 位。然而对于只需要微小内存的进程我们只需要指定低内存地址用于堆和程序代码和高内存地址用于堆栈的条目。每个子表是 1024 个条目 x 4 个字节即每个子表需要 4KB。因此我们的多级页表的总内存开销已经从 4MB单级减少到 3 帧内存12KB 页表会使内存访问变慢吗TLB 是什么是的-显著但由于聪明的硬件通常不会…与直接读取或写入内存相比。对于单个页表我们的机器现在慢了一倍需要两次内存访问对于两级页表内存访问现在慢了三倍。需要三次内存访问为了克服这种开销MMU 包括一个最近使用的虚拟页到帧查找的关联缓存。这个缓存被称为 TLB“转换旁路缓冲区”。每当需要将虚拟地址转换为物理内存位置时TLB 与页表并行查询。对于大多数程序的大多数内存访问TLB 缓存结果的机会很大。但是如果一个程序没有良好的缓存一致性例如从许多不同页面的随机内存位置读取那么 TLB 将不会有结果缓存现在 MMU 必须使用速度慢得多的页表来确定物理帧。这可能是如何分割多级页表的方式。高级帧和页面保护帧可以在进程之间共享吗它们可以被专门化吗是的除了存储帧编号之外页面表还可以用于存储进程是否可以写入或只读特定帧。只读帧可以安全地在多个进程之间共享。例如C 库指令代码可以在所有动态将代码加载到进程内存中的进程之间共享。每个进程只能读取该内存。这意味着如果您尝试写入内存中的只读页面您将收到SEGFAULT。这就是为什么有时内存访问会导致段错误有时不会这完全取决于您的硬件是否允许您访问。此外进程可以使用mmap系统调用与子进程共享页面。mmap是一个有趣的调用因为它不是将每个虚拟地址绑定到物理帧而是绑定到其他东西。这个其他东西可以是文件、GPU 单元或者你能想到的任何其他内存映射操作写入内存地址可能会直接写入设备或者写入可能会被操作系统暂停但这是一个非常强大的抽象因为操作系统通常能够执行优化多个进程内存映射相同的文件可以让内核创建一个映射。页面表中还存储了什么以及为什么除了上面讨论的只读位和使用统计信息之外通常至少存储只读、修改和执行信息。什么是页面故障页面故障是指运行中的程序尝试访问其地址空间中未映射到物理内存的某些虚拟内存。页面故障也会在其他情况下发生。有三种类型的页面故障次要如果页面尚未映射但是是有效地址。这可能是sbrk(2)要求的内存但尚未写入这意味着操作系统可以在分配空间之前等待第一次写入。操作系统只需创建页面将其加载到内存中然后继续进行。主要如果页面的映射不在内存中而在磁盘上。这将会将页面交换到内存中并将另一个页面交换出去。如果这种情况发生频繁您的程序就会被称为抖动MMU。无效当您尝试写入不可写内存地址或读取不可读内存地址时。MMU 会生成一个无效故障操作系统通常会生成一个SIGSEGV表示分段违规这意味着您写入了超出您可以写入的段的位置。只读位只读位将页面标记为只读。尝试写入页面将导致页面故障。然后内核将处理页面故障。只读页面的两个例子包括在多个进程之间共享 c 运行时库出于安全考虑您不希望允许一个进程修改库以及写时复制其中复制页面的成本可以延迟到第一次写入发生时。脏位 en.wikipedia.org/wiki/Page_table#Page_table_data 脏位允许进行性能优化。从磁盘分页到物理内存然后再次读取然后再次分页出去的页面不需要写回磁盘因为页面没有更改。但是如果页面在分页后被写入其脏位将被设置表示页面必须写回备份存储。这种策略要求备份存储在将页面分页到内存后保留页面的副本。当不使用脏位时备份存储只需与任何时刻分页出的所有页面的瞬时总大小一样大。当使用脏位时始终会存在一些页面既存在于物理内存中又存在于备份存储中。执行位执行位定义了页面中的字节是否可以作为 CPU 指令执行。通过禁用页面可以防止恶意存储在进程内存中的代码例如通过堆栈溢出被轻易执行。更多阅读en.wikipedia.org/wiki/NX_bit#Hardware_background 了解更多在 x86 平台上有关分页和页面位的更低级别的技术讨论可在[wiki.osdev.org/Paging]找到。管道第一部分管道介绍什么是 IPC 进程间通信是一个进程与另一个进程交流的任何方式。你已经看到了这种虚拟内存的一种形式一块虚拟内存可以在父进程和子进程之间共享从而进行通信。你可能想把那块内存包装在pthread_mutexattr_setpshared(attrmutex, PTHREAD_PROCESS_SHARED);互斥锁或者进程范围的互斥锁中以防止竞争条件。还有更多标准的 IPC 方式比如管道考虑一下如果你在终端中输入以下内容 $ ls -1 | cut -d. -f1 | uniq | sort | tee dir_contents以下代码做了什么如果你愿意你可以跳过这个好吧它ls当前目录-1 表示它每行输出一个条目。然后cut命令取得第一个句点之前的所有内容。Uniq 确保所有行都是唯一的sort 对它们进行排序tee 输出到一个文件。重要的部分是 bash 创建了5 个单独的进程并将它们的标准输出/标准输入与管道连接起来轨迹看起来像这样。 (0) ls (1)------(0) cut (1)-------(0) uniq (1)------(0) sort (1)------(0) tee (1) 管道中的数字是每个进程的文件描述符箭头表示重定向或管道输出的位置。什么是管道 POSIX 管道几乎像它的真实对应物 - 你可以把字节塞进一端它们会按照相同的顺序出现在另一端。然而与真实的管道不同流动方向总是相同的一个文件描述符用于读取另一个用于写入。pipe系统调用用于创建管道。 int filedes[2]; pipe (filedes); printf(read from %d, write to %d\n, filedes[0], filedes[1]);这些文件描述符可以与read一起使用 - // To read... char buffer[80]; int bytesread read(filedes[0], buffer, sizeof(buffer));和write - write(filedes[1], Go!, 4);我怎样使用管道与子进程通信使用管道的常见方法是在分叉之前创建管道。 int filedes[2]; pipe (filedes); pid_t child fork(); if (child 0) { /* I must be the parent */char buffer[80];int bytesread read(filedes[0], buffer, sizeof(buffer));// do something with the bytes read }然后子进程可以向父进程发送消息 if (child 0) {write(filedes[1], done, 4); }我可以在单个进程中使用管道吗简短回答是的但我不确定你为什么要这样做 LOL 以下是一个向自己发送消息的示例程序 #include unistd.h #include stdlib.h #include stdio.hint main() {int fh[2];pipe(fh);FILE *reader fdopen(fh[0], r);FILE *writer fdopen(fh[1], w);// Hurrah now I can use printf rather than using low-level read() write()printf(Writing...\n);fprintf(writer,%d %d %d\n, 10, 20, 30);fflush(writer);printf(Reading...\n);int results[3];int ok fscanf(reader,%d %d %d, results, results 1, results 2);printf(%d values parsed: %d %d %d\n, ok, results[0], results[1], results[2]);return 0; }以这种方式使用管道的问题在于写入管道可能会阻塞即管道只有有限的缓冲容量。如果管道已满写入进程将被阻塞缓冲区的最大大小取决于系统典型值从 4KB 到 128KB。 int main() {int fh[2];pipe(fh);int b 0;#define MESG ...............................while(1) {printf(%d\n,b);write(fh[1], MESG, sizeof(MESG))bsizeof(MESG);}return 0; }参见Pipes第二部分管道编程秘密管道第二部分管道编程秘密管道陷阱这里有一个完整的例子但不起作用子进程每次从管道中读取一个字节并打印出来-但我们从未看到消息你能看出原因吗 #include stdio.h #include stdlib.h #include unistd.h #include signal.hint main() {int fd[2];pipe(fd);//You must read from fd[0] and write from fd[1]printf(Reading from %d, writing to %d\n, fd[0], fd[1]);pid_t p fork();if (p 0) {/* I have a child therefore I am the parent*/write(fd[1],Hi Child!,9);/*dont forget your child*/wait(NULL);} else {char buf;int bytesread;// read one byte at a time.while ((bytesread read(fd[0], buf, 1)) 0) {putchar(buf);}}return 0; } 父进程将字节H,i,(空格),C...!发送到管道中如果管道已满可能会阻塞。子进程开始逐个字节读取管道。在上面的情况下子进程将读取并打印每个字符。但它永远不会离开 while 循环当没有字符可读时它会简单地阻塞并等待更多。调用putchar写出字符但我们从未刷新stdout缓冲区。也就是说我们已经将消息从一个进程传输到另一个进程但它还没有被打印出来。要查看消息我们可以刷新缓冲区例如fflush(stdout)或者如果输出是到终端则printf(\n)。更好的解决方案还可以通过检查消息结束标记来退出循环 while ((bytesread read(fd[0], buf, 1)) 0) {putchar(buf);if (buf !) break; /* End of message */}当子进程退出时消息将被刷新到终端。想要使用 printf 和 scanf 与管道吗使用 fdopen POSIX 文件描述符是简单的整数 0,1,2,3…在 C 库级别C 用缓冲区和有用的函数如 printf 和 scanf 包装这些所以我们可以轻松地打印或解析整数、字符串等。如果你已经有了一个文件描述符那么你可以使用fdopen将其自己“包装”成一个 FILE 指针 #include sys/types.h #include sys/stat.h #include fcntl.hint main() {char *nameFred;int score 123;int filedes open(mydata.txt, w, O_CREAT, S_IWUSR | S_IRUSR);FILE *f fdopen(filedes, w);fprintf(f, Name:%s Score:%d\n, name, score);fclose(f);对于写入文件来说这是不必要的-只需使用fopen它与open和fdopen相同。但是对于管道我们已经有了一个文件描述符-所以现在是使用fdopen的好时机这里有一个使用管道的完整例子几乎可以工作你能发现错误吗提示父进程从未打印任何内容 #include unistd.h #include stdlib.h #include stdio.hint main() {int fh[2];pipe(fh);FILE *reader fdopen(fh[0], r);FILE *writer fdopen(fh[1], w);pid_t p fork();if (p 0) {int score;fscanf(reader, Score %d, score);printf(The child says the score is %d\n, score);} else {fprintf(writer, Score %d, 10 10);fflush(writer);}return 0; }请注意未命名的管道资源将在子进程和父进程都退出后消失。在上面的例子中子进程将从管道发送字节父进程将从管道接收字节。然而从未发送换行符因此fscanf将继续请求字节因为它正在等待行结束即它将永远等待修复方法是确保我们发送一个换行符这样fscanf将返回。 change: fprintf(writer, Score %d, 10 10); to: fprintf(writer, Score %d\n, 10 10);那我们也需要fflush吗是的如果你希望你的字节立即发送到管道中在本课程开始时我们假设文件流始终是行缓冲即 C 库每次发送换行符时都会刷新其缓冲区。实际上这只对终端流有效-对于其他文件流C 库尝试通过仅在其内部缓冲区满或文件关闭时刷新来提高性能。我什么时候需要两个管道如果你需要异步地向子进程发送和接收数据那么需要两个管道每个方向一个。否则子进程将尝试读取自己的数据这些数据是为父进程准备的反之亦然关闭管道的陷阱当没有进程在监听时进程会收到信号 SIGPIPE来自 pipe(2)手册页- If all file descriptors referring to the read end of a pipe have been closed,then a write(2) will cause a SIGPIPE signal to be generated for the calling process. 提示注意只有写入者不是读取者可以使用此信号。为了通知读取者写入者正在关闭管道的端口你可以写入自己的特殊字节例如 0xff或消息再见这里有一个捕捉这个信号的例子但不起作用你能看出原因吗 #include stdio.h #include stdio.h #include unistd.h #include signal.hvoid no_one_listening(int signal) {write(1, No one is listening!\n, 21); }int main() {signal(SIGPIPE, no_one_listening);int filedes[2];pipe(filedes);pid_t child fork();if (child 0) { /* I must be the parent. Close the listening end of the pipe *//* Im not listening anymore!*/close(filedes[0]);} else {/* Child writes messages to the pipe */write(filedes[1], One, 3);sleep(2);// Will this write generate SIGPIPE ?write(filedes[1], Two, 3);write(1, Done\n, 5);}return 0; }上面代码中的错误是仍然有一个管道的读取者子进程仍然保持着管道的第一个文件描述符并记住规范所有读取者必须关闭。在分叉时*关闭子进程和父进程中每个管道的不必要未使用端口是常见做法。例如父进程可能关闭读取端口子进程可能关闭写入端口如果有两个管道则反之亦然是什么填满了管道当管道变满时会发生什么当写入者向管道写入过多而读者没有读取时管道会被填满。当管道变满时所有写入都会失败直到发生读取。即使在这种情况下如果管道还有一点空间但不足以容纳整个消息写入也可能部分失败。为了避免这种情况通常有两种方法。要么增加管道的大小。或者更常见的是修复你的程序设计使得管道不断被读取。管道是否进程安全是的管道写入是原子的直到管道的大小。这意味着如果两个进程尝试写入同一个管道内核会使用管道的内部互斥锁来锁定进行写入然后返回。唯一需要注意的是当管道即将变满时。如果两个进程尝试写入而管道只能满足部分写入那么该管道写入就不是原子的–要小心管道的生命周期无名管道到目前为止我们见过的那种存在于内存中不占用任何磁盘空间是一种简单高效的进程间通信IPC形式对于流数据和简单消息非常有用。一旦所有进程关闭管道资源就会被释放。使用mkfifo创建命名管道是无名管道的一种替代方法。命名管道我如何创建命名管道从命令行mkfifo 从 C 语言int mkfifo(const char *pathname, mode_t mode); 你给它路径名和操作模式它就准备好了命名管道在磁盘上不占用空间。当操作系统告诉你有一个命名管道时它实际上是在告诉你它会创建一个指向命名管道的无名管道就是这样没有额外的魔法。这只是为了编程方便如果进程在没有分叉的情况下启动这意味着无法为无名管道的子进程获取文件描述符。为什么我的管道挂起在命名管道上的读写会一直挂起直到至少有一个读者和一个写者记住这一点 1$ mkfifo fifo 1$ echo Hello fifo # This will hang until I do this on another terminal or another process 2$ cat fifo Hello当在命名管道上调用任何open时内核会阻塞直到另一个进程调用相反的 open。也就是说echo 调用open(.., O_RDONLY)但是它会阻塞直到 cat 调用open(.., O_WRONLY)然后程序才被允许继续。命名管道的竞争条件。以下程序有什么问题 //Program 1int main(){int fd open(fifo, O_RDWR | O_TRUNC);write(fd, Hello!, 6);close(fd);return 0; }//Program 2 int main() {char buffer[7];int fd open(fifo, O_RDONLY);read(fd, buffer, 6);buffer[6] \0;printf(%s\n, buffer);return 0; }这可能永远不会打印 hello因为存在竞争条件。由于你在第一个进程中以两种权限打开了管道open 不会等待读者因为你告诉操作系统你是读者有时它看起来像是工作的因为代码的执行看起来像这样。进程 1进程 2open(O_RDWR) write()open(O_RDONLY) read()close() exit()print() exit() 有时候不会进程 1进程 2open(O_RDWR) write()close() exit()命名管道被销毁无限期阻塞open(O_RDONLY) 文件第一部分处理文件两种类型的文件在 Linux 上有两种文件抽象。第一种是 Linux 的fd级别抽象这意味着你可以使用打开读写关闭 lseek fcntl … 等等。Linux 接口非常强大和富有表现力但有时我们需要可移植性例如如果我们在为 Mac 或 Windows 编写代码。这就是 C 的抽象发挥作用的地方。在不同的操作系统上C 使用低级函数来创建一个文件的包装器你可以在任何地方使用这意味着 Linux 上的 C 使用上述调用。C 有以下几种 fopen fread或fgetc/fgets或fscanf fwrite或fprintf fclose fflush 但你无法获得 Linux 通过系统调用给你的表达能力你可以在它们之间进行转换使用int fileno(FILE* stream)和FILE* fdopen(int fd...)。另一个重要的方面要注意的是 C 文件是缓冲的这意味着它们的内容可能不会立即被写入。你可以通过 C 选项来改变这一点。我怎么知道文件有多大对于小于 long 的大小的文件使用 fseek 和 ftell 是一种简单的方法来实现这一点移动到文件的末尾并找出当前位置。 fseek(f, 0, SEEK_END); long pos ftell(f);这告诉我们文件中的当前位置以字节为单位 - 即文件的长度 fseek也可以用来设置绝对位置。 fseek(f, 0, SEEK_SET); // Move to the start of the file fseek(f, posn, SEEK_SET); // Move to posn in the file.所有父进程或子进程中的未来读写操作都将遵守这个位置。请注意从文件中写入或读取将改变当前位置。查看 fseek 和 ftell 的 man 页面以获取更多信息。但尽量不要这样做注意这在通常情况下是不推荐的因为 C 语言有一个怪癖。这个怪癖是 long 只需要4 个字节大这意味着 ftell 能返回的最大大小略小于 2GB而我们现在知道我们的文件可能是数百 GB 甚至分布式文件系统上的 TB。我们应该怎么办呢使用stat我们将在后面的部分介绍 stat但这里有一些代码可以告诉你文件的大小 struct stat buf; if(stat(filename, buf) ! -1){return -1; } return (ssize_t)buf.st_size;buf.st_size 的类型是 off_t对于极大的文件来说足够大。如果子进程使用fclose或close关闭文件流会发生什么关闭文件流对每个进程都是独特的。其他进程可以继续使用自己的文件句柄。记住当创建一个子进程时甚至文件的相对位置也会被复制过去。文件的 mmap 怎么样 mmap 的一个常见用途是将文件映射到内存。这并不意味着文件会立即被 malloc 到内存中。以下面的代码为例。 int fd open(...); //File is 2 Pages char* addr mmap(..fd..); addr[0] l; 内核可能会说“好的我看到你想要将文件映射到内存中所以我将在你的地址空间中保留一些文件长度的空间”。这意味着当你写入 addr[0]时实际上是在文件的第一个字节上写入。内核实际上也可以进行一些优化。它可能一次只加载一页因为如果文件有 1024 页你可能只访问 3 或 4 页这样加载整个文件就是浪费时间这就是为什么页面错误是如此强大的原因它们让操作系统控制你使用文件的程度。对于每个 mmap 记住一旦你完成了mmap你需要munmap告诉操作系统你不再使用分配的页面这样操作系统可以将它写回磁盘并在以后需要 malloc 时将地址还给你。调度第一部分调度进程考虑调度。 CPU 调度是有效地选择要在系统 CPU 核心上运行的进程的问题。在繁忙的系统中准备运行的进程将比 CPU 核心多因此系统内核必须评估应该调度哪些进程在 CPU 上运行以及应该将哪些进程放在就绪队列中以便稍后执行。多线程和多 CPU 核心的额外复杂性被认为是对这个初始阐述的干扰因此在这里被忽略。对于非母语的人来说另一个需要注意的是“时间”一词的双重含义单词“时间”可以在时钟和经过的持续时间上下文中使用。例如“第一个进程的到达时间是上午 9:00。”和“算法的运行时间为 3 秒。” 调度如何衡量哪种调度程序最好调度影响系统的性能特别是系统的延迟和吞吐量。吞吐量可以通过系统值来衡量例如 I/O 吞吐量-每秒写入的字节数或者每单位时间可以完成的小进程数量或者使用更高级的抽象例如每分钟处理的客户记录数量。延迟可以通过响应时间进程开始发送响应之前的经过时间或等待时间或周转时间完成任务所经过的时间来衡量。不同的调度程序提供不同的优化权衡可能适用于所需的使用-并非所有可能的环境和目标都有最佳的调度程序。例如“最短作业优先”将最小化所有作业的总等待时间但在交互UI环境中最好是最小化响应时间以牺牲一些吞吐量而 FCFS 似乎直观公平且易于实现但受到车队效应的影响。到达时间是什么进程首次到达就绪队列并准备开始执行的时间。如果 CPU 空闲到达时间也将是执行的开始时间。什么是抢占没有抢占进程将运行直到无法再利用 CPU。例如以下条件将从 CPU 中移除进程并使 CPU 可供其他进程调度进程因信号终止被阻塞等待并发原语或正常退出。因此一旦进程被调度即使另一个具有较高优先级例如更短的作业的进程出现在就绪队列上它也将继续运行。通过抢占如果就绪队列中添加了一个更可取的进程现有进程可能会立即被移除。例如假设在 t0 时使用最短作业优先调度程序有两个进程P1 P2执行时间分别为 10 和 20 毫秒。P1 被调度。P1 立即创建一个新的进程 P3执行时间为 5 毫秒将其添加到就绪队列。如果没有抢占P3 将在 10 毫秒后运行在 P1 完成后。有了抢占P1 将立即从 CPU 中驱逐并放回就绪队列CPU 将执行 P3。哪些调度程序会导致饥饿任何使用优先级形式的调度程序都可能导致饥饿因为较早的进程可能永远不会被调度运行分配 CPU。例如使用 SJF如果系统继续有许多短作业要调度较长的作业可能永远不会被调度。这一切取决于调度程序的类型。为什么进程或线程会被放置在就绪队列上当进程能够使用 CPU 时进程将被放置在就绪队列上。一些例子包括进程被阻塞等待存储或套接字的“读”完成现在数据可用。一个新进程已经创建并准备好开始。一个进程线程被阻塞在同步原语条件变量、信号量、互斥锁上但现在可以继续。一个进程被阻塞等待系统调用完成但已经传递了一个信号信号处理程序需要运行。考虑线程时可以生成类似的例子。效率的度量开始时间是进程的挂钟开始时间CPU 开始处理它结束时间是进程的结束挂钟CPU 完成进程运行时间是所需的 CPU 时间总量到达时间是进程进入调度程序的时间CPU 可能不开始处理它什么是“周转时间” 从进程到达到结束的总时间。周转时间结束时间-到达时间什么是“响应时间” 从进程到达到 CPU 实际开始处理它所需的总延迟时间。响应时间开始时间-到达时间什么是“等待时间” 等待时间是总等待时间即进程在就绪队列上的总时间。一个常见的错误是认为它只是在就绪队列中的初始等待时间。如果一个不进行 I/O 的 CPU 密集型进程需要 7 分钟的 CPU 时间才能完成但需要 9 分钟的挂钟时间才能完成我们可以得出结论它在就绪队列中等待了 2 分钟。在这 2 分钟内进程准备好运行但没有分配 CPU。作业等待的时间是 2 分钟无论作业等待的时间是什么时候。等待时间结束时间-到达时间-运行时间什么是车队效应 “车队效应是指 I/O 密集型进程不断积压等待占用 CPU 的 CPU 密集型进程。这导致 I/O 性能不佳即使对于 CPU 需求很小的进程也是如此。” 假设 CPU 当前被分配给一个 CPU 密集型任务并且有一组 I/O 密集型进程在就绪队列中。这些进程只需要很少的 CPU 时间但它们无法继续进行因为它们正在等待 CPU 密集型任务从处理器中移除。这些进程会饿死直到 CPU 绑定的进程释放 CPU。但 CPU 很少会被释放例如在 FCFS 调度程序的情况下我们必须等到进程因 I/O 请求而被阻塞。I/O 密集型进程现在可以满足它们的 CPU 需求因为它们的 CPU 需求很小而 CPU 又被分配给 CPU 密集型进程。因此整个系统的 I/O 性能会因所有进程的 CPU 需求饥饿而受到间接影响。这种效应通常在 FCFS 调度程序的情况下讨论但是循环调度程序也可能出现长时间量的车队效应。 Linux 调度截至 2016 年 2 月Linux 默认使用完全公平调度程序进行 CPU 调度使用 I/O 调度的“BFQ”进行预算公平调度。适当的调度对吞吐量和延迟有重大影响。延迟对交互式和软实时应用程序特别重要例如音频和视频流。有关更多信息请参见此处的讨论和比较基准[lkml.org/lkml/2014/5/27/314]。这是 CFS 的调度方式 CPU 使用进程的虚拟运行时间运行时间/优先级值和睡眠公平性如果进程正在等待某些东西当它完成等待时给它 CPU创建红黑树。优先级值是内核给予某些进程优先级的方式值越低优先级越高内核根据此度量选择最低的度量并安排该进程作为下一个运行将其从队列中移除。由于红黑树是自平衡的此操作保证为 O ( l o g ( n ) ) O(log(n)) O(log(n))选择最小进程是相同的运行时间尽管它被称为公平调度器但存在相当多的问题。被调度的进程组可能负载不平衡因此调度器会大致分配负载。当另一个 CPU 空闲时它只能查看组调度的平均负载而不是单独的核心。因此只要平均负载正常空闲的 CPU 可能不会接手一个长时间运行的 CPU 的工作。如果一组进程在非相邻的核心上运行那么就会出现问题。如果两个核心的距离超过一个跳跃负载平衡算法甚至不会考虑那个核心。这意味着如果一个 CPU 空闲而另一个 CPU 的工作量超过一个跳跃的距离它不会接手这个工作可能已经修复。线程在一组核心上休眠后醒来时只能在它休眠的核心上被调度。如果这些核心现在很忙那么就会出现问题。调度第二部分调度进程算法一些著名的调度算法是什么对于所有的例子进程 1运行时间 1000 毫秒进程 2运行时间 2000 毫秒进程 3运行时间 3000 毫秒进程 4运行时间 4000 毫秒进程 5运行时间 5000 毫秒最短作业优先SJF P1 到达0 毫秒 P2 到达0 毫秒 P3 到达0 毫秒 P4 到达0 毫秒 P5 到达0 毫秒所有进程在开始时到达调度程序安排具有最短总 CPU 时间的作业。明显的问题是这个调度程序需要在运行程序之前知道这个程序将在未来的时间内运行多长时间。技术说明实际的 SJF 实现不会使用进程的总执行时间而是使用突发时间包括进程不再准备运行之前的未来计算执行的总 CPU 时间。可以通过使用基于先前突发时间的指数衰减加权滚动平均值来估计预期的突发时间但是为了简化讨论我们将在这里使用进程的总运行时间作为突发时间的代理。优点较短的作业往往会先运行缺点需要算法是全知的抢占式最短作业优先PSJF 抢占式最短作业优先类似于最短作业优先但如果新作业的运行时间比进程的剩余运行时间短则运行该作业。如果像我们的例子一样相等我们的算法可以选择。调度程序使用进程的总运行时间如果要使用最短剩余时间那就是 PSJF 的一个变体称为最短剩余时间优先。 P2 在 0 毫秒 P1 在 1000 毫秒 P5 在 3000 毫秒 P4 在 4000 毫秒 P3 在 5000 毫秒我们的算法是这样的。它运行 P2因为它是唯一要运行的东西。然后 P1 在 1000 毫秒时进来P2 运行了 2000 毫秒所以我们的调度程序会抢占性地停止 P2并让 P1 一直运行这完全取决于算法因为时间相等。然后P5 进来了–因为没有进程在运行调度程序将运行进程 5。P4 进来了因为运行时间相等于 P5调度程序停止 P5 并运行 P4。最后 P3 进来抢占 P4并运行到完成。然后 P4 运行然后 P5 运行。优点确保较短的作业先运行缺点需要再次知道运行时间 **注意**出于历史原因该算法比较总运行时间而不是剩余运行时间。如果要考虑剩余时间将使用抢占式最短剩余时间优先PSRTF。先来先服务FCFS P2 在 0 毫秒 P1 在 1000 毫秒 P5 在 3000 毫秒 P4 在 4000 毫秒 P3 在 5000 毫秒进程按到达顺序进行调度。FCFS 的一个优点是调度算法很简单就绪队列只是一个 FIFO先进先出队列。FCFS 遭受护航效应的影响。这里 P2 到达然后是 P1 到达然后是 P5然后是 P4然后是 P3。您可以看到 P5 的护航效应。优点简单实现缺点长时间运行的进程可能会阻塞所有其他进程轮转法RR 进程按照它们在就绪队列中的到达顺序进行调度。但是在一个小的时间步长之后正在运行的进程将被强制从运行状态中移除并放回就绪队列。这确保了长时间运行的进程不能使所有其他进程无法运行。进程在返回就绪队列之前可以执行的最长时间称为时间量子。在时间量子较大的极限情况下时间量子长于所有进程的运行时间轮转法将等效于 FCFS。 P1 到达0 毫秒 P2 到达0 毫秒 P3 到达0 毫秒 P4 到达0 毫秒 P5 到达0 毫秒量子1000 毫秒在这里所有进程同时到达。P1 运行 1 个量子然后完成。P2 运行一个量子然后它被停止给 P3。在所有其他进程运行一个量子后我们循环回到 P2直到所有进程都完成。优点确保公平的概念缺点大量进程大量切换优先级进程按优先级值的顺序进行调度。例如导航进程可能比日志记录进程更重要执行。 IPC 复习问题主题虚拟内存页表 MMU/TLB 地址转换页面错误帧/页单级与多级页表计算多级页表的偏移管道管道读写端写入零读取管道从零写入管道命名管道和无命名管道缓冲区大小/原子性调度算法效率衡量问题虚拟内存是什么以下是什么以及它们的目的是什么翻译旁路缓冲区物理地址内存管理单元。多级页表。帧号。页号和页偏移。脏位 NX 位什么是页表物理帧呢页面是否总是需要指向物理帧什么是页面错误有哪些类型什么时候会导致段错误单级页表有什么优点缺点多级表呢多级表在内存中是什么样子的如何确定页面偏移中使用了多少位给定 64 位地址空间4kb 页和帧以及 3 级页表虚拟页号 1VPN2VPN3 和偏移分别有多少位什么是管道如何创建管道 SIGPIPE 是在什么时候传递给进程的在什么条件下调用管道上的 read()会阻塞在什么条件下 read()会立即返回 0 命名管道和无命名管道之间有什么区别管道是线程安全的吗编写一个使用 fseek 和 ftell 来用’X’替换文件的中间字符的函数编写一个创建管道并使用 write 发送 5 个字节“HELLO”到管道的函数。返回管道的读文件描述符。当您 mmap 文件时会发生什么为什么不建议使用 ftell 获取文件大小应该如何替代什么是调度周转时间是什么响应时间等待时间什么是护航效应哪些算法平均具有最佳的周转/响应/等待时间八、网络连接 POSIX第一部分错误处理什么是 POSIX 错误处理在其他语言中你可能会看到异常处理的实现。尽管在 C 中你技术上可以使用它们你保留一个非常 try/catch 块的堆栈并使用setjmp和longjmp分别进入这些块但 C 中的错误处理通常是用 posix 错误处理来完成的代码通常看起来像这样。 int ret some_system_call() if(ret ERROR_CODE){ switch(errno){ // Do different stuff based on the errno number. } } 在内核中使用goto来清理应用程序的不同部分是非常常见的。你不应该使用 goto因为它会使代码更难阅读。内核中的 goto 是出于必要性而存在的所以不要学习它。 errno是什么何时设置它 POSIX 定义了一个特殊的整数errno当系统调用失败时会设置它。errno的初始值是零即没有错误。当系统调用失败时它通常会返回-1 来指示错误并设置errno。多线程呢每个线程都有自己的errno副本。这非常有用否则一个线程的错误会干扰另一个线程的错误状态。 errno何时重置为零除非你明确将它重置为零当系统调用成功时它们不会重置errno的值。这意味着你只应该依赖 errno 的值如果你知道一个系统调用失败了例如它返回了-1。使用errno的注意事项和最佳实践是什么当复杂的错误处理使用库调用或系统调用可能改变errno的值时要小心。实际上将errno的值复制到一个 int 变量中更安全 // Unsafe - the first fprintf may change the value of errno before we use it! if (-1 sem_wait(s)) {fprintf(stderr, An error occurred!);fprintf(stderr, The error value is %d\n, errno); } // Better, copy the value before making more system and library calls if (-1 sem_wait(s)) {int errno_saved errno;fprintf(stderr, An error occurred!);fprintf(stderr, The error value is %d\n, errno_saved); }同样如果你的信号处理程序进行了任何系统或库调用那么最好的做法是保存 errno 的原始值并在返回之前恢复该值 void handler(int signal) {int errno_saved errno;// make system calls that might change errnoerrno errno_saved; }如何打印出与特定错误号相关联的字符串消息使用strerror来获取错误值的简短英文描述 char *mesg strerror(errno); fprintf(stderr, An error occurred (errno%d): %s, errno, mesg);perror 和 strerror 有什么关系在之前的页面中我们使用 perror 将错误打印到标准错误输出。使用strerror我们现在可以编写一个简单的perror实现 void perror(char *what) {fprintf(stderr, %s: %s\n, what, strerror(errno)); }使用 strerror 的注意事项是什么不幸的是strerror不是线程安全的。换句话说两个线程不能同时调用它有两种解决方法首先我们可以使用互斥锁来定义一个临界区和一个本地缓冲区。所有调用strerror的地方都应该使用相同的互斥锁。 pthread_mutex_lock(m); char *result strerror(errno); char *message malloc(strlen(result) 1); strcpy(message, result); pthread_mutex_unlock(m); fprintf(stderr, An error occurred (errno%d): %s, errno, message); free(message);或者使用不太便携但线程安全的strerror_r EINTR 是什么对 sem_wait、read、write 有什么影响当信号例如 SIGCHLD、SIGPIPE 等传递到进程时一些系统调用可能会被中断。此时系统调用可能会返回而不执行任何操作例如可能没有读/写字节信号量等待可能没有等待。这种中断可以通过检查返回值和errno是否为 EINTR 来检测。在这种情况下应该重试系统调用。通常会看到以下类型的循环它包装了一个系统调用比如 sem_wait。 while ((-1 systemcall(...)) (errno EINTR)) { /* repeat! */}小心写成 EINTR而不是 EINTR。或者如果结果值需要稍后使用… while ((-1 (result systemcall(...))) (errno EINTR)) { /* repeat! */}在 Linux 上调用read和write到本地磁盘通常不会返回 EINTR相反函数会自动为您重新启动。然而对应于网络流的文件描述符上调用read和write可能会返回 EINTR。哪些系统调用可能会被中断并需要包装使用手册页手册页包括系统调用可能设置的错误即 errno 值列表。一个经验法则是’慢’阻塞调用例如写入套接字可能会被中断但快速的非阻塞调用例如 pthread_mutex_lock不会。来自 Linux 信号 7 手册页。如果在系统调用或库函数调用被阻塞时调用了信号处理程序那么信号处理程序返回后调用将自动重新启动或者调用失败并显示错误 EINTR。发生这两种行为取决于接口以及信号处理程序是否使用了 SA_RESTART 标志请参阅 sigaction(2)。这些细节在 UNIX 系统中各不相同以下是 Linux 的细节。如果对以下接口之一的阻塞调用被信号处理程序中断那么如果使用了 SA_RESTART 标志则在信号处理程序返回后调用将自动重新启动否则调用将失败并显示错误 EINTR 对“慢”设备的 read(2)readv(2)write(2)writev(2)和 ioctl(2)调用。 “慢”设备是指 I/O 调用可能会无限期地阻塞的设备例如终端管道或套接字。根据此定义磁盘不是慢设备。如果对慢设备的 I/O 调用在被信号处理程序中断时已经传输了一些数据则调用将返回成功状态通常是传输的字节数。请注意很容易相信设置’SA_RESTART’标志就足以使整个问题消失。不幸的是这并不是真的仍然有可能有系统调用会提前返回并设置EINTR有关详细信息请参阅signal(7)。 Errno 异常有一些 POSIX 实用程序有自己的 errno。其中一个是当您调用getaddrinfo函数来检查错误并将其转换为字符串时可以使用gai_strerror。不要混淆它们网络第一部分介绍注意显而易见本页不是IP、UDP 或 TCP 的完整描述相反这是一个简短的介绍足以让我们在以后的讲座中建立在这些概念之上。 “IP4”“IP6”是什么以下是互联网协议IP的“30 秒”介绍-这是从一台机器向另一台机器发送信息包“数据报”的主要方法。 “IP4”或更准确地说“IPv4”是互联网协议的第 4 版描述了如何在网络上从一台机器发送信息包到另一台机器。大约 95%的互联网数据包今天都是 IPv4 数据包。IPv4 的一个重要限制是源地址和目的地址被限制为 32 位IPv4 是在当时认为 4 亿台设备连接到同一网络是不可想象的时候设计的或者至少不值得增加数据包大小每个 IPv4 数据包包括一个非常小的头部-通常为 20 字节更准确地说“八位字节”其中包括源地址和目的地址。从概念上讲源地址和目的地址可以分为两部分网络号高位和低位表示该网络上特定主机号。更新的数据包协议“IPv6”解决了 IPv4 的许多限制例如使路由表更简单和 128 位地址但是不到 5%的网络流量是基于 IPv6 的。一台机器可以有一个 IPv6 地址和一个 IPv4 地址。 “没有像 127.0.0.1 这样的地方” 特殊的 IPv4 地址是127.0.0.1也称为本地主机。发送到 127.0.0.1 的数据包永远不会离开机器该地址被指定为同一台机器。请注意32 位地址被分成 4 个八位字节即点表示法中的每个数字可以是 0-255。但是 IPv4 地址也可以写成整数。 …和…“没有像 0:0:0:0:0:0:0:1 这样的地方” IPv6 中的 128 位本地主机地址是0:0:0:0:0:0:0:1可以用缩写形式::1来表示。什么是端口要使用 IPv4或 IPv6向互联网上的主机发送数据报数据包您需要指定主机地址和端口。端口是一个无符号的 16 位数字即最大端口号为 65535。一个进程可以监听特定端口上的传入数据包。但是只有具有超级用户root访问权限的进程才能监听端口1024。任何进程都可以监听 1024 或更高的端口。经常使用的端口是端口 80端口 80 用于未加密的 http 请求即网页。例如如果一个网络浏览器连接到www.bbc.com/那么它将连接到端口 80。 UDP 是什么它什么时候使用 UDP 是建立在 IPv4 和 IPv6 之上的无连接协议。它非常简单易用决定目的地址和端口然后发送数据包然而网络不能保证数据包是否会到达。如果网络拥挤数据包也称为数据报可能会丢失。数据包可能会重复或无序到达。在两个远程数据中心之间典型的数据包丢失率为 3%。 UDP 的典型用例是当接收最新数据比接收所有数据更重要时。例如游戏可能会发送玩家位置的持续更新。流媒体视频信号可能使用 UDP 发送图片更新。 TCP 是什么它什么时候使用 TCP 是建立在 IPv4 和 IPv6 之上的基于连接的协议因此可以被描述为“TCP/IP”或“TCP over IP”。TCP 在两台机器之间创建了一个“管道”并抽象了互联网的低级数据包特性因此在大多数情况下从一台机器发送的字节最终会到达另一端而不会重复或丢失数据。 TCP 将自动管理重发数据包忽略重复数据包重新排列无序数据包并改变发送数据包的速率。 TCP 的三次握手被称为 SYNSYN-ACK 和 ACK。本页面上的图表有助于理解 TCP 握手。TCP 握手今天互联网上的大多数服务例如 Web 服务使用 TCP因为它隐藏了互联网更低级别的数据包特性的复杂性。网络第二部分使用 getaddrinfo 如何使用getaddrinfo将主机名转换为 IP 地址函数getaddrinfo可以将人类可读的域名例如www.illinois.edu转换为 IPv4 和 IPv6 地址。实际上它将返回一个 addrinfo 结构的链表 struct addrinfo {int ai_flags;int ai_family;int ai_socktype;int ai_protocol;socklen_t ai_addrlen;struct sockaddr *ai_addr;char *ai_canonname;struct addrinfo *ai_next; };使用起来非常简单。例如假设你想找出www.bbc.com的网页服务器的数值 IPv4 地址。我们分两个阶段来做。首先使用 getaddrinfo 构建可能连接的链表。其次使用getnameinfo将二进制地址转换为可读形式。 #include stdio.h #include stdlib.h #include sys/types.h #include sys/socket.h #include netdb.hstruct addrinfo hints, *infoptr; // So no need to use memset global variablesint main() {hints.ai_family AF_INET; // AF_INET means IPv4 only addressesint result getaddrinfo(www.bbc.com, NULL, hints, infoptr);if (result) {fprintf(stderr, getaddrinfo: %s\n, gai_strerror(result));exit(1);}struct addrinfo *p;char host[256],service[256];for(p infoptr; p ! NULL; p p-ai_next) {getnameinfo(p-ai_addr, p-ai_addrlen, host, sizeof(host), service, sizeof(service), NI_NUMERICHOST);puts(host);}freeaddrinfo(infoptr);return 0; }典型输出 212.58.244.70 212.58.244.71 www.cs.illinois.edu如何转换为 IP 地址神奇不是开玩笑使用了一个名为“DNS”域名服务的系统。如果一台机器本地没有答案那么它会向本地 DNS 服务器发送一个 UDP 数据包。这个服务器反过来可能会查询其他上游 DNS 服务器。 DNS 安全吗 DNS 本身很快但不安全。DNS 请求未加密容易受到“中间人”攻击的影响。例如咖啡店的互联网连接可以轻松篡改您的 DNS 请求并为特定域返回不同的 IP 地址如何连接到 TCP 服务器例如网页服务器 TODO 有三个基本的系统调用你需要连接到远程机器 getaddrinfo -- Determine the remote addresses of a remote host socket -- Create a socket connect -- Connect to the remote host using the socket and address information 如果getaddrinfo调用成功它将创建一个addrinfo结构的链表并将给定的指针设置为指向第一个。套接字调用创建一个传出套接字并返回一个描述符有时称为“文件描述符”可以与read和write等一起使用。在这个意义上它是网络模拟open打开文件流的功能-只是我们还没有将套接字连接到任何地方最后连接调用尝试连接到远程机器。我们传递原始套接字描述符以及存储在 addrinfo 结构中的套接字地址信息。有不同类型的套接字地址结构例如 IPv4 与 IPv6可能需要更多的内存。因此除了传递指针外还传递了结构的大小 // Pull out the socket address info from the addrinfo struct: connect(sockfd, p-ai_addr, p-ai_addrlen)如何释放为 addrinfo 结构的链表分配的内存在清理代码的一部分上调用freeaddrinfo在最顶层的addrinfo结构上 void freeaddrinfo(struct addrinfo *ai);如果 getaddrinfo 失败我可以使用strerror打印出错误吗不。使用getaddrinfo进行错误处理有点不同返回值就是错误代码即不要使用errno 使用gai_strerror获取等效的简短英文错误文本 int result getaddrinfo(...); if(result) { const char *mesg gai_strerror(result); ... }我可以只请求 IPv4 或 IPv6 连接吗仅限 TCP 是的使用传递给getaddrinfo的 addrinfo 结构来定义你想要的连接类型。例如要指定基于 IPv6 的基于流的协议 struct addrinfo hints; memset(hints, 0, sizeof(hints));hints.ai_family AF_INET6; // Only want IPv6 (use AF_INET for IPv4) hints.ai_socktype SOCK_STREAM; // Only want stream-based connection关于使用gethostbyname的代码示例呢旧函数gethostbyname已被弃用这是将主机名转换为 IP 地址的旧方法。端口地址仍然需要使用 htons 函数手动设置。使用更新的getaddrinfo更容易编写支持 IPv4 和 IPv6 的代码是这么简单是也不是。创建一个简单的 TCP 客户端很容易-但是网络通信提供了许多不同级别的抽象以及可以在每个抽象级别设置的几个属性和选项例如我们还没有讨论可以操纵套接字选项的setsockopt。有关更多信息请参阅此指南。网络第三部分构建一个简单的 TCP 客户端套接字 int socket(int domain, int type, int protocol); Socket 使用域通常为 IPv4 的 AF_INET类型是使用 UDP 还是 TCP协议是任何附加选项。这在内核中创建了一个套接字对象可以与外部世界/网络通信。这将返回一个 fd因此您可以像使用普通文件描述符一样使用它请记住您希望从 socketfd 读取或写入因为它仅代表客户端的套接字对象否则您希望遵守服务器的约定。 getaddressinfo 我们在上一节看到了这个你们是这方面的专家。连接 int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen); 将 sockfd 传递给它然后传递您要访问的地址及其长度您将可以连接只要检查错误。请记住网络调用极易失败。读取/写入一旦我们成功连接我们可以像处理任何旧文件描述符一样读取或写入。请记住如果您连接到一个网站您希望遵守 HTTP 协议规范以便获得任何有意义的结果。通常有库来做这个通常你不会在套接字级别连接因为周围有其他库或软件包完整的简单 TCP 客户端示例 #include stdio.h #include stdlib.h #include string.h #include sys/types.h #include sys/socket.h #include netdb.h #include unistd.hint main(int argc, char **argv) {int s;int sock_fd socket(AF_INET, SOCK_STREAM, 0);struct addrinfo hints, *result;memset(hints, 0, sizeof(struct addrinfo));hints.ai_family AF_INET; /* IPv4 only */hints.ai_socktype SOCK_STREAM; /* TCP */s getaddrinfo(www.illinois.edu, 80, hints, result);if (s ! 0) {fprintf(stderr, getaddrinfo: %s\n, gai_strerror(s));exit(1);}if(connect(sock_fd, result-ai_addr, result-ai_addrlen) -1){perror(connect);exit(2);}char *buffer GET / HTTP/1.0\r\n\r\n;printf(SENDING: %s, buffer);printf(\n);write(sock_fd, buffer, strlen(buffer));char resp[1000];int len read(sock_fd, resp, 999);resp[len] \0;printf(%s\n, resp);return 0; }示例输出 SENDING: GET / HTTP/1.0 HTTP/1.1 200 OK Date: Mon, 27 Oct 2014 19:19:05 GMT Server: Apache/2.2.15 (Red Hat) mod_ssl/2.2.15 OpenSSL/1.0.1e-fips mod_jk/1.2.32 Last-Modified: Fri, 03 Feb 2012 16:51:10 GMT ETag: 401b0-49-4b8121ea69b80 Accept-Ranges: bytes Content-Length: 73 Connection: close Content-Type: text/htmlProvided by Web Services at Public Affairs at the University of Illinois 对 HTTP 请求和响应的评论上面的示例演示了使用超文本传输协议向服务器发出请求。使用以下请求请求网页或其他资源 GET / HTTP/1.0 有四个部分方法例如 GETPOST…资源例如/ /index.html /image.png协议“HTTP/1.0”和两个新行\r\n\r\n 服务器的第一行响应描述了所使用的 HTTP 版本以及请求是否成功使用了一个 3 位数的响应代码 HTTP/1.1 200 OK 如果客户端请求了一个不存在的文件例如GET /nosuchfile.html HTTP/1.0那么第一行包括响应代码是著名的404响应代码 HTTP/1.1 404 Not Found 网络第四部分构建一个简单的 TCP 服务器 htons是什么何时使用它整数可以以最低有效字节优先或最高有效字节优先表示。只要机器本身在内部一致任何方法都是合理的。对于网络通信我们需要在约定的格式上进行标准化。 htons(xyz)以网络字节顺序返回 16 位无符号整数“short”值 xyz。htonl(xyz)以网络字节顺序返回 32 位无符号整数“long”值 xyz。这些函数被读作“主机到网络”反向函数ntohs、ntohl将网络排序的字节值转换为主机排序。那么主机排序是小端还是大端答案是-这取决于您的机器这取决于运行代码的主机的实际架构。如果架构恰好与网络排序相同那么这些函数的结果就是参数。对于 x86 机器主机和网络排序是不同的。总结无论何时读取或写入低级 C 网络结构例如端口和地址信息请记住使用上述函数确保正确转换为/从机器格式。否则显示或指定的值可能是不正确的。用于创建服务器的“大 4”网络调用是什么创建 TCP 服务器所需的四个系统调用是socket、bind、listen和accept。每个都有特定的目的并且应按上述顺序调用。端口信息由 bind 使用可以手动设置许多旧的仅 IPv4 的 C 代码示例都这样做也可以使用getaddrinfo创建我们稍后也会看到 setsockopt 的示例。调用socket的目的是什么为网络通信创建一个端点。一个新的套接字本身并不特别有用虽然我们已经指定了基于数据包或基于流的连接但它并没有绑定到特定的网络接口或端口。相反套接字返回一个网络描述符可以在以后调用 bind、listen 和 accept 时使用。调用bind的目的是什么 bind调用将抽象套接字与实际网络接口和端口关联起来。可以在 TCP 客户端上调用 bind但通常不需要指定出站端口。调用listen的目的是什么 listen调用指定了等待处理的传入连接的队列大小即尚未被accept分配网络描述符的连接。高性能服务器的典型值为 128 或更多。为什么服务器套接字是被动的服务器套接字不会主动尝试连接到另一个主机相反它们等待传入的连接。此外当对等方断开连接时服务器套接字不会关闭。相反当远程客户端连接时它会立即被转移到未使用的端口号以进行未来通信。调用accept的目的是什么一旦服务器套接字被初始化服务器调用accept等待新的连接。与socket、bind和listen不同这个调用将会阻塞。也就是说如果没有新的连接这个调用将会阻塞只有当一个新的客户端连接时才会返回。注意accept调用返回一个新的文件描述符。这个文件描述符特定于特定的客户端。常见的编程错误是使用原始服务器套接字描述符进行服务器 I/O然后惊讶地发现网络代码失败了。创建 TCP 服务器的注意事项是什么使用被动服务器套接字的套接字描述符如上所述未指定getaddrinfo的 SOCK_STREAM 要求无法重用现有端口。不初始化未使用的结构条目如果端口当前正在使用bind调用将失败注意端口是每台机器的而不是每个进程或每个用户的。换句话说当另一个进程使用该端口时您不能使用端口 1234。更糟糕的是默认情况下端口在进程结束后会被“占用”。服务器代码示例下面是一个工作的简单服务器示例。请注意此示例不完整 - 例如它既不关闭套接字描述符也不释放getaddrinfo创建的内存。 #include string.h #include stdio.h #include stdlib.h #include sys/types.h #include sys/socket.h #include netdb.h #include unistd.h #include arpa/inet.hint main(int argc, char **argv) {int s;int sock_fd socket(AF_INET, SOCK_STREAM, 0);struct addrinfo hints, *result;memset(hints, 0, sizeof(struct addrinfo));hints.ai_family AF_INET;hints.ai_socktype SOCK_STREAM;hints.ai_flags AI_PASSIVE;s getaddrinfo(NULL, 1234, hints, result);if (s ! 0) {fprintf(stderr, getaddrinfo: %s\n, gai_strerror(s));exit(1);}if (bind(sock_fd, result-ai_addr, result-ai_addrlen) ! 0) {perror(bind());exit(1);}if (listen(sock_fd, 10) ! 0) {perror(listen());exit(1);}struct sockaddr_in *result_addr (struct sockaddr_in *) result-ai_addr;printf(Listening on file descriptor %d, port %d\n, sock_fd, ntohs(result_addr-sin_port));printf(Waiting for connection...\n);int client_fd accept(sock_fd, NULL, NULL);printf(Connection made: client_fd%d\n, client_fd);char buffer[1000];int len read(client_fd, buffer, sizeof(buffer) - 1);buffer[len] \0;printf(Read %d chars\n, len);printf(\n);printf(%s\n, buffer);return 0; }为什么我的服务器不能重用端口默认情况下当套接字关闭时端口不会立即释放。相反端口会进入“TIMED-WAIT”状态。这可能会在开发过程中导致重大混乱因为超时可能会使有效的网络代码看起来失败。要能够立即重用端口需要在绑定端口之前指定SO_REUSEPORT。 int optval 1; setsockopt(sfd, SOL_SOCKET, SO_REUSEPORT, optval, sizeof(optval));bind(....这里是一个关于SO_REUSEPORT的扩展 stackoverflow 入门讨论。网络第五部分关闭端口重用端口和其他技巧关闭和关闭之间有什么区别当您不再需要从套接字读取更多数据写入更多数据或完成两者时请使用shutdown调用。当您关闭套接字以进行进一步写入或读取时该信息也会发送到连接的另一端。例如如果您在服务器端关闭套接字以进行进一步写入那么稍后阻塞的read调用可能返回 0表示不再需要更多字节。当您的进程不再需要套接字文件描述符时请使用close。如果在创建套接字文件描述符后进行了fork则所有进程都需要在套接字资源可以重新使用之前关闭套接字。如果您关闭套接字以进行进一步读取那么所有进程都会受到影响因为您已更改了套接字而不仅仅是文件描述符。良好编写的代码将在调用close之前shutdown套接字。当我重新运行我的服务器代码时它不起作用为什么默认情况下套接字关闭后端口进入超时状态在此期间不能重新使用“绑定到新套接字”。通过在绑定到端口之前设置套接字选项 REUSEPORT 可以禁用此行为 int optval 1;setsockopt(sock_fd, SOL_SOCKET, SO_REUSEPORT, optval, sizeof(optval));bind(sock_fd, ...);TCP 客户端可以绑定到特定端口吗是的实际上出站 TCP 连接会自动绑定到客户端上未使用的端口。通常情况下不需要在客户端上显式设置端口因为系统会智能地在合理的接口上找到一个未使用的端口例如如果当前通过 WiFi 连接则是无线网卡。但是如果您需要明确选择特定的以太网卡或者防火墙仅允许从特定范围的端口值进行出站连接则可能会有用。要显式绑定到以太网接口和端口请在connect之前调用bind 谁连接到我的服务器 accept系统调用可以选择性地通过传递 sockaddr 结构提供有关远程客户端的信息。不同的协议具有不同的struct sockaddr变体它们的大小也不同。使用最简单的结构是sockaddr_storage它足够大以表示所有可能类型的 sockaddr。请注意C 没有任何继承模型。因此我们需要将我们的结构明确转换为“基本类型”结构 sockaddr。 struct sockaddr_storage clientaddr;socklen_t clientaddrsize sizeof(clientaddr);int client_id accept(passive_socket,(struct sockaddr *) clientaddr,clientaddrsize);我们已经看到getaddrinfo可以构建 addrinfo 条目的链表每个条目都可以包含套接字配置数据。如果我们想要将套接字数据转换为 IP 和端口地址怎么办输入getnameinfo它可以用于将本地或远程套接字信息转换为域名或数字 IP。类似地端口号可以表示为服务名称例如端口 80 的“http”。在下面的示例中我们请求客户端 IP 地址和客户端端口号的数字版本。 socklen_t clientaddrsize sizeof(clientaddr);int client_id accept(sock_id, (struct sockaddr *) clientaddr, clientaddrsize);char host[256], port[256];getnameinfo((struct sockaddr *) clientaddr,clientaddrsize, host, sizeof(host), port, sizeof(port),NI_NUMERICHOST | NI_NUMERICSERV);待办事项讨论 NI_MAXHOST 和 NI_MAXSERV以及 NI_NUMERICHOST getnameinfo 示例我的 IP 地址是多少要获取当前计算机的 IP 地址的 IP 地址链表请使用getifaddrs它将返回 IPv4 和 IPv6 IP 地址的链接列表可能还包括其他接口。我们可以检查每个条目并使用getnameinfo打印主机的 IP 地址。ifaddrs 结构包括家族但不包括结构的大小。因此我们需要根据家族IPv4 v IPv6手动确定结构的大小。 (family AF_INET) ? sizeof(struct sockaddr_in) : sizeof(struct sockaddr_in6)完整的代码如下所示。 int required_family AF_INET; // Change to AF_INET6 for IPv6struct ifaddrs *myaddrs, *ifa;getifaddrs(myaddrs);char host[256], port[256];for (ifa myaddrs; ifa ! NULL; ifa ifa-ifa_next) {int family ifa-ifa_addr-sa_family;if (family required_family ifa-ifa_addr) {if (0 getnameinfo(ifa-ifa_addr,(family AF_INET) ? sizeof(struct sockaddr_in) :sizeof(struct sockaddr_in6),host, sizeof(host), port, sizeof(port), NI_NUMERICHOST | NI_NUMERICSERV ))puts(host);}}我的机器的 IP 地址是多少shell 版本答案使用ifconfig或 Windows 的 ipconfig。但是这个命令为每个接口生成大量输出因此我们可以使用 grep 过滤输出。 ifconfig | grep inetExample output:inet6 fe80::1%lo0 prefixlen 64 scopeid 0x1 inet 127.0.0.1 netmask 0xff000000 inet6 ::1 prefixlen 128 inet6 fe80::7256:81ff:fe9a:9141%en1 prefixlen 64 scopeid 0x5 inet 192.168.1.100 netmask 0xffffff00 broadcast 192.168.1.255 网络第六部分创建 UDP 服务器如何创建 UDP 服务器有各种可用的函数调用来发送 UDP 套接字。我们将使用较新的 getaddrinfo 来帮助设置套接字结构。请记住UDP 是一个简单的基于数据包的协议两个主机之间没有建立连接。首先初始化 hints addrinfo 结构以请求一个 IPv6被动数据报套接字。 memset(hints, 0, sizeof(hints)); hints.ai_family AF_INET6; // INET for IPv4 hints.ai_socktype SOCK_DGRAM; hints.ai_flags AI_PASSIVE;接下来使用 getaddrinfo 来指定端口号我们不需要指定主机因为我们正在创建一个服务器套接字而不是向远程主机发送数据包。 getaddrinfo(NULL, 300, hints, res);sockfd socket(res-ai_family, res-ai_socktype, res-ai_protocol); bind(sockfd, res-ai_addr, res-ai_addrlen);端口号是1024所以程序将需要root权限。我们也可以指定一个服务名称而不是一个数字端口值。到目前为止调用与 TCP 服务器类似。对于基于流的服务我们将调用listen和accept。对于我们的 UDP 服务器我们可以开始等待套接字上数据包的到达。 struct sockaddr_storage addr; int addrlen sizeof(addr);// ssize_t recvfrom(int socket, void* buffer, size_t buflen, int flags, struct sockaddr *addr, socklen_t * address_len);byte_count recvfrom(sockfd, buf, sizeof(buf), 0, addr, addrlen);addr 结构将保存有关到达数据包的发送者源信息。请注意sockaddr_storage类型足够大可以容纳所有可能类型的套接字地址例如 IPv4、IPv6 和其他套接字类型。完整代码 #include string.h #include stdio.h #include stdlib.h #include sys/types.h #include sys/socket.h #include netdb.h #include unistd.h #include arpa/inet.hint main(int argc, char **argv) {int s;struct addrinfo hints, *result;memset(hints, 0, sizeof(hints));hints.ai_family AF_INET6; // INET for IPv4hints.ai_socktype SOCK_DGRAM;hints.ai_flags AI_PASSIVE;getaddrinfo(NULL, 300, hints, res);int sockfd socket(res-ai_family, res-ai_socktype, res-ai_protocol);if (bind(sockfd, res-ai_addr, res-ai_addrlen) ! 0) {perror(bind());exit(1);}struct sockaddr_storage addr;int addrlen sizeof(addr);while(1){char buffer[1000];ssize_t byte_count recvfrom(sockfd, buf, sizeof(buf), 0, addr, addrlen);buffer[byte_count] \0;}printf(Read %d chars\n, len);printf(\n);printf(%s\n, buffer);return 0; }网络第七部分非阻塞 I/Oselect()和 epoll 不要浪费时间等待通常当你调用read()时如果数据尚不可用它将等待数据准备就绪后再返回。当你从磁盘读取数据时这种延迟可能不会很长但当你从一个慢速网络连接中读取数据时如果数据到达的话可能需要很长时间。 POSIX 允许你在文件描述符上设置一个标志以便对该文件描述符的任何read()调用都会立即返回无论它是否已经完成。在这种模式下你的read()调用将启动读取操作而在它工作时你可以做其他有用的工作。这被称为“非阻塞”模式因为read()的调用不会阻塞。要将文件描述符设置为非阻塞 // fd is my file descriptorint flags fcntl(fd, F_GETFL, 0);fcntl(fd, F_SETFL, flags | O_NONBLOCK);对于套接字你可以通过将SOCK_NONBLOCK添加到socket()的第二个参数来以非阻塞模式创建它。 fd socket(AF_INET, SOCK_STREAM | SOCK_NONBLOCK, 0);当文件处于非阻塞模式时你调用read()它将立即返回可用的字节。假设从套接字的另一端的服务器已经到达了 100 个字节你调用read(fd, buf, 150)。read将立即返回值 100表示它读取了你要求的 150 个字节中的 100 个。假设你尝试通过调用read(fd, buf100, 50)来读取剩余的数据但是最后的 50 个字节还没有到达。read()将返回-1并将全局错误变量errno设置为 EAGAIN 或 EWOULDBLOCK。这是系统告诉你数据还没有准备好的方式。 write()也可以在非阻塞模式下工作。假设你想使用套接字向远程服务器发送 40,000 字节。系统一次只能发送这么多字节。通常系统一次可以发送大约 23,000 字节。在非阻塞模式下write(fd, buf, 40000)将返回它立即能够发送的字节数大约为 23,000。如果你立即再次调用write()它将返回-1并将 errno 设置为 EAGAIN 或 EWOULDBLOCK。这是系统告诉你它仍在忙于发送最后一块数据并且还没有准备好发送更多数据。如何检查 I/O 何时完成有几种方法。让我们看看如何使用select和epoll来做。 select int select(int nfds, fd_set *readfds, fd_set *writefds,fd_set *exceptfds, struct timeval *timeout);给定三组文件描述符select()将等待其中任何一个文件描述符变为“准备就绪”。 readfds - 在readfds中的文件描述符在有可读数据或已达到 EOF 时准备就绪。 writefds - 在writefds中的文件描述符在调用 write()时将会成功。 exceptfds - 系统特定定义不清晰。只需将其传递为 NULL。 select()返回准备就绪的文件描述符的总数。如果它们在timeout定义的时间内没有准备好它将返回 0。在select()返回后调用者需要循环遍历 readfds 和/或 writefds 中的文件描述符以查看哪些是准备好的。由于 readfds 和 writefds 充当输入和输出参数当select()指示有准备好的文件描述符时它会覆盖它们以反映只有准备好的文件描述符。除非调用者的意图是只调用一次select()否则在调用它之前保存 readfds 和 writefds 的副本是个好主意。 fd_set readfds, writefds;FD_ZERO(readfds);FD_ZERO(writefds);for (int i0; i read_fd_count; i)FD_SET(my_read_fds[i], readfds);for (int i0; i write_fd_count; i)FD_SET(my_write_fds[i], writefds);struct timeval timeout;timeout.tv_sec 3;timeout.tv_usec 0;int num_ready select(FD_SETSIZE, readfds, writefds, NULL, timeout);if (num_ready 0) {perror(error in select());} else if (num_ready 0) {printf(timeout\n);} else {for (int i0; i read_fd_count; i)if (FD_ISSET(my_read_fds[i], readfds))printf(fd %d is ready for reading\n, my_read_fds[i]);for (int i0; i write_fd_count; i)if (FD_ISSET(my_write_fds[i], writefds))printf(fd %d is ready for writing\n, my_write_fds[i]);}有关 select()的更多信息 epoll epoll不是 POSIX 的一部分但它受 Linux 支持。这是一种更有效的等待多个文件描述符的方式。它会告诉你哪些描述符准备好了。它甚至可以为每个描述符存储少量数据比如数组索引或指针使得更容易访问与该描述符相关的数据。使用 epoll首先您必须使用epoll_create()创建一个特殊的文件描述符。您不会读取或写入此文件描述符您只需将其传递给其他 epoll_xxx 函数并在最后调用 close()。 epfd epoll_create(1);对于要使用 epoll 监视的每个文件描述符您需要使用epoll_ctl()和EPOLL_CTL_ADD选项将其添加到 epoll 数据结构中。您可以向其中添加任意数量的文件描述符。 struct epoll_event event;event.events EPOLLOUT; // EPOLLINread, EPOLLOUTwriteevent.data.ptr mypointer;epoll_ctl(epfd, EPOLL_CTL_ADD, mypointer-fd, event)要等待某些文件描述符准备就绪请使用epoll_wait()。它填充的 epoll_event 结构将包含您在添加此文件描述符时提供的 event.data 中的数据。这使您可以轻松查找与此文件描述符关联的自己的数据。 int num_ready epoll_wait(epfd, event, 1, timeout_milliseconds);if (num_ready 0) {MyData *mypointer (MyData*) event.data.ptr;printf(ready to write on %d\n, mypointer-fd);}假设您正在等待向文件描述符写入数据但现在您想要等待从中读取数据。只需使用epoll_ctl()和EPOLL_CTL_MOD选项来更改您正在监视的操作类型。 event.events EPOLLOUT;event.data.ptr mypointer;epoll_ctl(epfd, EPOLL_CTL_MOD, mypointer-fd, event);要取消订阅一个文件描述符同时保持其他文件描述符处于活动状态请使用epoll_ctl()和EPOLL_CTL_DEL选项。 epoll_ctl(epfd, EPOLL_CTL_DEL, mypointer-fd, NULL);要关闭 epoll 实例请关闭其文件描述符。 close(epfd);除了非阻塞的read()和write()之外对非阻塞套接字上的任何connect()调用也将是非阻塞的。要等待连接完成请使用select()或 epoll 等待套接字可写。有关 select 的边缘情况的有趣博文 idea.popcount.org/2017-01-06-select-is-fundamentally-broken/ RPC第一部分远程过程调用简介什么是 RPC 远程过程调用。RPC 是我们可以在不同的机器上执行一个过程函数的想法。实际上该过程可能在同一台机器上执行但可能在不同的上下文中执行-例如在不同的用户下以不同的权限和不同的生命周期。什么是特权分离远程代码将在不同的用户和不同权限下执行。实际上远程调用可能以比调用者更多或更少的权限执行。原则上这可以用来提高系统的安全性通过确保组件以最低权限运行。不幸的是安全问题需要仔细评估以确保 RPC 机制不能被利用来执行不需要的操作。例如RPC 实现可能会隐式信任任何连接的客户端执行任何操作而不是在数据的子集上执行子集的操作。什么是存根代码什么是编组存根代码是隐藏执行远程过程调用复杂性所必需的代码。存根代码的作用之一是编组必要的数据成为可以作为字节流发送到远程服务器的格式。 // On the outside getHiscore looks like a normal function call // On the inside the stub code performs all of the work to send and receive the data to and from the remote machine.int getHiscore(char* game) {// Marshall the request into a sequence of bytes:char* buffer;asprintf(buffer,getHiscore(%s)!, name);// Send down the wire (we do not send the zero byte; the ! signifies the end of the message)write(fd, buffer, strlen(buffer) );// Wait for the server to send a responsessize_t bytesread read(fd, buffer, sizeof(buffer));// Example: unmarshal the bytes received back from text into an intbuffer[bytesread] 0; // Turn the result into a C stringint score atoi(buffer);free(buffer);return score; }什么是服务器存根代码什么是解组服务器存根代码将接收请求将请求解组成有效的内存数据调用底层实现并将结果发送回调用者。如何发送 intfloat结构链表图要实现 RPC您需要决定并记录将数据序列化为字节序列的约定。即使是一个简单的整数也有几种常见选择有符号还是无符号 ASCII 固定字节数或根据大小而变化小端或大端的二进制格式要编组一个结构决定哪些字段需要序列化。可能不需要发送所有数据项例如某些项可能与特定的 RPC 无关或者可以由服务器从其他数据项重新计算。编组链表时无需发送链接指针-只需流式传输值。作为解组的一部分服务器可以从字节序列中重新创建链表结构。通过从头节点/顶点开始可以递归访问简单树以创建数据的序列化版本。循环图通常需要额外的内存来确保每个边和顶点都被处理一次。什么是 IDL接口设计语言手动编写存根代码是痛苦的、乏味的、容易出错的、难以维护的难以从实现的代码中逆向工程出线协议。更好的方法是指定数据对象、消息和服务并自动生成客户端和服务器代码。接口设计语言的现代示例是 Google 的 Protocol Buffer .proto 文件。 RPC 与本地调用的复杂性和挑战远程过程调用比本地调用慢得多10 倍至 100 倍并且比本地调用更复杂。RPC 必须将数据编组成兼容的格式。这可能需要通过数据结构进行多次传递临时内存分配和数据表示的转换。健壮的 RPC 存根代码必须智能地处理网络故障和版本控制。例如服务器可能需要处理来自仍在运行早期版本存根代码的客户端的请求。安全的 RPC 将需要实施额外的安全检查包括身份验证和授权验证数据并加密客户端和主机之间的通信。传输大量结构化数据让我们通过 3 种不同的格式-JSON、XML 和 Google Protocol Buffers 来检查使用 3 种不同格式传输数据的方法。JSON 和 XML 是基于文本的协议。以下是 JSON 和 XML 消息的示例。 ticketprice currencydollar10/pricevendortravelocity/vendor/ticket{ currency:dollar , vendor:travelocity, price:10 }谷歌协议缓冲区是一个开源的高效二进制协议非常注重高吞吐量、低 CPU 开销和最小内存复制。已经为多种语言实现了协议缓冲区包括 Go、Python、C和 C。这意味着可以从.proto 规范文件生成多种语言的客户端和服务器存根代码以便将数据编组到二进制流中并从中解组。谷歌协议缓冲区通过忽略消息中存在的未知字段来减少版本问题。有关更多信息请参阅协议缓冲区的介绍。 developers.google.com/protocol-buffers/docs/overview 网络复习问题主题 IPv4 与 IPv6 TCP 与 UDP 数据包丢失/基于连接获取地址信息 DNS TCP 客户端调用 TCP 服务器调用关闭 recvfrom epoll 与 select RPC 问题什么是 IPv4IPv6它们之间有什么区别 TCP 是什么UDP 是什么给我它们的优缺点。我什么时候会使用其中一个而不是另一个哪种协议是无连接的哪种是基于连接的什么是 DNSDNS 的路由是什么套接字的作用是什么建立 TCP 客户端的调用是什么建立 TCP 服务器的调用是什么套接字关闭和关闭之间有什么区别何时可以使用read和writerecvfrom和sendto呢 epoll相对于select有哪些优势select相对于epoll有哪些优势什么是远程过程调用何时应该使用它什么是编组/解组为什么 HTTP 不是 RPC 九、文件系统文件系统第一部分介绍导航/术语设计一个文件系统你的设计目标是什么文件系统的设计是一个困难的问题因为有许多我们想要满足的高级设计目标。一个不完整的理想目标清单包括可靠和健壮即使有硬件故障或由于断电而导致不完整的写入访问安全控制会计和配额索引和搜索版本控制和备份功能加密自动压缩高性能例如内存中的缓存高效使用存储去重并非所有文件系统都原生支持所有这些目标。例如许多文件系统不会自动压缩很少使用的文件 .、..和...是什么在标准的 Unix 文件系统中 .表示当前目录 ..表示父目录 ...不是任何目录的有效表示这不是爷爷文件夹。它可能是磁盘上的一个文件的名称。绝对路径和相对路径是什么绝对路径是从您的目录树的’根节点’开始的路径。相对路径是从树中的当前位置开始的路径。相对路径和绝对路径的一些例子是什么如果您从您的主目录开始简称“~”那么Desktop/cs241将是一个相对路径。它的绝对路径对应物可能是类似于/Users/[yourname]/Desktop/cs241的东西。如何简化a/b/../c/./ 记住..表示’父文件夹’.表示’当前文件夹’。例如a/b/../c/. 步骤 1cd a在 a 中步骤 2cd b在 a/b 中步骤 3cd ..在 a 中因为…表示’父文件夹’ 步骤 4cd c在 a/c 中步骤 5cd .在 a/c 中因为.表示’当前文件夹’ 因此这条路径可以简化为a/c。那么什么是文件系统文件系统是如何在磁盘上组织信息的。每当您想要访问一个文件时文件系统规定了文件的读取方式。这是一个文件系统的示例图像。哇这太多了让我们分解一下超级块这个块包含关于文件系统的元数据大小、最后修改时间、日志、索引节点数和第一个索引节点的起始位置、数据块数和第一个数据块的起始位置。索引节点这是关键的抽象。索引节点是一个文件。磁盘块这是数据存储的地方。文件的实际内容索引节点如何存储文件内容来自Wikipedia 在类 Unix 风格的文件系统中索引节点非正式地称为 inode是用来表示文件系统对象的数据结构可以是各种东西包括文件或目录。每个 inode 存储文件系统对象数据的属性和磁盘块位置。文件系统对象属性可能包括操作元数据例如更改、访问、修改时间以及所有者和权限数据例如组 ID、用户 ID、权限。要读取文件的前几个字节跟随第一个间接块指针到第一个间接块并读取前几个字节写入是相同的过程。如果要读取整个文件继续读取直接块直到大小用完我们稍后会讨论间接块 “计算机科学中的所有问题都可以通过另一层间接性来解决。”- David Wheeler 为什么要使磁盘块的大小与内存页面相同支持虚拟内存这样我们就可以将东西分页到内存中和从内存中分页出来。我们想要为每个文件存储什么信息文件名文件大小创建时间、最后修改时间、最后访问时间权限文件路径校验和文件数据索引节点文件的传统权限是什么用户-组-其他权限一些常见的文件权限包括 755rwx r-x r-x 用户rwx组r-x其他人r-x 用户可以读取、写入和执行。组和其他人只能读取和执行。 644rw- r-- r-- 用户rw-组r--其他人r-- 用户可以读写。组和其他人只能读。对于每个角色的常规文件有 3 个权限位是什么读最高有效位写第二位执行最低有效位 “644”“755”是什么意思这些是八进制格式基数 8的权限示例。每个八进制数字对应不同的角色用户、组、全局。我们可以按照八进制格式读取权限如下 644 - 用户权限为 R/W组权限为 R全局权限为 R 755 - 用户权限为 R/W/X组权限为 R/X全局权限为 R/X 每个间接表可以存储多少个指针举个例子假设我们将磁盘分成 4KB 块并且我们想要寻址多达 2^32 块。最大磁盘大小为 4KB * 2^32 16TB记住 2^10 1024 一个磁盘块可以存储 4KB / 4B每个指针需要 32 位 1024 个指针。每个指针指向一个 4KB 的磁盘块 - 因此您可以引用多达 1024 * 4KB 4MB 的数据对于相同的磁盘配置双间接块存储 1024 个指针指向 1024 个间接表。因此双间接块可以引用多达 1024 * 4MB 4GB 的数据。同样三重间接块可以引用多达 4TB 的数据。转到文件系统第二部分文件系统第二部分文件是索引节点其他一切都只是数据… 大意忘记文件名索引节点’就是文件。通常认为文件名是’实际’文件。不是相反将索引节点视为文件。索引节点包含元信息最后访问、所有权、大小并指向用于保存文件内容的磁盘块。那么…我们如何实现一个目录目录只是名称到索引节点号的映射。POSIX 提供了一小组函数来读取每个条目的文件名和索引节点号见下文让我们想想它在实际文件系统中是什么样子。理论上目录就像实际文件一样。磁盘块将包含目录条目或dirent。这意味着我们的磁盘块可以看起来像这样索引节点号名称2043567hi.txt … 每个目录条目可以是固定大小也可以是可变的 C 字符串。这取决于特定文件系统在较低级别实现的方式。我如何找到文件的索引节点号从 shell 中使用带有-i选项的ls $ ls -i 12983989 dirlist.c 12984068 sandwich.c 从 C 中调用 stat 函数之一下面介绍。我如何找出文件或目录的元信息使用 stat 调用。例如要找出我的’notes.txt’文件上次访问的时间 - struct stat s;stat(notes.txt, s);printf(Last accessed %s, ctime(s.st_atime));实际上有三个版本的stat int stat(const char *path, struct stat *buf);int fstat(int fd, struct stat *buf);int lstat(const char *path, struct stat *buf);例如您可以使用fstat来查找与该文件关联的文件描述符的文件的元信息 FILE *file fopen(notes.txt, r);int fd fileno(file); /* Just for fun - extract the file descriptor from a C FILE struct */struct stat s;fstat(fd, s);printf(Last accessed %s, ctime(s.st_atime));第三个调用’lstat’我们将在介绍符号链接时讨论。除了访问、创建和修改时间之外stat 结构还包括索引节点号、文件长度和所有者信息。 struct stat {dev_t st_dev; /* ID of device containing file */ino_t st_ino; /* inode number */mode_t st_mode; /* protection */nlink_t st_nlink; /* number of hard links */uid_t st_uid; /* user ID of owner */gid_t st_gid; /* group ID of owner */dev_t st_rdev; /* device ID (if special file) */off_t st_size; /* total size, in bytes */blksize_t st_blksize; /* blocksize for file system I/O */blkcnt_t st_blocks; /* number of 512B blocks allocated */time_t st_atime; /* time of last access */time_t st_mtime; /* time of last modification */time_t st_ctime; /* time of last status change */};我如何列出目录的内容让我们编写我们自己的’version of ls’来列出目录的内容。 #include stdio.h #include dirent.h #include stdlib.h int main(int argc, char **argv) {if(argc 1) {printf(Usage: %s [directory]\n, *argv);exit(0);}struct dirent *dp;DIR *dirp opendir(argv[1]);while ((dp readdir(dirp)) ! NULL) {puts(dp-d_name);}closedir(dirp);return 0; }我如何读取目录的内容答使用 opendir readdir closedir 例如这是一个非常简单的’ls’实现用于列出目录的内容。 #include stdio.h #include dirent.h #include stdlib.h int main(int argc, char **argv) {if(argc 1) {printf(Usage: %s [directory]\n, *argv);exit(0);}struct dirent *dp;DIR *dirp opendir(argv[1]);while ((dp readdir(dirp)) ! NULL) {printf(%s %lu\n, dp- d_name, (unsigned long)dp- d_ino );}closedir(dirp);return 0; }注意在调用 fork()后父进程或子进程可以使用 readdir()、rewinddir()或 seekdir()。如果父进程和子进程都使用上述方法行为是未定义的。我如何检查文件是否在当前目录中例如要查看特定目录是否包含文件或文件名‘名称’我们可以编写以下代码。提示你能发现错误吗 int exists(char *directory, char *name) {struct dirent *dp;DIR *dirp opendir(directory);while ((dp readdir(dirp)) ! NULL) {puts(dp-d_name);if (!strcmp(dp-d_name, name)) {return 1; /* Found */}}closedir(dirp);return 0; /* Not Found */ }上面的代码有一个微妙的错误它泄漏资源如果找到匹配的文件名那么’closedir’将不会作为早期返回的一部分调用。opendir 打开的任何文件描述符和分配的任何内存都不会被释放。这意味着最终进程将耗尽资源并且open或opendir调用将失败。修复的方法是确保我们在每个可能的代码路径中释放资源。在上面的代码中这意味着在return 1之前调用closedir。忘记释放资源是一个常见的 C 编程错误因为 C 语言中没有支持确保所有代码路径都始终释放资源。使用 readdir 的陷阱是什么例如递归搜索目录有两个主要的陷阱和一个考虑readdir函数返回“.”当前目录和“…”父目录。如果要查找子目录需要明确排除这些目录。对于许多应用程序来说首先检查当前目录然后递归搜索子目录是合理的。这可以通过将结果存储在链接列表中来实现或者重置目录结构以从头开始重新开始。最后要注意的一点readdir不是线程安全的对于多线程搜索请使用readdir_r它要求调用者传递现有 dirent 结构的地址。有关 readdir 的更多详细信息请参阅 readdir 的 man 页面。我如何确定目录条目是否是目录答使用S_ISDIR来检查 stat 结构中存储的模式位要检查文件是否为常规文件请使用S_ISREG struct stat s;if (0 stat(name, s)) {printf(%s , name);if (S_ISDIR( s.st_mode)) puts(is a directory);if (S_ISREG( s.st_mode)) puts(is a regular file);} else {perror(stat failed - are you sure I can read this files meta data?);}目录也有 inode 吗是的虽然更好的想法是一个目录就像一个文件是一个 inode带有一些数据-目录名称和 inode 内容。它碰巧是一种特殊类型的 inode。来自Wikipedia Unix 目录是关联结构的列表每个结构包含一个文件名和一个 inode 号。请记住inode 不包含文件名-只包含其他文件元数据。如何让相同的文件出现在文件系统中的两个不同位置首先要记住文件名文件。将 inode 视为’文件’目录只是一个名称列表每个名称都映射到一个 inode 号。其中一些 inode 可能是常规文件 inode其他可能是目录 inode。如果我们已经在文件系统上有一个文件我们可以使用’ln’命令创建到相同 inode 的另一个链接 $ ln file1.txt blip.txt 然而blip.txt 是相同的文件如果我编辑 blip我正在编辑与’file1.txt!相同的文件我们可以通过显示两个文件名指向相同的 inode 来证明这一点 $ ls -i file1.txt blip.txt 134235 file1.txt 134235 blip.txt 这些链接也称为目录条目称为’硬链接’ 等效的 C 调用是link link(const char *path1, const char *path2);link(file1.txt, blip.txt);为了简单起见上面的例子在同一个目录中创建了硬链接但是硬链接可以在同一个文件系统的任何地方创建。当我rm删除一个文件时会发生什么当您删除文件使用rm或unlink时您正在从目录中删除一个 inode 引用。但是 inode 可能仍然被其他目录引用。为了确定文件的内容是否仍然需要每个 inode 都保留一个引用计数每当创建或销毁新链接时该引用计数都会更新。案例研究最小化文件重复的备份软件硬链接的一个示例用途是有效地在不同时间点创建文件系统的多个存档。一旦存档区域有特定文件的副本未来的存档可以重用这些存档文件而不是创建重复的文件。苹果的“Time Machine”软件就是这样做的。我可以像常规文件一样创建目录的硬链接吗不。好吧是的。不是真的…实际上你并不真的想这样做是吗POSIX 标准说不你不可以ln命令只允许 root 执行此操作只有在提供-d选项时才能执行此操作。但是即使 root 也可能无法执行此操作因为大多数文件系统会阻止它为什么文件系统的完整性假设目录结构不包括我们稍后将讨论的软链接是从根目录可达的非循环树。如果允许目录链接强制执行或验证此约束将变得昂贵。打破这些假设可能导致文件完整性工具无法修复文件系统。递归搜索可能永远不会终止目录可能有多个父目录但“…”只能指向一个父目录。总的来说这是一个坏主意。文件系统第三部分权限提醒我权限再次是什么意思每个文件和目录都有一组 9 个权限位和一个类型字段 r读取文件的权限 w写入文件的权限 x执行文件的权限 chmod 777 chmod77701111111111drwxrwxrwx1234 文件类型所有者权限组权限其他人的权限 mknod更改第一个字段文件的类型。chmod接受一个数字和一个文件并更改权限位。文件有一个所有者。如果您的进程具有与所有者相同的用户 ID或 root则第一个三元组中的权限适用于您。如果您与文件在同一组中所有文件也属于一个组则下一组权限位适用于您。如果以上都不适用则最后一个三元组适用于您。如何更改文件的权限使用chmod简称“更改文件模式位” 有一个系统调用int chmod(const char *path, mode_t mode);但我们将集中在 shell 命令上。使用chmod的两种常见方法是使用八进制值或使用符号字符串 $ chmod 644 file1 $ chmod 755 file2 $ chmod 700 file3 $ chmod ugo-w file4 $ chmod o-rx file4 基于 8‘八进制’位数字描述了每个角色的权限拥有文件的用户组和其他人。八进制数是给三种权限的三个值的总和读取4写入2执行1 示例chmod 755 myfile r w x 数字用户具有 421完全权限组具有 401读取和执行权限所有用户都有 401读取和执行权限如何从 ls 中读取权限字符串使用ls -l’。请注意权限将以’drwxrwxrwx’格式输出。第一个字符表示文件类型。第一个字符的可能值 -常规文件 d目录 c字符设备文件\ l符号链接 p管道 b块设备 s套接字什么是 sudo 使用sudo成为机器上的管理员。例如通常除非在’/etc/fstab’文件中明确指定您需要 root 访问权限才能挂载文件系统。sudo可用于临时以 root 身份运行命令前提是用户具有 sudo 权限 $ sudo mount /dev/sda2 /stuff/mydisk $ sudo adduser fred 如何更改文件的所有权使用chown 用户名文件名如何从代码中设置权限 chmod(const char *path, mode_t mode); 为什么有些文件是’setuid’这是什么意思在运行文件时设置用户 ID 的位会更改与进程关联的用户。这通常用于需要以 root 身份运行但由非 root 用户执行的命令。一个例子是sudo 在执行时设置组 ID 会更改进程所在的组。它们为什么有用最常见的用例是用户可以在程序运行期间具有 root管理员访问权限。 sudo 以什么权限运行 $ ls -l /usr/bin/sudo -r-s--x--x 1 root wheel 327920 Oct 24 09:04 /usr/bin/sudo s’位表示执行和设置 uid进程的有效用户 ID 将与父进程不同。在这个例子中它将是 root getuid和 geteuid之间有什么区别 getuid返回真实用户 ID如果以 root 身份登录则为零 geteuid返回有效用户 ID如果作为 root 运行例如由于程序上设置了 setuid 标志则为零如何确保只有特权用户可以运行我的代码通过调用geteuid()来检查用户的有效权限。返回值为零表示程序有效地作为 root 运行。转到文件系统第四部分文件系统第四部分使用目录如何找出文件inode是常规文件还是目录使用S_ISDIR宏来检查 stat 结构中的模式位 struct stat s; stat(/tmp, s); if (S_ISDIR(s.st_mode)) { ... 请注意稍后我们将编写健壮的代码来验证 stat 调用是否成功返回 0如果“stat”调用失败我们应该假设 stat 结构内容是任意的。我如何递归进入子目录首先是一个谜题-在以下代码中你能找到多少个错误 void dirlist(char *path) {struct dirent *dp;DIR *dirp opendir(path);while ((dp readdir(dirp)) ! NULL) {char newpath[strlen(path) strlen(dp-d_name) 1];sprintf(newpath,%s/%s, newpath, dp-d_name);printf(%s\n, dp-d_name);dirlist(newpath);} }int main(int argc, char **argv) { dirlist(argv[1]); return 0; }你找到了所有 5 个错误吗 // Check opendir result (perhaps user gave us a path that can not be opened as a directory if (!dirp) { perror(Could not open directory); return; } // 2 as we need space for the / and the terminating 0 char newpath[strlen(path) strlen(dp-d_name) 2]; // Correct parameter sprintf(newpath,%s/%s, path, dp-d_name); // Perform stat test (and verify) before recursing if (0 stat(newpath,s) S_ISDIR(s.st_mode)) dirlist(newpath) // Resource leak: the directory file handle is not closed after the while loop closedir(dirp);什么是符号链接它们是如何工作的我怎么做一个 symlink(const char *target, const char *symlink);要在 shell 中创建符号链接请使用ln -s 要将链接的内容读取为文件请使用“readlink” $ readlink myfile.txt ../../dir1/notes.txt 要读取符号链接的元stat信息请使用“lstat”而不是“stat” struct stat s1, s2; stat(myfile.txt, s1); // stat info about the notes.txt file lstat(myfile.txt, s2); // stat info about the symbolic link符号链接的优点可以引用尚不存在的文件与硬链接不同可以引用目录以及常规文件可以引用存在于当前文件系统之外的文件和目录主要缺点比常规文件和目录慢。当读取链接的内容时它们必须被解释为目标文件的新路径。 “/dev/null”是什么何时使用文件“/dev/null”是存储您永远不需要读取的位的好地方发送到“/dev/null/”的字节永远不会被存储-它们只是被丢弃。 “/dev/null”的常见用途是丢弃标准输出。例如 $ ls . /dev/null 为什么我想设置目录的粘性位当目录的粘性位被设置时只有文件的所有者、目录的所有者和 root 用户才能重命名或删除该文件。当多个用户对共享目录具有写访问权限时这是有用的。粘性位的常见用途是用于共享和可写的“/tmp”目录。为什么 shell 和脚本程序以“#!/usr/bin/env python”开头答为了可移植性虽然可能会将完全合格的路径写入 python 或 perl 解释器但这种方法不是可移植的因为您可能已将 python 安装在不同的目录中。要克服这一点使用“env”实用程序来查找并执行用户路径上的程序。env 实用程序本身通常存储在“/usr/bin”中-必须使用绝对路径指定。如何制作“隐藏”文件即不被“ls”列出我如何列出它们简单创建以“.”开头的文件或目录-然后默认情况下它们不会被标准工具和实用程序显示。这通常用于将配置文件隐藏在用户的主目录中。例如“ssh”将其首选项存储在一个名为“.sshd”的目录中。要列出所有文件包括通常隐藏的条目请使用带有“-a”选项的“ls” $ ls -a . a.c myls .. a.out other.txt .secret 如果我关闭目录上的执行位会发生什么目录的执行位用于控制目录内容是否可列出。 $ chmod ugo-x dir1 $ ls -l drw-r--r-- 3 angrave staff 102 Nov 10 11:22 dir1 但是当尝试列出目录的内容时 $ ls dir1 ls: dir1: Permission denied 换句话说目录本身是可发现的但其内容无法列出。什么是文件通配由谁执行在执行程序之前shell 将参数扩展为匹配的文件名。例如如果当前目录有三个以 my 开头的文件名my1.txt mytext.txt myomy那么 $ echo my* 扩展到 $ echo my1.txt mytext.txt myomy 这被称为文件通配并在执行命令之前进行处理。即命令的参数与手动输入每个匹配的文件名相同。创建安全目录假设您在/tmp 中创建了自己的目录然后设置了权限以便只有您可以使用该目录见下文。这安全吗 $ mkdir /tmp/mystuff $ chmod 700 /tmp/mystuff 在目录创建和权限更改之间存在一个机会窗口。这导致了几个基于竞争条件的漏洞攻击者在权限被移除之前以某种方式修改目录。一些例子包括另一个用户用一个硬链接替换mystuff指向第二个用户拥有的现有文件或目录然后他们就能读取和控制mystuff目录的内容。哦不 - 我们的秘密不再是秘密了然而在这个特定的例子中/tmp目录设置了粘滞位因此其他用户可能无法删除mystuff目录上述简单的攻击场景是不可能的。这并不意味着创建目录然后稍后将目录设为私有是安全的更好的版本是从一开始就原子性地创建具有正确权限的目录 - $ mkdir -m 700 /tmp/mystuff 如何自动创建父目录 $ mkdir -p d1/d2/d3 如果它们不存在将自动创建 d1 和 d2。我的默认 umask 是 022这是什么意思 umask 减去减少权限位从 777并且在使用 open、mkdir 等创建新文件和新目录时使用。因此022八进制表示组和其他权限不包括可写位。每个进程包括 shell都有一个当前的 umask 值。在分叉时子进程继承父进程的 umask 值。例如通过在 shell 中将 umask 设置为 077可以确保将来创建的文件和目录只能被当前用户访问 $ umask 077 $ mkdir secretdir 作为一个代码示例假设使用open()创建一个新文件并且模式位是666用户、组和其他的写入和读取位 open(myfile, O_CREAT, S_IRUSR | S_IWUSR | S_IRGRP | S_IWGRP | S_IROTH | S_IWOTH);如果 umask 是八进制 022那么创建的文件的权限将是 0666 和~022即。 S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH我怎样才能从一个文件复制字节到另一个文件使用多功能的dd命令。例如以下命令将从文件/dev/urandom复制 1MB 的数据到文件/dev/null。数据被复制为 1024 个块每个块大小为 1024 字节。 $ dd if/dev/urandom of/dev/null bs1k count1024 上面示例中的输入和输出文件都是虚拟的 - 它们不存在于磁盘上。这意味着传输速度不受硬件功率的影响。相反它们是内核提供的虚拟文件系统的一部分。虚拟文件/dev/urandom提供无限的随机字节流而虚拟文件/dev/null会忽略写入它的所有字节。/dev/null的常见用途是丢弃命令的输出 $ myverboseexecutable /dev/null 另一个常用的/dev 虚拟文件是/dev/zero它提供无限的零字节流。例如我们可以对读取内核中的流零字节到进程内存并将字节写回内核而不进行任何磁盘 I/O 的操作系统性能进行基准测试。请注意吞吐量约 20GB/s强烈依赖于块大小。对于小块大小额外的read和write系统调用的开销将占主导地位。 $ dd if/dev/zero of/dev/null bs1M count1024 10240 records in 10240 records out 1073741824 bytes (1.1 GB) copied, 0.0539153 s, 19.9 GB/s 当我触摸一个文件时会发生什么 touch可执行文件如果文件不存在则创建文件并且还会更新文件的最后修改时间为当前时间。例如我们可以用当前时间创建一个新的私有文件 $ umask 077 # all future new files will maskout all r,w,x bits for group and other access $ touch file123 # create a file if it does not exist, and update its modified time $ stat file123File: file123Size: 0 Blocks: 0 IO Block: 65536 regular empty file Device: 21h/33d Inode: 226148 Links: 1 Access: (0600/-rw-------) Uid: (395606/ angrave) Gid: (61019/ ews) Access: 2014-11-12 13:42:06.000000000 -0600 Modify: 2014-11-12 13:42:06.001787000 -0600 Change: 2014-11-12 13:42:06.001787000 -0600 touch的一个示例用途是在修改 makefile 中的编译器选项后强制 make 重新编译未更改的文件。记住make 是“懒惰的” - 它将比较源文件的修改时间和相应输出文件的修改时间以确定是否需要重新编译文件。 $ touch myprogram.c # force my source file to be recompiled $ make 转到文件系统第五部分文件系统第五部分虚拟文件系统虚拟文件系统 POSIX 系统如 Linux 和基于 BSD 的 Mac OSX包括几个作为文件系统的一部分挂载可用的虚拟文件系统。这些虚拟文件系统中的文件不存在于磁盘上当进程请求目录列表时它们由内核动态生成。Linux 提供了 3 个主要的虚拟文件系统 /dev - A list of physical and virtual devices (for example network card, cdrom, random number generator) /proc - A list of resources used by each process and (by tradition) set of system information /sys - An organized list of internal kernel entities 例如如果我想要一个连续的 0 流我可以cat /dev/zero。如何找出当前有哪些文件系统可用已挂载使用mount不带任何选项地使用 mount 会生成一个列表每行一个文件系统已挂载的文件系统包括网络、虚拟和本地旋转磁盘/基于 SSD 的文件系统。以下是 mount 的典型输出 $ mount /dev/mapper/cs241--server_sys-root on / type ext4 (rw) proc on /proc type proc (rw) sysfs on /sys type sysfs (rw) devpts on /dev/pts type devpts (rw,gid5,mode620) tmpfs on /dev/shm type tmpfs (rw,rootcontextsystem_u:object_r:tmpfs_t:s0) /dev/sda1 on /boot type ext3 (rw) /dev/mapper/cs241--server_sys-srv on /srv type ext4 (rw) /dev/mapper/cs241--server_sys-tmp on /tmp type ext4 (rw) /dev/mapper/cs241--server_sys-var on /var type ext4 (rw)rw,bind) /srv/software/Mathematica-8.0 on /software/Mathematica-8.0 type none (rw,bind) engr-ews-homes.engr.illinois.edu:/fs1-homes/angrave/linux on /home/angrave type nfs (rw,soft,intr,tcp,noacl,acregmin30,vers3,secsys,sloppy,addr128.174.252.102) 请注意每行都包括文件系统类型、文件系统源和挂载点。为了减少这种输出我们可以将其导入到grep中只看到与正则表达式匹配的行。 mount | grep proc # only see lines that contain proc proc on /proc type proc (rw) none on /proc/sys/fs/binfmt_misc type binfmt_misc (rw) random 和 urandom 之间的区别 /dev/random 是一个包含数字生成器的文件其中熵是从环境噪声中确定的。随机将阻塞/等待直到从环境中收集到足够的熵。 /dev/urandom 就像 random 一样但不同之处在于它允许重复熵阈值较低因此不会阻塞。其他文件系统 $ cat /proc/sys/kernel/random/entropy_avail $ hexdump /dev/random $ hexdump /dev/urandom$ cat /proc/meminfo $ cat /proc/cpuinfo $ cat /proc/cpuinfo | grep bogomips$ cat /proc/meminfo | grep Swap$ cd /proc/self $ echo $$; cd /proc/12345; cat maps 挂载文件系统假设我有一个挂接在/dev/cdrom上的文件系统我想要从中读取。我必须在进行任何操作之前将其挂载到一个目录上。 $ sudo mount /dev/cdrom /media/cdrom $ mount $ mount | grep proc 如何挂载磁盘映像假设你下载了一个可引导的 Linux 磁盘映像… wget http://cosmos.cites.illinois.edu/pub/archlinux/iso/2015.04.01/archlinux-2015.04.01-dual.iso 在将文件系统放入 CD 之前我们可以将文件作为文件系统挂载并浏览其内容。请注意挂载需要 root 访问权限因此让我们使用 sudo 来运行它 $ mkdir arch $ sudo mount -o loop archlinux-2015.04.01-dual.iso ./arch $ cd arch 在挂载命令之前arch 目录是新的显然是空的。挂载后arch/的内容将从存储在archlinux-2014.11.01-dual.iso文件中的文件和目录中提取出来。需要loop选项因为我们想要挂载一个常规文件而不是物理磁盘这样的块设备。 loop 选项将原始文件包装为块设备-在这个例子中我们将在下面找到文件系统是在/dev/loop0下提供的我们可以通过运行不带任何参数的 mount 命令来检查文件系统类型和挂载选项。我们将将输出导入到grep中以便只看到包含’arch’的相关输出行(s) $ mount | grep arch /home/demo/archlinux-2014.11.01-dual.iso on /home/demo/arch type iso9660 (rw,loop/dev/loop0) iso9660 文件系统是最初为光学存储介质即 CDRom设计的只读文件系统。尝试更改文件系统的内容将失败 $ touch arch/nocando touch: cannot touch /home/demo/arch/nocando: Read-only file system 转到文件系统第六部分文件系统第六部分内存映射文件和共享内存操作系统如何将我的进程和库加载到内存中通过将文件的内容映射到进程的地址空间。如果许多程序只需要对同一个文件进行读取访问例如/bin/bashC 库那么相同的物理内存可以在多个进程之间共享。相同的机制可以被程序用来直接将文件映射到内存如何将文件映射到内存下面显示了一个将文件映射到内存的简单程序。需要注意的关键点是 mmap 需要一个文件描述符所以我们需要先打开文件我们寻找我们想要的大小并写入一个字节以确保文件足够长完成后调用 munmap 将文件从内存中取消映射。这个例子还显示了预处理器常量“LINE”和“FILE”它们保存了当前正在编译的文件的行号和文件名。 #include stdio.h #include stdlib.h #include sys/types.h #include sys/stat.h #include sys/mman.h #include fcntl.h #include unistd.h #include errno.h #include string.hint fail(char *filename, int linenumber) { fprintf(stderr, %s:%d %s\n, filename, linenumber, strerror(errno)); exit(1);return 0; /*Make compiler happy */ } #define QUIT fail(__FILE__, __LINE__ )int main() {// We want a file big enough to hold 10 integers int size sizeof(int) * 10;int fd open(data, O_RDWR | O_CREAT | O_TRUNC, 0600); //6 readwrite for me!lseek(fd, size, SEEK_SET);write(fd, A, 1);void *addr mmap(0, size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);printf(Mapped at %p\n, addr);if (addr (void*) -1 ) QUIT;int *array addr;array[0] 0x12345678;array[1] 0xdeadc0de;munmap(addr,size);return 0;}我们的二进制文件的内容可以使用 hexdump 列出 $ hexdump data 0000000 78 56 34 12 de c0 ad de 00 00 00 00 00 00 00 00 0000010 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 0000020 00 00 00 00 00 00 00 00 41 细心的读者可能会注意到我们的整数是以最低有效字节格式写入的因为这是 CPU 的字节序而且我们分配了一个多出一个字节的文件 PROT_READ | PROT_WRITE选项指定了虚拟内存保护。选项PROT_EXEC这里没有使用可以设置为允许 CPU 在内存中执行指令例如如果您映射了一个可执行文件或库这将非常有用。内存映射文件的优势是什么对于许多应用程序主要优势是简化编码-文件数据立即可用。无需解析传入数据并将其存储在新的内存结构中。文件共享-内存映射文件在多个进程之间共享相同数据时特别高效。对于简单的顺序处理内存映射文件不一定比标准的“基于流”的read / fscanf 等方法更快。如何在父进程和子进程之间共享内存简单-使用mmap而不是文件-只需指定 MAP_ANONYMOUS 和 MAP_SHARED 选项 #include stdio.h #include stdlib.h #include sys/types.h #include sys/stat.h #include sys/mman.h /* mmap() is defined in this header */ #include fcntl.h #include unistd.h #include errno.h #include string.hint main() {int size 100 * sizeof(int); void *addr mmap(0, size, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0);printf(Mapped at %p\n, addr);int *shared addr;pid_t mychild fork();if (mychild 0) {shared[0] 10;shared[1] 20;} else {sleep(1); // We will talk about synchronization laterprintf(%d\n, shared[1] shared[0]);}munmap(addr,size);return 0; }我可以使用共享内存进行 IPC 吗是的作为一个简单的例子你可以只保留几个字节并在想要子进程退出时更改共享内存中的值。共享内存是一种非常高效的进程间通信形式因为没有复制开销-这两个进程实际上共享相同的物理内存帧。转到文件系统第七部分文件系统第七部分可扩展和可靠的文件系统可靠的单磁盘文件系统内核如何以及为什么缓存文件系统大多数文件系统在物理内存中缓存大量磁盘数据。在这方面Linux 特别极端所有未使用的内存都被用作巨大的磁盘缓存。磁盘缓存可能会对整个系统性能产生重大影响因为磁盘 I/O 速度很慢。这对于旋转磁盘上的随机访问请求尤其如此其中磁盘读写延迟由移动读写磁盘头到正确位置所需的寻道时间主导。为了提高效率内核会缓存最近使用的磁盘块。对于写入我们必须在性能和可靠性之间进行权衡磁盘写入也可以被缓存“写回缓存”其中修改后的磁盘块存储在内存中直到被驱逐。或者可以采用“写穿缓存”策略其中磁盘写入立即发送到磁盘。后者比写回缓存更安全因为文件系统修改会快速存储到持久介质但比写回缓存慢如果写入被缓存那么它们可以被延迟并且可以根据每个磁盘块的物理位置进行高效调度。请注意这是一个简化的描述因为固态硬盘SSD可以用作辅助写回缓存。无论是固态硬盘SSD还是旋转硬盘在读取或写入顺序数据时都具有改进的性能。因此操作系统通常可以使用预读策略来分摊读取请求成本例如旋转硬盘的时间成本并请求每个请求的几个连续磁盘块。通过在用户应用程序需要下一个磁盘块之前发出下一个磁盘块的 I/O 请求可以减少表面磁盘 I/O 延迟。我的数据很重要我可以强制磁盘写入保存到物理介质并等待完成吗是的几乎。调用sync请求将文件系统更改写入刷新到磁盘。但并非所有操作系统都会遵守此请求即使数据已从内核缓冲区中驱逐磁盘固件也会使用内部磁盘缓存或者可能尚未完成更改物理介质。注意您还可以使用fsyncint fd请求将与特定文件描述符相关的所有更改刷新到磁盘。如果我的磁盘在重要操作中失败怎么办别担心大多数现代文件系统都有一种称为日志的东西来解决这个问题。文件系统在完成潜在昂贵的操作之前会将其要做的事情写在日志中。在崩溃或故障的情况下可以逐步查看日志并查看哪些文件损坏并修复它们。这是一种在关键数据存在且没有明显备份的情况下挽救硬盘的方法。磁盘故障的可能性有多大磁盘故障是用“平均故障时间”来衡量的。对于大型数组平均故障时间可能会非常短。例如如果 MTTF单个磁盘 30,000 小时则 MTTF100 个磁盘 30000/100 300 小时即约 12 天冗余如何保护我的数据免受磁盘故障很简单数据存储两次这是“RAID-1”磁盘阵列的主要原则。RAID 是廉价磁盘冗余阵列的缩写。通过将写入复制到一个磁盘并将写入复制到另一个磁盘备份磁盘数据恰好有两份副本。如果一个磁盘故障另一个磁盘将作为唯一副本直到可以重新克隆。读取数据更快因为数据可以从任一磁盘请求但写入可能会慢两倍现在每个磁盘块写入需要发出两个写命令并且与使用单个磁盘相比每字节存储成本翻了一番。另一个常见的 RAID 方案是 RAID-0意味着文件可以分割在两个磁盘中但如果任何一个磁盘故障那么文件将无法恢复。这样做的好处是可以将写入时间减半因为文件的一部分可以写入硬盘一另一部分可以写入硬盘二。还常常将这些系统结合在一起。如果你有很多硬盘考虑 RAID-10。这是指有两个 RAID-1 系统但这些系统在彼此之间以 RAID-0 连接。这意味着你可以从减速中获得大致相同的速度但现在任何一个磁盘都可以故障你可以恢复该磁盘。如果来自相对 RAID 分区的两个磁盘故障有可能进行恢复尽管我们大多数时候不依赖它。 RAID-3 是什么 RAID-3 使用奇偶校验码而不是镜像数据。对于每 N 位写入我们将写入一个额外的位即“奇偶校验位”以确保写入的 1 的总数是偶数。奇偶校验位被写入到额外的磁盘上。如果任何一个磁盘包括奇偶校验磁盘丢失那么它的内容仍然可以使用其他磁盘的内容计算出来。 RAID-3 的一个缺点是每当写入一个磁盘块时奇偶校验块也总是会被写入。这意味着实际上有一个单独的磁盘瓶颈。实际上这更有可能导致故障因为一个磁盘被 100%使用一旦该磁盘故障其他磁盘更容易发生故障。 RAID-3 对数据丢失有多安全单个磁盘故障不会导致数据丢失因为有足够的数据可以从剩余的磁盘重建阵列。当两个磁盘不可用时由于不再有足够的数据来重建阵列数据丢失将发生。我们可以根据修复时间计算两个磁盘故障的概率这不仅包括插入新磁盘的时间还包括重建整个阵列内容所需的时间。 MTTF mean time to failure MTTR mean time to repair N number of original disksp MTTR / (MTTF-one-disk / (N-1)) 使用典型数字MTTR1 天MTTF1000 天N-19p0.009 在重建过程中另一块驱动器出现故障的概率为 1%在这一点上你最好希望你仍然有原始数据的可访问备份。在实践中修复过程中第二次故障的概率可能更高因为重建阵列是 I/O 密集型的并且在正常 I/O 请求活动之上。这种更高的 I/O 负载也会对磁盘阵列造成压力 RAID-5 是什么 RAID-5 类似于 RAID-3只是检查块奇偶校验信息分配给不同的磁盘用于不同的块。检查块在磁盘阵列中“旋转”。RAID-5 提供比 RAID-3 更好的读写性能因为不再有单个奇偶校验磁盘的瓶颈。唯一的缺点是你需要更多的磁盘来设置这个并且需要使用更复杂的算法。分布式存储故障是常见情况谷歌报告称每年有 2-10%的磁盘故障现在将这个数字乘以单个仓库中的 60,000 多个磁盘…必须经受住不仅是磁盘的故障还有服务器机架或整个数据中心的故障解决方案简单冗余每个文件有 2 或 3 个副本例如谷歌 GFS2001 年更有效的冗余类似于 RAID 3例如Google Colossus 文件系统约 2010 年可定制的复制包括带有 1.5 倍冗余的 Reed-Solomon 编码文件系统第八部分从安卓设备中删除预装的恶意软件案例研究从安卓设备中删除恶意软件本节利用本 wikibook 中讨论的文件系统特性和系统编程工具来查找并删除安卓平板电脑中的不需要的恶意软件。免责声明。在尝试修改您的平板电脑之前请确保备份设备上的任何有价值的信息。不建议修改系统设置和系统文件。尝试使用本案例研究指南修改设备可能导致您的平板电脑共享、丢失或损坏数据。此外您的平板电脑可能会出现功能异常或完全停止工作。请自行承担使用本案例研究的风险。作者对这些指南中包含的指令的正确性或完整性不承担任何责任并不提供任何保证。作者对本指南中描述或链接的任何软件包括外部第三方软件不承担任何责任并不提供任何保证。背景从亚马逊购买的 E97 安卓平板电脑出现了一些奇怪的毛病。最明显的是浏览器应用程序总是在 gotoamazing.com 打开一个网站而不是在应用程序的首选项中设置的主页称为浏览器“劫持”。我们能否利用这本 wikibook 中的知识来理解这种不需要的行为是如何发生的还能从设备中删除不需要的预装应用程序使用的工具虽然可能可以使用远程连接的 USB 设备上安装的安卓开发工具但本指南仅使用平板电脑上的系统工具。安装了以下应用程序 - Malwarebytes - 一个免费的漏洞和恶意软件工具。终端模拟器 - 一个简单的终端窗口让我们在平板电脑上获得 shell 访问权限。 KingRoot - 一个利用 Linux 内核中已知漏洞获取 root 权限的工具。安装任何应用都可能允许任意代码执行如果它能够突破安卓安全模型。在上面提到的应用中KingRoot 是最极端的例子因为它利用系统漏洞来获取我们的目的的 root 权限。然而在这样做的同时它也可能是最有问题的工具之一我们要相信它不会安装任何自己的恶意软件。一个潜在更安全的选择是使用github.com/android-rooting-tools/ 终端概述最有用的命令是su grep mount和安卓的包管理器工具pm。 grep -s abc * /在当前目录和直接子目录中搜索abc su又名“切换用户”成为 root - 需要一个已 root 的设备 mount -o rw,remount /system允许/system 分区可写 pm disable又名“包管理器”禁用安卓应用程序包文件系统布局概述在运行安卓 4.4.2 的这个特定平板电脑上预装的应用程序是不可修改的并且位于 /system/app/ /system/priv-app/ 偏好设置和应用数据存储在/data分区中。每个应用程序通常打包在一个 apk 文件中这本质上是一个 zip 文件。当应用程序安装时代码会被扩展成一个可以被安卓虚拟机直接解析的文件。二进制代码至少对于这个特定的虚拟机具有 odex 扩展名。我们可以搜索已安装的系统应用程序的代码查找字符串’gotoamazing’ grep -s gotoamazing /system/app/* /system/priv-app/* 这没有找到任何东西看来这个字符串没有硬编码到给定系统应用程序的源代码中。为了验证我们是否能找到让我们检查所有已安装应用的数据区域 cd /data/data grep -s gotoamazing * */* */*/* 产生了以下结果 data/com.android.browser/shared_prefs/xbservice.xml: string nameURLhttp://www.gotoamazing... -s 选项“静默选项”可以阻止 grep 抱怨尝试 grep 目录和其他无效文件。请注意我们也可以使用-r 来递归搜索目录但使用文件通配符shell 的*通配符扩展很有趣。现在我们有了进展看起来这个字符串是’app’com.android.browser’的一部分但让我们也找出哪个应用程序二进制代码打开了’xbservice’首选项。也许这个不受欢迎的服务隐藏在另一个应用程序中并且成功地作为浏览器的扩展秘密加载让我们寻找包含 xbservice 的任何文件。这次我们将在包括’app’的/system 目录中递归搜索 grep -r -s xbservice /system/*app* Binary file /system/app/Browser.odex matches 最后 - 看起来出厂浏览器已经预装了主页劫持。让我们卸载它。为此让我们成为 root。 $ su pm list packages -s Android 的包管理器有许多命令和选项。上面的例子列出了当前安装的所有系统应用程序。我们可以使用以下命令卸载浏览器应用程序 pm disable com.android.browser pm uninstall com.android.browser 使用pm list packages可以列出所有安装的软件包使用-s选项只查看系统软件包。我们禁用了以下系统应用程序。当然我们无法保证我们成功删除了所有不需要的软件或者其中一个是误报。因此我们不建议在这样的平板电脑上存储敏感信息。 com.android.browser com.adups.fota.sysoper elink.com com.google.android.apps.cloudprint com.mediatek.CrashService com.get.googleApps com.adups.fota可以在将来安装任意项目的远程包。 com.mediatek.appguide.plugin 很可能你可以使用pm enable package-name或pm install和/system/app 或/system/priv-app 中的相关.apk 文件来重新启用软件包。文件系统第九部分磁盘块示例正在建设中请问您能解释一下基于简单 i-node 的文件系统中文件内容是如何存储的吗当然为了回答这个问题我们将构建一个虚拟磁盘然后编写一些 C 代码来访问其内容。我们的文件系统将把可用的字节划分为 inode 的空间和一个更大的磁盘块空间。每个磁盘块将是 4096 字节- // Disk size: #define MAX_INODE (1024) #define MAX_BLOCK (1024*1024)// Each block is 4096 bytes: typedef char[4096] block_t;// A disk is an array of inodes and an array of disk blocks: struct inode[MAX_INODE] inodes; block[MAX_BLOCK] blocks;为了清晰起见我们在这个代码示例中不会使用’unsigned’。我们的固定大小的 inode 将包含文件的字节大小权限用户组信息时间元数据。对于手头的问题最相关的是它还将包括十个指向磁盘块的指针我们将用它们来引用实际文件的内容 struct inode {int[10] directblocks; // indices for the block array i.e. where to the find the files contentlong size;// ... standard inode meta-data e.g.int mode, userid,groupid;time_t ctime,atime,mtime; }现在我们可以解决如何读取文件偏移量position处的一个字节 char readbyte(inode*inode,long position) {if(position 0 || position inode-size) return -1; // invalid offsetint block_count position / 4096,offset position % 4096;// block count better be 0..9 !int physical_idx lookup_physical_block_index(inode, block_count );// sanity check that the disk block index is reasonable...assert(physical_idx 0 physical_idx MAX_BLOCK);// read the disk block from our virtual disk blocks and return the specific bytereturn blocks[physical_idx][offset]; }我们的 lookup_physical_block 的初始版本很简单-我们可以使用我们的 10 个直接块的表 int lookup_physical_block_index(inode*inode, int block_count) {assert(block_count0 block_count 10);return inode-directblocks[ block_count ]; // returns an index value between [0,MAX_BLOCK) }这种简单的表示是合理的只要我们可以用十个块来表示所有可能的文件即最多 40KB。那么更大的文件呢我们需要 inode 结构始终保持相同的大小因此只是将现有的直接块数组增加到 20 个大致会使我们的 inode 大小翻倍。如果我们大多数的文件需要少于 10 个块那么我们的 inode 存储现在就是浪费的。为了解决这个问题我们将使用一个称为间接块的磁盘块来扩展我们可以使用的指针数组。我们只需要这个来处理大于 40KB 的文件。 struct inode {int[10] directblocks; // if size4KB then only the first one is validint indirectblock; // valid value when size 40KBint size;... }间接块只是一个普通的磁盘块但我们将用它来保存指向磁盘块的指针。在这种情况下我们的指针只是整数因此我们需要将指针转换为整数指针 int lookup_physical_block_index(inode*inode, int block_count) {assert(sizeof(int)4); // Warning this code assumes an index is 4 bytes!assert(block_count0 block_count 1024 10); // 0 block_count 1034if( block_count 10)return inode-directblocks[ block_count ];// read the indirect block from disk:block_t* oneblock blocks[ inode-indirectblock ];// Treat the 4KB as an array of 1024 pointers to other disk blocksint* table (int*) oneblock;// Look up the correct entry in the table// Offset by 10 because the first 10 blocks of data are already // accounted forreturn table[ block_count - 10 ]; }对于典型的文件系统我们的索引值是 32 位即 4 字节。因此在 4096 字节中我们可以存储 4096 / 4 1024 个条目。这意味着我们的间接块可以引用 1024 * 4KB 4MB 的数据。通过前面的十个直接块因此我们可以容纳文件大小达到 40KB 1024 * 4KB 4136KB。对于小于这个大小的文件一些后面的表条目可能无效。对于更大的文件我们可以使用两个间接块。然而有一个更好的选择可以让我们有效地扩展到大文件。我们将包括一个双间接指针如果这还不够还有一个三重间接指针。双间接指针意味着我们有一个包含用作 1024 个条目的磁盘块的 1024 个条目的表。这意味着我们可以引用 1024*1024 个数据块。 (来源uw714doc.sco.com/en/FS_admin/graphics/s5chain.gif) int lookup_physical_block_index(inode*inode, int block_count) {if( block_count 10)return inode-directblocks[ block_count ];// Use indirect block for the next 1024 blocks:// Assumes 1024 ints can fit inside each block!if( block_count 1024 10) { int* table (int*) blocks[ inode-indirectblock ];return table[ block_count - 10 ];}// For huge files we will use a table of tablesint i (block_count - 1034) / 1024 , j (block_count - 1034) % 1024;assert(i1024); // triple-indirect is not implemented here!int* table1 (int*) blocks[ inode-doubleindirectblock ];// The first table tells us where to read the second table ...int* table2 (int*) blocks[ table1[i] ];return table2[j];// For gigantic files we will need to implement triple-indirect (table of tables of tables) }请注意使用双间接读取一个字节需要 3 次磁盘块读取两个表和实际数据块。文件系统复习问题主题超级块数据块索引节点相对路径文件元数据硬链接和软链接权限位与目录一起工作虚拟文件系统可靠的文件系统 RAID 问题 15 个直接块2 个双间接块3 个三重间接块4kb 块和 4 字节条目的文件系统上文件可以有多大假设有足够的无限块超级块是什么索引节点数据块如何简化/./proc/../dev/./random/ 在 ext2 中索引节点中存储了什么目录条目中存储了什么 /sys/proc/dev/random 和/dev/urandom 是什么权限位是什么如何使用 chmod 设置用户/组/所有者的读/写/执行权限 “dd”命令是做什么的硬链接和符号链接之间有什么区别文件需要存在吗 ls -l显示目录中每个文件的大小。大小存储在目录中还是文件的索引节点中十、信号进程控制第一部分使用信号的等待宏等待宏我能找出我的子进程的退出值吗您可以找到子进程退出值的最低 8 位main()的返回值或包含在exit()中的值使用“等待宏” - 通常会使用“WIFEXITED”和“WEXITSTATUS”。有关更多信息请参阅wait/waitpid手册页。 int status; pid_t child fork(); if (child -1) return 1; //Failed if (child 0) { /* I am the parent - wait for the child to finish */pid_t pid waitpid(child, status, 0);if (pid ! -1 WIFEXITED(status)) {int low8bits WEXITSTATUS(status);printf(Process %d returned %d , pid, low8bits);} } else { /* I am the child */// do something interestingexecl(/bin/ls, /bin/ls, ., (char *) NULL); // ls . }一个进程只能有 256 个返回值其余的位是信息性的。位移请注意没有必要记住这一点这只是对状态变量内部存储信息的高级概述。 Android 源代码 /如果 WIFEXITED(STATUS)则为状态的低 8 位。/ #define __WEXITSTATUS(status) (((status) 0xff00) 8) /如果 WIFSIGNALED(STATUS)则为终止信号。/ #define __WTERMSIG(status) ((status) 0x7f) /如果 WIFSTOPPED(STATUS)则为停止子进程的信号。/ #define __WSTOPSIG(status) __WEXITSTATUS(status) /如果 STATUS 指示正常终止则为非零。/ #define __WIFEXITED(status) (__WTERMSIG(status) 0) 内核有一种内部方式来跟踪发出信号、退出或停止的情况。该 API 被抽象化以便内核开发人员可以随意更改。小心。请记住如果前提条件得到满足那么宏才有意义。这意味着如果进程被发出信号进程的退出状态将不会被定义。宏不会为您进行检查因此需要编程来确保逻辑正确。信号什么是信号信号是内核为我们提供的一种构造。它允许一个进程异步地向另一个进程发送信号想象一条消息。如果该进程想要接受信号它可以然后对于大多数信号可以决定如何处理该信号。这里是一个信号的简短列表非全面。名称默认操作通常用例SIGINT终止进程可捕获告诉进程停止SIGQUIT终止进程可捕获告诉进程停止SIGSTOP停止进程无法捕获停止进程以便继续SIGCONT继续进程继续运行进程SIGKILL终止进程无法忽略你想让你的进程消失我能暂停我的子进程吗是的您可以通过发送 SIGSTOP 信号来暂时暂停运行中的进程。如果成功它将冻结一个进程即进程将不再分配任何 CPU 时间。要允许进程恢复执行请发送 SIGCONT 信号。例如这是一个每秒慢慢打印一个点的程序最多 59 个点。 #include unistd.h #include stdio.h int main() {printf(My pid is %d\n, getpid() );int i 60;while(--i) { write(1, .,1);sleep(1);}write(1, Done!,5);return 0; }我们将首先在后台启动进程注意末尾的。然后通过使用 kill 命令从 shell 进程发送信号给它。 ./program My pid is 403 ... kill -SIGSTOP 403 kill -SIGCONT 403 如何从 C 中杀死/停止/暂停我的子进程在 C 中使用kill POSIX 调用向子进程发送信号 kill(child, SIGUSR1); // Send a user-defined signal kill(child, SIGSTOP); // Stop the child process (the child cannot prevent this) kill(child, SIGTERM); // Terminate the child process (the child can prevent this) kill(child, SIGINT); // Equivalent to CTRL-C (by default closes the process)正如我们上面看到的在 shell 中也有一个 kill 命令例如获取正在运行的进程列表然后终止进程 45 和进程 46 ps kill -l kill -9 45 kill -s TERM 46 如何检测“CTRL-C”并优雅地清理我们将在后面回到信号 - 这只是一个简短的介绍。在 Linux 系统上如果您有兴趣了解更多信息请参阅man -s7 signal例如系统和库调用的异步信号安全列表。信号处理程序内部的可执行代码有严格的限制。大多数库和系统调用都不是“异步信号安全”的 - 它们不能在信号处理程序内部使用因为它们不是可重入安全的。在单线程程序中信号处理瞬间中断程序执行以执行信号处理程序代码。假设您的原始程序在执行malloc库代码时被中断malloc 使用的内存结构将不处于一致状态。在信号处理程序中调用printf它使用malloc是不安全的并将导致“未定义行为”即不再是一个有用的、可预测的程序。实际上您的程序可能会崩溃计算或生成不正确的结果或者停止运行“死锁”具体取决于在执行信号处理程序代码时您的程序正在执行什么。信号处理程序的一个常见用途是设置一个布尔标志该标志偶尔被轮询读取作为程序正常运行的一部分。例如 int pleaseStop ; // See notes on why volatile sig_atomic_t is bettervoid handle_sigint(int signal) {pleaseStop 1; }int main() {signal(SIGINT, handle_sigint);pleaseStop 0;while ( ! pleaseStop) { /* application logic here */ }/* cleanup code here */ }上述代码在纸上看起来可能是正确的。但是我们需要向编译器和将执行main()循环的 CPU 核心提供提示。我们需要防止编译器优化表达式! pleaseStop似乎是一个循环不变量即永远为真因此可以简化为true。其次我们需要确保pleaseStop的值不是使用 CPU 寄存器缓存的而是始终从主存中读取和写入。sig_atomic_t类型意味着变量的所有位可以被读取或修改为“原子操作” - 一个不可中断的操作。不可能读取由一些新位值和旧位值组成的值。通过使用正确类型的volatile sig_atomic_t指定pleaseStop我们可以编写可移植的代码其中主循环将在信号处理程序返回后退出。在大多数现代平台上sig_atomic_t类型可以与int一样大但在嵌入式系统上它可以与char一样小并且只能表示-127 至 127的值。 volatile sig_atomic_t pleaseStop;这种模式的两个示例可以在“COMP”中找到这是一个基于终端的 1Hz 4 位计算机github.com/gto76/comp-cpp/blob/1bf9a77eaf8f57f7358a316e5bbada97f2dc8987/src/output.c#L121。使用了两个布尔标志。一个用于标记SIGINTCTRL-C的传递并优雅地关闭程序另一个用于标记SIGWINCH信号以检测终端调整大小并重新绘制整个显示。信号第二部分未决信号和信号掩码信号深入解析我如何了解更多关于信号的信息 Linux 手册中讨论了第 2 节中的信号系统调用。第 7 节中还有一篇较长的文章尽管在 OSX/BSD 中没有 man -s7 signal 信号术语生成-信号是由 kill 系统调用在内核中创建的。未决-尚未传递但即将传递已屏蔽-因为没有信号处理方式允许信号被传递所以尚未传递已传递-传递到进程正在执行描述的操作捕获-当进程阻止信号摧毁它并做其他事情时进程的信号处理方式是什么对于每个进程每个信号都有一个处理方式这意味着当信号传递到进程时将发生什么操作。例如默认的 SIGINT 处理方式是终止它。信号处理方式可以通过调用 signal()这很简单但在不同的 POSIX 架构上实现上有微妙的变化也不建议用于多线程程序或sigaction稍后讨论来更改。您可以将进程对所有可能信号的处理方式想象成一个函数指针条目表每个可能信号一个。信号的默认处理方式可以是忽略信号、停止进程、继续已停止的进程、终止进程或者终止进程并转储一个“核心”文件。请注意核心文件是进程内存状态的表示可以使用调试器进行检查。可以排队多个信号吗不是-但是可能有信号处于未决状态。如果信号处于未决状态这意味着它尚未传递到进程。信号处于未决状态的最常见原因是进程或线程当前已阻止了该特定信号。如果特定信号例如 SIGINT处于未决状态则不可能再次排队相同的信号。是可能有多个不同类型的信号处于未决状态。例如SIGINT 和 SIGTERM 信号可能是未决的即尚未传递到目标进程如何屏蔽信号信号可以通过设置进程信号掩码或者在编写多线程程序时设置线程信号掩码来屏蔽意味着它们将保持在未决状态。线程/子进程中的处理方式创建新线程时会发生什么新线程继承了调用线程的掩码的副本 pthread_sigmask( ... ); // set my mask to block delivery of some signals pthread_create( ... ); // new thread will start with a copy of the same mask分叉时会发生什么子进程继承了父进程的信号处理方式。换句话说如果在分叉之前安装了 SIGINT 处理程序那么子进程在传递 SIGINT 时也会调用处理程序。请注意分叉期间子进程的未决信号不会被继承。执行期间会发生什么信号掩码和信号处理方式都会传递到 exec-ed 程序。www.gnu.org/software/libc/manual/html_node/Executing-a-File.html#Executing-a-File 未决信号也会被保留。信号处理程序会被重置因为原始处理程序代码随着旧进程一起消失了。分叉期间会发生什么子进程继承了父进程的信号处理方式和父进程的信号掩码的副本。例如如果在父进程中阻塞了SIGINT那么在子进程中也会被阻塞。例如如果父进程为 SIG-INT 安装了处理程序回调函数那么子进程也会执行相同的行为。但是未决信号不会被子进程继承。如何在单线程程序中屏蔽信号使用sigprocmask使用 sigprocmask您可以设置新的掩码向进程掩码添加新的要屏蔽的信号并解除当前被屏蔽的信号。您还可以通过传递非空值来确定现有掩码并在以后使用。 int sigprocmask(int how, const sigset_t *set, sigset_t *oldset); 来自 sigprocmask 的 Linux 手册页 SIG_BLOCK: The set of blocked signals is the union of the current set and the set argument. SIG_UNBLOCK: The signals in set are removed from the current set of blocked signals. It is permissible to attempt to unblock a signal which is not blocked. SIG_SETMASK: The set of blocked signals is set to the argument set. sigset 类型的行为类似于位图只是使用函数而不是使用和|来显式设置和取消位。在修改一个位之前忘记初始化信号集是一个常见的错误。例如 sigset_t set, oldset; sigaddset(set, SIGINT); // Ooops! sigprocmask(SIG_SETMASK, set, oldset)正确的代码将集合初始化为全部打开或全部关闭。例如 sigfillset(set); // all signals sigprocmask(SIG_SETMASK, set, NULL); // Block all the signals! // (Actually SIGKILL or SIGSTOP cannot be blocked...)sigemptyset(set); // no signals sigprocmask(SIG_SETMASK, set, NULL); // set the mask to be empty again如何在多线程程序中阻止信号在多线程程序中阻止信号与单线程程序类似使用 pthread_sigmask 而不是 sigprocmask 阻止所有线程中的信号以防止其异步传递确保信号在所有线程中被阻止的最简单方法是在创建新线程之前在主线程中设置信号掩码 sigemptyset(set); sigaddset(set, SIGQUIT); sigaddset(set, SIGINT); pthread_sigmask(SIG_BLOCK, set, NULL);// this thread and the new thread will block SIGQUIT and SIGINT pthread_create(thread_id, NULL, myfunc, funcparam);就像我们在 sigprocmask 中看到的那样pthread_sigmask 包括一个“how”参数用于定义如何使用信号集 pthread_sigmask(SIG_SETMASK, set, NULL) - replace the threads mask with given signal set pthread_sigmask(SIG_BLOCK, set, NULL) - add the signal set to the threads mask pthread_sigmask(SIG_UNBLOCK, set, NULL) - remove the signal set from the threads mask在多线程程序中如何传递待处理的信号信号被传递到任何未阻止该信号的信号线程。如果两个或更多线程可以接收信号那么哪个线程将被中断是任意的信号第三部分触发信号如何从 shell 发送信号给进程您已经知道发送SIG_INT的一种方法只需在 shell 中键入CTRL-C。您还可以使用kill如果知道进程 ID和killall如果知道进程名称。 # First lets use ps and grep to find the process we want to send a signal to $ ps au | grep myprogram angrave 4409 0.0 0.0 2434892 512 s004 R 2:42PM 0:00.00 myprogram 1 2 3#Send SIGINT signal to process 4409 (equivalent of CTRL-C) $ kill -SIGINT 4409#Send SIGKILL (terminate the process) $ kill -SIGKILL 4409 $ kill -9 4409 killall类似只是它是根据程序名称匹配。下面的两个例子发送SIGINT然后SIGKILL来终止正在运行myprogram的进程。 # Send SIGINT (SIGINT can be ignored) $ killall -SIGINT myprogram# SIGKILL (-9) cannot be ignored! $ killall -9 myprogram 如何从正在运行的 C 程序发送信号给进程使用raise或kill int raise(int sig); // Send a signal to myself! int kill(pid_t pid, int sig); // Send a signal to another process对于非根进程信号只能发送给相同用户的进程即你不能随便 SIGKILL 我的进程参见 kill(2)即 man -s2 以获取更多详细信息。如何向特定线程发送信号使用pthread_kill int pthread_kill(pthread_t thread, int sig)在下面的示例中执行func的新创建的线程将被SIGINT中断。 pthread_create(tid, NULL, func, args); pthread_kill(tid, SIGINT); pthread_kill(pthread_self(), SIGKILL); // send SIGKILL to myselfpthread_killthreadidSIGKILL会杀死进程还是线程它将杀死整个进程。尽管单个线程可以设置信号掩码但信号处理每个信号执行的处理程序/动作表是每个进程而不是每个线程。这意味着sigaction可以从任何线程调用因为您将为进程中的所有线程设置信号处理程序。如何捕获处理信号您可以选择异步或同步地处理挂起的信号。安装信号处理程序以异步处理信号使用sigaction或者对于简单的示例signal。同步捕获挂起信号使用sigwait它会阻塞直到信号被传递或signalfd它也会阻塞并提供一个文件描述符可以使用read()来检索挂起的信号。参见Signals, Part 4以获取使用sigwait的示例信号第四部分Sigaction 我如何使用sigaction 您应该使用sigaction而不是signal因为它具有更好定义的语义。不同操作系统上的signal会执行不同的操作这是不好的sigaction更具可移植性如果需要对于线程更好地定义。要更改进程的“信号处理方式” - 即当信号传递到您的进程时会发生什么 - 使用sigaction 您可以使用系统调用sigaction来设置信号的当前处理程序或者读取特定信号的当前信号处理程序。 int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);sigaction 结构包括两个回调函数我们只会看’handler’版本一个信号掩码和一个标志字段。 struct sigaction {void (*sa_handler)(int);void (*sa_sigaction)(int, siginfo_t *, void *);sigset_t sa_mask;int sa_flags; }; 我如何将signal调用转换为等效的sigaction调用假设您为警报信号安装了信号处理程序 signal(SIGALRM, myhandler);等效的sigaction代码是 struct sigaction sa; sa.sa_handler myhandler; sigemptyset(sa.sa_mask); sa.sa_flags 0; sigaction(SIGALRM, sa, NULL)但是我们通常也可以设置掩码和标志字段。掩码是在信号处理程序执行期间使用的临时信号掩码。SA_RESTART 标志将自动重新启动一些但不是所有否则会提前返回带有 EINTR 错误的系统调用。后者意味着我们可以在一定程度上简化其余代码因为可能不再需要重启循环。 sigfillset(sa.sa_mask); sa.sa_flags SA_RESTART; /* Restart functions if interrupted by handler */ 我如何使用 sigwait Sigwait 可以用来一次读取一个挂起的信号。sigwait用于同步等待信号而不是在回调中处理它们。多线程程序中典型的 sigwait 用法如下所示。请注意线程信号掩码首先被设置并将被新线程继承。这可以防止信号被传递因此它们将保持挂起状态直到调用 sigwait。还要注意相同的设置 sigset_t 变量被 sigwait 使用 - 除了设置被阻塞信号的集合之外它被用作 sigwait 可以捕获和返回的信号集合。编写自定义信号处理线程如下面的示例的一个优点是现在您可以使用更多的 C 库和系统函数否则不能安全地在信号处理程序中使用因为它们不是异步信号安全的。基于http://pubs.opengroup.org/onlinepubs/009695399/functions/pthread_sigmask.html static sigset_t signal_mask; /* signals to block */int main (int argc, char *argv[]) {pthread_t sig_thr_id; /* signal handler thread ID */sigemptyset (signal_mask);sigaddset (signal_mask, SIGINT);sigaddset (signal_mask, SIGTERM);pthread_sigmask (SIG_BLOCK, signal_mask, NULL);/* New threads will inherit this threads mask */pthread_create (sig_thr_id, NULL, signal_thread, NULL);/* APPLICATION CODE */... }void *signal_thread (void *arg) {int sig_caught; /* signal caught *//* Use same mask as the set of signals that wed like to know about! */sigwait(signal_mask, sig_caught);switch (sig_caught){case SIGINT: /* process SIGINT */...break;case SIGTERM: /* process SIGTERM */...break;default: /* should normally not happen */fprintf (stderr, \nUnexpected signal %d\n, sig_caught);break;} }信号复习问题主题信号信号处理程序安全信号处理信号状态在 Forking/Exec 时的挂起信号在 Forking/Exec 时的信号处理在 C 中引发信号在多线程程序中引发信号问题什么是信号在 UNIX 下如何处理信号奖励Windows 呢函数是什么意思信号处理程序安全进程信号处理是什么我如何在单线程程序中改变信号处理多线程呢为什么要使用 sigaction 而不是 signal 我如何异步和同步地捕获信号在我 fork 后挂起的信号会怎样Exec 我 fork 后我的信号处理怎么样Exec 考试练习问题警告这些是很好的练习但不全面。CS241 期末考试假设你完全理解并能应用课程的所有主题。问题将主要但不完全集中在你在实验室和编程作业中使用过的主题上。考试题目期末考试可能包括多项选择题测试你对以下内容的掌握程度。 CSP (critical section problems) HTTP SIGINT TCP TLB Virtual Memory arrays barrier c strings chmod client/server coffman conditions condition variables context switch deadlock dining philosophers epoll exit file I/O file system representation fork/exec/wait fprintf free heap allocator heap/stack inode vs name malloc mkfifo mmap mutexes network ports open/close operating system terms page fault page tables pipes pointer arithmetic pointers printing (printf) producer/consumer progress/mutex race conditions read/write reader/writer resource allocation graphs ring buffer scanf buffering scheduling select semaphores signals sizeof stat stderr/stdout symlinks thread control (_create, _join, _exit) variable initializers variable scope vm thrashing wait macros write/read with errno, EINTR and partial data C 编程复习问题警告-问题编号可能会更改内存和字符串问题 1.1 在下面的示例中哪些变量保证打印零值 int a; static int b;void func() {static int c;int d;printf(%d %d %d %d\n,a,b,c,d); }问题 1.2 在下面的示例中哪些变量保证打印零值 void func() {int* ptr1 malloc( sizeof(int) );int* ptr2 realloc(NULL, sizeof(int) );int* ptr3 calloc( 1, sizeof(int) );int* ptr4 calloc( sizeof(int) , 1);printf(%d %d %d %d\n,*ptr1,*ptr2,*ptr3,*ptr4); }问题 1.3 解释下面尝试复制字符串的错误。 char* copy(char*src) {char*result malloc( strlen(src) ); strcpy(result, src); return result; }问题 1.4 为什么下面尝试复制字符串的尝试有时成功有时失败 char* copy(char*src) {char*result malloc( strlen(src) 1 ); strcat(result, src); return result; }问题 1.4 解释下面的代码中尝试复制字符串的两个错误。 char* copy(char*src) {char result[sizeof(src)]; strcpy(result, src); return result; }问题 1.5 以下哪个是合法的 char a[] Hello; strcpy(a, World); char b[] Hello; strcpy(b, World12345, b); char* c Hello; strcpy(c, World);问题 1.6 完成函数指针 typedef 以声明一个接受 void参数并返回 void的函数指针。将您的类型命名为’pthread_callback’ typedef ______________________;问题 1.7 除了函数参数之外线程的堆栈上还存储了什么问题 1.8 使用strcpy strlen和指针算术实现char* strcat(char*dest, const char*src)的版本 char* mystrcat(char*dest, const char*src) {? Use strcpy strlen herereturn dest; }问题 1.9 使用循环和无函数调用实现size_t strlen(const char*)的版本。 size_t mystrlen(const char*s) {}问题 1.10 识别以下strcpy实现中的三个错误。 char* strcpy(const char* dest, const char* src) {while(*src) { *dest *src; }return dest; }打印问题 2.1 找出两个错误 fprintf(You scored 100%); 格式化和打印到文件问题 3.1 完成以下代码以打印到文件。将名称、逗号和分数打印到文件’result.txt’ char* name .....; int score ...... FILE *f fopen(result.txt,_____); if(f) {_____ } fclose(f);打印到字符串问题 4.1 如何将变量 amesgval 和 ptr 的值打印到一个字符串将 a 打印为整数mesg 打印为 C 字符串val 打印为双精度值ptr 打印为十六进制指针。您可以假设 mesg 指向一个短的 C 字符串50 个字符。奖励如何使这段代码更健壮或能够应对 char* toString(int a, char*mesg, double val, void* ptr) {char* result malloc( strlen(mesg) 50);_____return result; }输入解析问题 5.1 为什么应该检查 sscanf 和 scanf 的返回值问题 5.2 为什么’gets’很危险问题 5.3 编写一个使用getline的完整程序。确保您的程序没有内存泄漏。堆内存何时使用 calloc 而不是 malloc何时 realloc 会有用待办事项-将此问题移动到另一页程序员在下面的代码中犯了什么错误使用堆内存可以修复吗使用全局静态内存可以修复吗 static int id;char* next_ticket() {id ;char result[20];sprintf(result,%d,id);return result; }多线程编程复习问题警告 - 问题编号可能会更改问题 1 以下代码是否线程安全重新设计以下代码以使其线程安全。提示如果消息内存对每次调用都是唯一的则互斥锁是不必要的。 static char message[20]; pthread_mutex_t mutex PTHREAD_MUTEX_INITIALIZER;void format(int v) {pthread_mutex_lock(mutex);sprintf(message, :%d: ,v);pthread_mutex_unlock(mutex);return message; }问题 2 以下哪一个不会导致进程退出从最后一个运行的线程中返回 pthread 的起始函数。原始线程从主函数返回。任何导致分段错误的线程。任何调用exit的线程。在仍有其他线程运行时在主线程中调用pthread_exit。问题 3 为以下程序中将打印的W字符的数量写一个数学表达式。假设 a、b、c、d 都是小正整数。您的答案可以使用一个返回其最低值参数的’min’函数。 unsigned int a...,b...,c...,d...;void* func(void* ptr) {char m * (char*)ptr;if(m P) sem_post(s);if(m W) sem_wait(s);putchar(m);return NULL; }int main(int argv, char** argc) {sem_init(s,0, a);while(b--) pthread_create(tid, NULL, func, W); while(c--) pthread_create(tid, NULL, func, P); while(d--) pthread_create(tid, NULL, func, W); pthread_exit(NULL); /*Process will finish when all threads have exited */ }问题 4 完成以下代码。以下代码应该交替打印A和B。它表示两个轮流执行的线程。添加条件变量调用到func以便等待的线程不需要不断检查turn变量。问pthread_cond_broadcast是必要的还是pthread_cond_signal足够 pthread_cond_t cv PTHREAD_COND_INITIALIZER; pthread_mutex_t m PTHREAD_MUTEX_INITIALIZER;void* turn;void* func(void* mesg) {while(1) { // Add mutex lock and condition variable calls ...while(turn mesg) { /* poll again ... Change me - This busy loop burns CPU time! */ }/* Do stuff on this thread */puts( (char*) mesg);turn mesg;}return 0; }int main(int argc, char** argv){pthread_t tid1;pthread_create(tid1, NULL, func, A);func(B); // no need to create another thread - just use the main threadreturn 0; }问题 5 在给定的代码中标识临界区。添加互斥锁以使代码线程安全。添加条件变量调用使total永远不会变成负数或超过 1000。相反调用应该阻塞直到可以安全地继续。解释为什么pthread_cond_broadcast是必要的。 int total; void add(int value) {if(value 1) return;total value; } void sub(int value) {if(value 1) return;total - value; }问题 6 一个非线程安全的数据结构有size() enq 和 deq 方法。使用条件变量和互斥锁来完成线程安全的、阻塞版本。 void enqueue(void* data) {// should block if the size() would become greater than 256enq(data); } void* dequeue() {// should block if size() is 0return deq(); }问题 7 您的创业公司提供使用最新交通信息的路径规划。您过度支付的实习生创建了一个非线程安全的数据结构其中包含两个函数shortest使用但不修改图和set_edge修改图。 graph_t* create_graph(char* filename); // called once// returns a new heap object that is the shortest path from vertex i to j path_t* shortest(graph_t* graph, int i, int j); // updates edge from vertex i to j void set_edge(graph_t* graph, int i, int j, double time); 为了性能多个线程必须能够同时调用shortest但是当没有其他线程在shortest或set_edge内执行时图只能被一个线程修改。使用互斥锁和条件变量来实现读者-写者解决方案。下面显示了一个不完整的尝试。尽管这个尝试是线程安全的因此足够用于演示日但它不允许多个线程同时计算shortest路径并且不具有足够的吞吐量。 path_t* shortest_safe(graph_t* graph, int i, int j) {pthread_mutex_lock(m);path_t* path shortest(graph, i, j);pthread_mutex_unlock(m);return path; } void set_edge_safe(graph_t* graph, int i, int j, double dist) {pthread_mutex_lock(m);set_edge(graph, i, j, dist);pthread_mutex_unlock(m); }同步概念复习问题注意线程编程同步问题在另一页上。本页重点讨论概念性主题。问题编号可能会更改 Q1 每个 Coffman 条件的含义是什么例如你能提供每个条件的定义吗持有和等待循环等待无抢占互斥 Q2 逐个举例打破每个 Coffman 条件的真实生活例子。一个需要考虑的情况画家、油漆和画笔。持有和等待循环等待无抢占互斥 Q3 确定餐馆哲学家代码何时导致死锁或者不导致。例如如果你看到以下代码片段哪个 Coffman 条件没有满足 // Get both locks or none. pthread_mutex_lock( a ); if( pthread_mutex_trylock( b ) ) { /*failed*/pthread_mutex_unlock( a );... } Q4 有多少进程被阻塞 P1 获取 R1 P2 获取 R2 P1 获取 R3 P2 等待 R3 P3 获取 R5 P1 获取 R4 P3 等待 R1 P4 等待 R5 P5 等待 R1 Q5 以下哪些陈述对于读者-写者问题是真实的可能有多个活跃的读者可能有多个活跃的写者当有一个活跃的写者时活跃的读者数量必须为零如果有一个活跃的读者活跃的写者数量必须为零一个写者必须等到当前活跃的读者完成内存复习问题问题编号可能会改变 Q1 以下是什么它们的目的是什么翻译旁路缓冲物理地址内存管理单元脏位 Q2 你如何确定页偏移中使用了多少位 Q3 上下文切换后 20 毫秒TLB 包含你的数值代码使用的所有逻辑地址该代码 100%的时间执行主内存访问。相对于单级页表两级页表的开销减速是多少 Q4 解释为什么在上下文切换发生时必须刷新 TLB即 CPU 被分配到不同进程上工作。管道复习问题问题编号可能会有所变化 Q1 填写空白以使以下程序打印 123456789。如果cat没有给出参数它只是打印其输入直到 EOF。奖励解释为什么下面的close调用是必要的。 int main() {int i 0;while(i 10) {pid_t pid fork();if(pid 0) { /* child */char buffer[16];sprintf(buffer, ______,i);int fds[ ______];pipe( fds);write( fds[1], ______,______ ); // Write the buffer into the pipeclose( ______ );dup2( fds[0], ______);execlp( cat, cat, ______ );perror(exec); exit(1);}waitpid(pid, NULL, 0);}return 0; }Q2 使用 POSIX 调用fork pipe dup2和close来实现一个自动评分程序。将子进程的标准输出捕获到一个管道中。子进程应该使用exec命令执行程序./test除了进程名称之外不带任何额外的参数。在父进程中从管道中读取一旦捕获的输出包含!字符就退出父进程。在退出父进程之前向子进程发送 SIGKILL。如果输出包含!则退出 0。否则如果子进程退出导致管道写端关闭则以值 1 退出。确保在父进程和子进程中关闭未使用的管道端。 Q3高级这个高级挑战使用管道让“AI 玩家”自己玩游戏直到游戏结束。程序tictactoe接受一行输入 - 到目前为止所做的转动序列打印相同的序列然后再加上一个转动然后退出。一个转动由两个字符指定。例如“A1”和“C3”是两个对角位置。字符串B2A1A3是一个 3 个转动/步骤的游戏。一个有效的响应是B2A1A3C1C1 响应阻止了对角线 B2 A3 的威胁。输出行还可以包括后缀“-I win”、“-You win”、“-invalid”或“-draw”。使用管道来控制每个创建的子进程的输入和输出。当输出包含“-”时打印最终输出行整个游戏序列和结果并退出。文件系统复习问题问题编号可能会更改问题 1 编写一个使用 fseek 和 ftell 的函数将文件的中间字符替换为’X’ void xout(char* filename) {FILE *f fopen(filename, ____ );}问题 2 在ext2文件系统中从磁盘读取多少个 inode 才能访问文件/dir1/subdirA/notes.txt的第一个字节假设根目录中的目录名称和 inode 编号但不是 inode 本身已经在内存中。问题 3 在ext2文件系统中必须从磁盘读取多少个最小磁盘块才能访问文件/dir1/subdirA/notes.txt的第一个字节假设根目录中的目录名称和 inode 编号以及所有 inode 已经在内存中。问题 4 在具有 32 位地址和 4KB 磁盘块的ext2文件系统中一个 inode 可以存储 10 个直接磁盘块编号。需要多大的文件大小才需要单一间接表ii双重间接表问题 5 修复下面的 shell 命令chmod以设置文件secret.txt的权限使所有者可以读取、写入和执行权限组可以读取其他人没有访问权限。 chmod 000 secret.txt 网络复习问题带交互式多选题的维基见编码问题见简答问题见MP 可穿戴设备思考问题简答问题 Q1 什么是套接字 Q2 监听端口 1000 和端口 2000 有什么特别之处端口 2000 比端口 1000 慢两倍端口 2000 比端口 1000 快两倍端口 1000 需要 root 权限无 Q3 IPv4 和 IPv6 之间的一个重要区别是什么 Q4 何时以及为什么会使用 ntohs Q5 如果主机地址是 32 位我最有可能使用哪种 IP 方案128 位呢 Q6 哪种常见的网络协议是基于数据包的可能无法成功传递数据 Q7 哪种常见的协议是基于流的如果数据包丢失将重新发送数据 Q8 什么是 SYN ACK ACK-SYN 握手 Q9 以下哪项不是 TCP 的特性之一数据包重排序流量控制数据包重传简单的错误检测加密 Q10 什么协议使用序列号它们的初始值是多少为什么 Q11 构建 TCP 服务器需要的最小网络调用是什么它们的正确顺序是什么 Q12 构建 TCP 客户端所需的最小网络调用是什么它们的正确顺序是什么 Q13 何时在 TCP 客户端上调用 bind Q14 套接字绑定监听接受的目的是什么 Q15 上述哪个调用可以阻塞等待新客户端连接 Q16 DNS 是什么它对你有什么作用CS241 网络调用中的哪些会为你使用它 Q17 对于 getaddrinfo如何指定服务器套接字 Q18 为什么 getaddrinfo 可能会生成网络数据包 Q19 哪个网络调用指定了允许的积压大小 Q20 哪个网络调用返回一个新的文件描述符 Q21 何时使用被动套接字 Q22 何时使用 epoll 比 select 更好何时使用 select 比 epoll 更好 Q23 write(fd, data, 5000)总是发送 5000 字节的数据吗它何时会失败 Q24 网络地址转换NAT是如何工作的 Q25 MCQ 假设网络客户端和服务器之间的传输时间为 20ms建立 TCP 连接需要多长时间20ms 40ms 100ms 60ms ANS 3 次握手 EXP END Q26 HTTP 1.0 和 HTTP 1.1 之间有哪些区别如果网络传输时间为 20ms从服务器传输 3 个文件到客户端需要多少毫秒HTTP 1.0 和 HTTP 1.1 之间的传输时间有何不同编码问题 Q 2.1 写入网络套接字可能不会发送所有字节并且可能会因为信号中断。检查write的返回值来实现write_all它将重复调用write以发送任何剩余的数据。如果write返回-1那么除非errno是EINTR否则立即返回-1 - 在这种情况下重复上次的write尝试。您将需要使用指针算术。 // Returns -1 if write fails (unless EINTR in which case it recalls write // Repeated calls write until all of the buffer is written. ssize_t write_all(int fd, const char *buf, size_t nbyte) {ssize_t nb write(fd, buf, nbyte);return nb; }Q 2.2 实现一个多线程 TCP 服务器监听端口 2000。每个线程应从客户端文件描述符中读取 128 字节并将其回显给客户端然后关闭连接并结束线程。 Q 2.3 实现一个 UDP 服务器监听端口 2000。保留一个大小为 200 字节的缓冲区。监听到一个到达的数据包。有效数据包为 200 字节或更少并以四个字节 0x65 0x66 0x67 0x68 开头。忽略无效的数据包。对于有效的数据包将第五个字节的值作为无符号值添加到一个运行总数中并打印到目前为止的总数。如果运行总数大于 255则退出。信号复习问题给出通常由内核生成的两个信号的名称给出一个不能被信号捕获的信号的名称为什么在信号处理程序中调用任何函数不是信号处理程序安全的函数是不安全的编码问题编写简短的代码使用 SIGACTION 和 SIGNALSET 来创建一个 SIGALRM 处理程序。系统编程笑话系统编程笑话警告作者对这些“笑话”造成的任何神经凋亡概不负责。-允许抱怨。灯泡笑话 Q.需要多少系统程序员来换一只灯泡 A.一个但他们不断更改它直到返回零。 A.没有他们更喜欢一个空的插座。 A.好吧你开始只有一个但实际上它等待一个孩子来做所有的工作。抱怨者为什么婴儿系统程序员喜欢他们的新彩色毯子它是多线程的。为什么你的程序如此精致柔软我只使用 400 线程或更高线程的程序。当坏学生 shell 进程死去时他们去哪里地狱分叉。为什么 C 程序员如此凌乱他们把所有东西都存储在一个大堆中。系统程序员定义系统程序员是… 知道sleepsort是一个坏主意但仍然梦想找借口使用它的人。从不让他们的代码死锁的人…但当它发生时会比其他人加起来造成更多问题。一个相信僵尸是真实的人。一个不相信他们的进程在没有使用相同的数据、内核、编译器、RAM、文件系统大小、文件系统格式、磁盘品牌、核心数量、CPU 负载、天气、磁通量、方向、精灵尘、星座、墙壁颜色、墙壁光泽和反射、主板、振动、照明、备用电池、时间、温度、湿度、月球位置、太阳-月球共同位置的情况下正确运行的人… 系统程序定义一个系统程序… 发展到可以发送电子邮件。发展到有潜力创建、连接和终结其他程序并在所有可能的设备上消耗所有可能的 CPU、内存、网络…资源但选择不这样做。今天。

查看全文

http://www.zqtcl.cn/news/299866/