当前位置: 首页 > news >正文

济源网站建设国外域名 网站备案

济源网站建设,国外域名 网站备案,深圳seo搜索优化,招商外包公司排名因为我的个人网站 restran.net 已经启用#xff0c;博客园的内容已经不再更新。请访问我的个人网站获取这篇文章的最新内容#xff0c;谈谈 Python 程序的运行原理 这篇文章准确说是『Python 源码剖析』的读书笔记#xff0c;整理完之后才发现很长#xff0c;那就将就看吧。…因为我的个人网站 restran.net 已经启用博客园的内容已经不再更新。请访问我的个人网站获取这篇文章的最新内容谈谈 Python 程序的运行原理 这篇文章准确说是『Python 源码剖析』的读书笔记整理完之后才发现很长那就将就看吧。 1. 简单的例子 先从一个简单的例子说起包含了两个文件 foo.py 和 demo.py [foo.py] def add(a, b): return a b [demo.py] import foo a [1, python] a a string def func(): a 1 b 257 print(a b) print(a) if __name__ __main__: func() foo.add(1, 2) 执行这个程序 python demo.py 输出结果 a string 258 同时该文件目录多出一个 foo.pyc 文件 2. 背后的魔法 看完程序的执行结果接下来开始一行行解释代码。 2.1 模块 Python 将 .py 文件视为一个 module这些 module 中有一个主 module也就是程序运行的入口。在这个例子中主 module 是 demo.py。 2.2 编译 执行 python demo.py 后将会启动 Python 的解释器然后将 demo.py 编译成一个字节码对象 PyCodeObject。 有的人可能会很好奇编译的结果不应是 pyc 文件吗就像 Java 的 class 文件那为什么是一个对象呢这里稍微解释一下。 在 Python 的世界中一切都是对象函数也是对象类型也是对象类也是对象类属于自定义的类型在 Python 2.2 之前int, dict 这些内置类型与类是存在不同的在之后才统一起来全部继承自 object甚至连编译出来的字节码也是对象.pyc 文件是字节码对象PyCodeObject在硬盘上的表现形式。 在运行期间编译结果也就是 PyCodeObject 对象只会存在于内存中而当这个模块的 Python 代码执行完后就会将编译结果保存到了 pyc 文件中这样下次就不用编译直接加载到内存中。pyc 文件只是 PyCodeObject 对象在硬盘上的表现形式。 这个 PyCodeObject 对象包含了 Python 源代码中的字符串常量值以及通过语法解析后编译生成的字节码指令。PyCodeObject 对象还会存储这些字节码指令与原始代码行号的对应关系这样当出现异常时就能指明位于哪一行的代码。 2.3 pyc 文件 一个 pyc 文件包含了三部分信息Python 的 magic number、pyc 文件创建的时间信息以及 PyCodeObject 对象。 magic number 是 Python 定义的一个整数值。一般来说不同版本的 Python 实现都会定义不同的 magic number这个值是用来保证 Python 兼容性的。比如要限制由低版本编译的 pyc 文件不能让高版本的 Python 程序来执行只需要检查 magic number 不同就可以了。由于不同版本的 Python 定义的字节码指令可能会不同如果不做检查执行的时候就可能出错。 下面所示的代码可以来创建 pyc 文件使用方法 python generate_pyc.py module_name 例如 python generate_pyc.py demo [generate_pyc.pyc] import imp import sys def generate_pyc(name): fp, pathname, description imp.find_module(name) try: imp.load_module(name, fp, pathname, description) finally: if fp: fp.close() if __name__ __main__: generate_pyc(sys.argv[1]) 2.4 字节码指令 为什么 pyc 文件也称作字节码文件因为这些文件存储的都是一些二进制的字节数据而不是能让人直观查看的文本数据。 Python 标准库提供了用来生成代码对应字节码的工具 dis。dis 提供一个名为 dis 的方法这个方法接收一个 code 对象然后会输出 code 对象里的字节码指令信息。 s open(demo.py).read() co compile(s, demo.py, exec) import dis dis.dis(co) 执行上面这段代码可以输出 demo.py 编译后的字节码指令 1 0 LOAD_CONST 0 (-1) 3 LOAD_CONST 1 (None) 6 IMPORT_NAME 0 (foo) 9 STORE_NAME 0 (foo) 3 12 LOAD_CONST 2 (1) 15 LOAD_CONST 3 (upython) 18 BUILD_LIST 2 21 STORE_NAME 1 (a) 4 24 LOAD_CONST 4 (ua string) 27 STORE_NAME 1 (a) 6 30 LOAD_CONST 5 () 33 MAKE_FUNCTION 0 36 STORE_NAME 2 (func) 11 39 LOAD_NAME 1 (a) 42 PRINT_ITEM 43 PRINT_NEWLINE 13 44 LOAD_NAME 3 (__name__) 47 LOAD_CONST 6 (u__main__) 50 COMPARE_OP 2 () 53 POP_JUMP_IF_FALSE 82 14 56 LOAD_NAME 2 (func) 59 CALL_FUNCTION 0 62 POP_TOP 15 63 LOAD_NAME 0 (foo) 66 LOAD_ATTR 4 (add) 69 LOAD_CONST 2 (1) 72 LOAD_CONST 7 (2) 75 CALL_FUNCTION 2 78 POP_TOP 79 JUMP_FORWARD 0 (to 82)82 LOAD_CONST 1 (None) 85 RETURN_VALUE 2.5 Python 虚拟机 demo.py 被编译后接下来的工作就交由 Python 虚拟机来执行字节码指令了。Python 虚拟机会从编译得到的 PyCodeObject 对象中依次读入每一条字节码指令并在当前的上下文环境中执行这条字节码指令。我们的程序就是通过这样循环往复的过程才得以执行。 2.6 import 指令 demo.py 的第一行代码是 import foo。import 指令用来载入一个模块另外一个载入模块的方法是 from xx import yy。用 from 语句的好处是可以只复制需要的符号变量到当前的命名空间中关于命名空间将在后面介绍。 前文提到当已经存在 pyc 文件时就可以直接载入而省去编译过程。但是代码文件的内容会更新如何保证更新后能重新编译而不入旧的 pyc 文件呢。答案就在 pyc 文件中存储的创建时间信息。当执行 import 指令的时候如果已存在 pyc 文件Python 会检查创建时间是否晚于代码文件的修改时间这样就能判断是否需要重新编译还是直接载入了。如果不存在 pyc 文件就会先将 py 文件编译。 2.7 绝对引入和相对引入 前文已经介绍了 import foo 这行代码。这里隐含了一个问题就是 foo 是什么如何找到 foo。这就属于 Python 的模块引入规则这里不展开介绍可以参考 pep-0328。 2.8 赋值语句 接下来执行到 a [1, python]这是一条赋值语句定义了一个变量 a它对应的值是 [1, python]。这里要解释一下变量是什么呢 变量是一个存储位置和一个关联的符号名字这个存储位置包含了一些已知或未知的量或者信息。 变量实际上是一个字符串的符号用来关联一个存储在内存中的对象。在 Python 中会使用 dict就是 Python 的 dict 对象来存储变量符号字符串与一个对象的映射。 那么赋值语句实际上就是用来建立这种关联在这个例子中是将符号 a 与一个列表对象 [1, python] 建立映射。 紧接着的代码执行了 a a string这条指令则将符号 a 与另外一个字符串对象 a string 建立了映射。今后对变量 a 的操作将反应到字符串对象 a string 上。 2.9 def 指令 我们的 Python 代码继续往下运行这里执行到一条 def func()从字节码指令中也可以看出端倪 MAKE_FUNCTION。没错这条指令是用来创建函数的。Python 是动态语言def 实际上是执行一条指令用来创建函数class 则是创建类的指令而不仅仅是个语法关键字。函数并不是事先创建好的而是执行到的时候才创建的。 def func() 将会创建一个名称为 func 的函数对象。实际上是先创建一个函数对象然后将 func 这个名称符号绑定到这个函数上。 Python 中是无法实现 C 和 Java 中的重载的因为重载要求函数名要相同而参数的类型或数量不同但是 Python 是通过变量符号如这里的 func来关联一个函数当我们用 def 语句再次创建一个同名的函数时这个变量名就绑定到新的函数对象上了。 2.10 动态类型 继续看函数 func 里面的代码这时又有一条赋值语句 a 1。变量 a 现在已经变成了第三种类型它现在是一个整数了。那么 Python 是怎么实现动态类型的呢答案就藏在具体存储的对象上。变量 a 仅仅只是一个符号实际上是一个字符串对象类型信息是存储在对象上的。在 Python 中对象机制的核心是类型信息和引用计数引用计数属于垃圾回收的部分。 用 type(a)可以输出 a 的类型这里是 int b 257 跳过我们直接来看看 print(a b)print 是输出函数这里略过。这里想要探究的是 a b。 因为 a 和 b 并不存储类型信息因此当执行 a b 的时候就必须先检查类型比如 1 2 和 1 2 的结果是不一样的。 看到这里我们就可以想象一下执行一句简单的 a bPython 虚拟机需要做多少繁琐的事情了。首先需要分别检查 a 和 b 所对应对象的类型还要匹配类型是否一致1 2 将会出现异常然后根据对象的类型调用正确的 函数例如数值的 或字符串的 而 CPU 对于上面这条语句只需要执行 ADD 指令还需要先将变量 MOV 到寄存器。 2.11 命名空间 (namespace) 在介绍上面的这些代码时还漏掉了一个关键的信息就是命名空间。在 Python 中类、函数、module 都对应着一个独立的命名空间。而一个独立的命名空间会对应一个 PyCodeObject 对象所以上面的 demo.py 文件编译后会生成两个 PyCodeObject只是在 demo.py 这个 module 层的 PyCodeObject 中通过一个变量符号 func 嵌套了一个函数的 PyCodeObject。 命名空间的意义就是用来确定一个变量符号到底对应什么对象。命名空间可以一个套一个地形成一条命名空间链Python 虚拟机在执行的过程中会有很大一部分时间消耗在从这条命名空间链中确定一个符号所对应的对象是什么。 在 Python中命名空间是由一个 dict 对象实现的它维护了nameobj这样的关联关系。 说到这里再补充一下 import foo 这行代码会在 demo.py 这个模块的命名空间中创建一个新的变量名 foofoo 将绑定到一个 PyCodeObject 对象也就是 foo.py 的编译结果。 2.11.1 dir 函数 Python 的内置函数 dir 可以用来查看一个命名空间下的所有名字符号。一个用处是查看一个命名空间的所有属性和方法这里的命名空间就是指类、函数、module。 比如查看当前的命名空间可以使用 dir()查看 sys 模块可以使用 dir(sys)。 2.11.2 LEGB 规则 Python 使用 LEGB 的顺序来查找一个符号对应的对象 locals - enclosing function - globals - builtins locals当前所在命名空间如函数、模块函数的参数也属于命名空间内的变量 enclosing外部嵌套函数的命名空间闭包中常见 def fun1(a): def fun2(): # a 位于外部嵌套函数的命名空间 print(a) globals全局变量函数定义所在模块的命名空间 a 1 def fun(): # 需要通过 global 指令来声明全局变量 global a # 修改全局变量而不是创建一个新的 local 变量 a 2 builtins内置模块的命名空间。Python 在启动的时候会自动为我们载入很多内置的函数、类比如 dictlisttypeprint这些都位于 __builtins__ 模块中可以使用 dir(__builtins__) 来查看。这也是为什么我们在没有 import 任何模块的情况下就能使用这么多丰富的函数和功能了。 介绍完命名空间就能理解 print(a) 这行代码输出的结果为什么是 a string 了。 2.12 内置属性 __name__ 现在到了解释 if __name__ __main__ 这行代码的时候了。当 Python 程序启动后Python 会自动为每个模块设置一个属性 __name__ 通常使用的是模块的名字也就是文件名但唯一的例外是主模块主模块将会被设置为 __main__。利用这一特性就可以做一些特别的事。比如当该模块以主模块来运行的时候可以运行测试用例。而当被其他模块 import 时则只是乖乖的提供函数和功能就好。 2.13 函数调用 最后两行是函数调用这里略去不讲。 3. 回顾 讲到最后还有些内容需要再回顾和补充一下。 3.1 pyc 文件 Python 只会对那些以后可能继续被使用和载入的模块才会生成 pyc 文件Python 认为使用了 import 指令的模块属于这种类型因此会生成 pyc 文件。而对于只是临时用一次的模块并不会生成 pyc 文件Python 将主模块当成了这种类型的文件。这就解释了为什么 python demo.py 执行完后只会生成一个 foo.pyc 文件。 如果要问 pyc 文件什么时候生成答案就是在执行了 import 指令之后from xx import yy 同样属于 import 指令。 3.2 小整数对象池 在 demo.py 这里例子中所用的整数特意用了一个 257这是为了介绍小整数对象池的。整数在程序中的使用非常广泛Python 为了优化速度使用了小整数对象池避免为整数频繁申请和销毁内存空间。 Python 对小整数的定义是 [-5, 257)这些整数对象是提前建立好的不会被垃圾回收。在一个 Python 的程序中所有位于这个范围内的整数使用的都是同一个对象从下面这个例子就可以看出。a 1id(a) 40059744b 1id(b) 40059744c 257id(c) 41069072d 257id(257) 41069096 id 函数可以用来查看一个对象的唯一标志可以认为是内存地址 对于大整数Python 使用的是一个大整数对象池。这句话的意思是 每当创建一个大整数的时候都会新建一个对象但是这个对象不再使用的时候并不会销毁后面再建立的对象会复用之前已经不再使用的对象的内存空间。这里的不再使用指的是引用计数为0可以被销毁 3.3 字符串对象缓冲池 如果仔细思考一下一定会猜到字符串也采用了这种类似的技术我们来看一下a ab aid(a) 14660456id(b) 14660456 没错Python 的设计者为一个字节的字符对应的字符串对象 (PyStringObject) 也设计了这样一个对象池。同时还有一个 intern 机制可以将内容相同的字符串变量转换成指向同一个字符串对象。 intern 机制的关键就是在系统中有一个keyvalue映射关系的集合集合的名称叫做 interned。在这个集合中记录着被 intern 机制处理过的 PyStringObject 对象。不过 Python 始终会为字符串创建 PyStringObject 对象即便在interned 中已经有一个与之对应的 PyStringObject 对象了而 intern 机制是在字符串被创建后才起作用。a a stringb a stringa is b Falsea intern(a string) # 手动调用 intern 方法b intern(a string)a is b True 关于 intern 函数 可以参考官方文档更多扩展阅读 值得说明的是数值类型和字符串类型在 Python 中都是不可变的这意味着你无法修改这个对象的值每次对变量的修改实际上是创建一个新的对象。得益于这样的设计才能使用对象缓冲池这种优化。 Python 的实现上大量采用了这种内存对象池的技术不仅仅对于这些特定的对象还有专门的内存池用于小对象使用这种技术可以避免频繁地申请和释放内存空间目的就是让 Python 能稍微更快一点。更多内容可以参考这里。 如果想了解更快的 Python可以看看 PyPy 3.4 import 指令 前文提到 import 指令是用来载入 module 的如果需要也会顺道做编译的事。但 import 指令还会做一件重要的事情就是把 import 的那个 module 的代码执行一遍这件事情很重要。Python 是解释执行的连函数都是执行的时候才创建的。如果不把那个 module 的代码执行一遍那么 module 里面的函数都没法创建更别提去调用这些函数了。 执行代码的另外一个重要作用就是在这个 module 的命名空间中创建模块内定义的函数和各种对象的符号名称也就是变量名并将其绑定到对象上这样其他 module 才能通过变量名来引用这些对象。 Python 虚拟机还会将已经 import 过的 module 缓存起来放到一个全局 module 集合 sys.modules 中。这样做有一个好处即如果程序的在另一个地方再次 import 这个模块Python 虚拟机只需要将全局 module 集合中缓存的那个 module 对象返回即可。 你现在一定想到了 sys.modules 是一个 dict 对象可以通过 type(sys.modules) 来验证 3.5 多线程 demo.py 这个例子并没有用到多线程但还是有必要提一下。 在提到多线程的时候往往要关注线程如何同步如何访问共享资源。Python 是通过一个全局解释器锁 GILGlobal Interpreter Lock来实现线程同步的。当 Python 程序只有单线程时并不会启用 GIL而当用户创建了一个 thread 时表示要使用多线程Python 解释器就会自动激活 GIL并创建所需要的上下文环境和数据结构。 Python 字节码解释器的工作原理是按照指令的顺序一条一条地顺序执行Python 内部维护着一个数值这个数值就是 Python 内部的时钟如果这个数值为 N则意味着 Python 在执行了 N 条指令以后应该立即启动线程调度机制可以通过下面的代码获取这个数值。 import sys sys.getcheckinterval() # 100 线程调度机制将会为线程分配 GIL获取到 GIL 的线程就能开始执行而其他线程则必须等待。由于 GIL 的存在Python 的多线程性能十分低下无法发挥多核 CPU 的优势性能甚至不如单线程。因此如果你想用到多核 CPU一个建议是使用多进程。 3.6 垃圾回收 在讲到垃圾回收的时候通常会使用引用计数的模型这是一种最直观最简单的垃圾收集技术。Python 同样也使用了引用计数但是引用计数存在这些缺点 频繁更新引用计数会降低运行效率 引用计数无法解决循环引用问题 Python 在引用计数机制的基础上使用了主流垃圾收集技术中的标记——清除和分代收集两种技术。 关于垃圾回收可以参考 4. 参考文献
http://www.zqtcl.cn/news/145200/

相关文章:

  • 珠海建设局网站东莞市建设信息网
  • 已有域名怎么做网站wordpress二维码制作教程
  • 做招生网站网站织梦后台一片白
  • wordpress 表单录入优化网站的技巧
  • 域名注册网站的域名哪里来的信息型网站
  • 商贸网站建设常见的网站结构有哪些
  • 网站开发概要设计模板网站qq获取
  • 关键词网站推广王野摩托车是什么牌子
  • 网站建设管理工作的总结网站做网站词怎么推广
  • 通过网站的和报刊建设在网站建设工作会上的讲话
  • 建设部网站举报壹搜网站建设优化排名
  • 做软件界面的网站洛可可成都设计公司
  • 微信建立免费网站app网站制作软件
  • 上海工程建设造价信息网站黑帽seo易下拉霸屏
  • 网站建设公司需要申请icp吗网站续费
  • 宁波快速建站公司滕州网站设计
  • logo成品效果图网站网站意见反馈源码
  • 宁志网站两学一做高端网站建设代码
  • 企业做可信网站认证的好处电影网站制作
  • 大学网站建设课程课综温州网站推广好不好
  • 做电影ppt模板下载网站有什么网站可以做海报
  • 搭建网站需要做什么国外互动网站
  • 淘宝客导购网站怎么做建设网站天河区
  • 做网站的优势有哪些wordpress 一直崩溃
  • 长沙交互网站设计服务商优秀的网页网站设计
  • android 旅游网站开发有哪些做伦敦金的网站
  • 物流网站系统php源码seo课程多少钱
  • 手机 网站品牌网站建设 d磐石网络
  • 免费用搭建网站珠海住房和建设局网站
  • 天津做胎儿鉴定网站广州古德室内设计有限公司logo