wordpress文章格式,网站标题seo外包优化,国内最好的网站服务器,学院网站改造方案首先跟大家分享一个有趣的亲身经历。有一次#xff0c;在网上我看到有程序员发了一个帖子#xff0c;帖子题目乍一看让人感到惊愕#xff0c;但细一想又让我会心一笑。
这个帖子的题目大致上是这样的#xff1a;字符编码是不是让程序员最感到恶心的问题#xff1f;
更有…首先跟大家分享一个有趣的亲身经历。有一次在网上我看到有程序员发了一个帖子帖子题目乍一看让人感到惊愕但细一想又让我会心一笑。
这个帖子的题目大致上是这样的字符编码是不是让程序员最感到恶心的问题
更有意思的是这个帖子下面竟然还得到了不少程序员的认同和点赞。我也表示了认同和点了赞。
为什么对字符编码会有这样的看法呢
字符编码像个幽灵
字符编码看起来是一个不太受到关注的边缘主题似乎与前端技术的新潮酷炫、数据结构与算法的高大上、Java/Go/MySQL等的实用都挨不上边。
但事实上字符编码无疑是计算机世界里最基础、最重要的一个主题之一。
然而这么基石性的主题在计算机教材中却只是浮光掠影般地草草带过。网络上有关字符编码的介绍文章也大多错漏百出、谬误多多。
更为令人不解的是甚至连一本深入介绍的专门著作都找不到。对此我一直很困惑为什么就没有哪位大牛对这个如此基础、如此重要而又如此容易让人困惑的主题写一本专著进行介绍呢
在编程实践中如果没有用死磕到底的精神将字符编码的来龙去脉、前世今生彻底搞清楚只要你涉及的技术领域稍微广泛一些那么它终将会像幽灵一样挥之不去导致时不时地被各种与它相关的“灵异”事件折磨得死去活来。
本人正是在经受了字符编码所带来的种种令人崩溃的痛苦之后才在痛定思痛之余最终痛下决心誓要将它刨根究底。
字符编码涉及面广
字符编码的基础性、重要性主要体现在它的涉及面太过于广泛。
向下涉及到计算机的底层技术甚至是硬件实现。
向上几乎跟所有的操作系统、编程语言、应用程序都密切相关。
因此要想真正搞明白字符编码问题必须得从计算机的基本概念——位、字节、字等等开始再结合不同的系统环境与编程环境进行具体分析。
类似于字符编码这样基础、重要、应用广泛而又特别容易让人困惑的基石性领域还有字节序(即大小端表示)、正则表达式、浮点数实现、日期时间处理等等。
这些领域都差不多具有如下共同特点
非常基础却又非常重要看起来比较偏门却又应用极为广泛不实战的话感觉很简单一旦实际工作中遇到了却又特别让人困惑貌似与日常工作关系不大却又往往会在关键时刻被它们折磨得死去活来。
真正经验老到的技术负责人在招聘技术人员时往往不会将面试重点放在对当前流行技术和热门技术的考察上而是会放在对上述这些容易被应聘者轻视的基础技术的考察上。
道理很简单一方面是所谓的“基础不牢、地动山摇”基础技术的扎实与否决定了这个人未来的技术成长空间和对新技术的快速掌握能力。
而另一方面更重要的是通过对这些看似偏门却又非常关键的基础技术的考察可以看出一个人的学习能力以及对技术真正的好奇心、热情和追求。
因为新潮、酷炫、热门的流行技术几乎人人都喜欢因此追逐流行技术是人之常情不足为奇。
只有对基础技术仍然抱有刨根究底的好奇心和热情才真正地体现出了一个程序员的学习能力和技术追求。
根据我多年的经验来看这是划分平庸程序员和优秀程序员的分水岭和分界线几乎是百发百中极少看走眼过。
压箱底的看家本领
上面所提到基石性领域中字节序、正则表达式跟字符编码的关系又密切相关尤其是字节序直接影响字符编码的字节序列。
而由于正则表达式主要用于在字符串中查找、提取字符或子字符串要想真正理解正则表达式也离不开对字符编码的深入理解。
因此对字符编码的深入理解是一个程序员基本功中压箱底的看家本领是一个程序员搭建自身技术体系大厦的重要基石。
为此我会尽量从日常工作中必然会遇到的各种实际问题入手为你顺藤摸瓜、抽丝剥茧环环相扣、层层深入尽可能让你获得一种打通了技术的任督二脉后一气周流、酣畅淋漓的畅快感以及彻底搞懂了技术原理后原来如此、豁然开朗的痛快感。 将涉及到的内容
下面是本《刨根究底字符编码》系列文章将会涉及到的内容
1关键术语解释位、字节、字与字长、字符集、编码、解码、字符编码、现代字符编码模型
2字符编码的由来
3ASCII字符编码方案
4扩展ASCII字符编码方案EASCII以及ISO/IEC 8859系列字符编码方案
5汉字编码方案GB2312、GBK、GB18030、GB13000、全角与半角、CJK中日韩统一表意文字
6汉字编码中区位码、国标码(交换码)、内码(机内码)、外码(输入码)、字形码(输出码)的区别及关系
7ANSI编码
8代码页(Code Page)、微软与ANSI代码页
9Unicode编码方案的面世
10Unicode编码方案概述
11字符编码模型的演变与字节序
12Unicode字符集的编码方式码点、码元、UTF-8、UTF-16、UTF-32
13微软为什么跟联通有仇——Windows记事本的字符编码方式
14深入剖析奇葩的Python字符编码
15Vim中的字符编码问题
16Unicode常见问题解答
17总结。