当前位置：首页 > news >正文

最新备案网站查询淮北做网站的公司

news 2025/11/15 6:29:31

最新备案网站查询,淮北做网站的公司,天津建设网站分包服务卡,房屋装修效果图大全【0】README 0.1#xff09; 本文总结于数据结构与算法分析#xff0c; 源代码均为原创#xff0c; 旨在理解 “Huffman编码#xff08;Huffman树#xff09;” 的idea 并用源代码加以实现#xff1b; 0.2#xff09; Huffman树的构建算法属于贪婪算法#xff0c;…【0】README 0.1 本文总结于数据结构与算法分析源代码均为原创旨在理解 “Huffman编码Huffman树” 的idea 并用源代码加以实现 0.2 Huffman树的构建算法属于贪婪算法贪婪算法的基础知识参见　http://blog.csdn.net/pacosonswjtu/article/details/50071159 【1】Huffman 编码 1.1贪婪算法的第二个应用文件压缩 1.1.1标准的 ASCII字符集它由大约100个可打印字符组成为了把这些字符区分开需要 |log100|不小于等于log100 7个比特1.1.2看个荔枝使用一个标准编码方案设一个文件它只包含字符 a, e, i, s, t, 加上一些空格和 newline换行。进一步设该文件有10个a、15个e、12个i、3个s、4个t、13个空格以及一个 newline 如图10-8所示这个文件需要174个bits 来表示因为有58个字符每个字符3个bits 1.2现实中的事实文件可能相当大。许多大文件是某个程序的输出数据而在使用频率最大和最小之间的字符间通常存在很大的差别1.2.1出现的问题是否有可能提供一种更好的编码降低总的所需bits数量 2.2解决方法一般策略就是让代码的长度从字符到字符是编号不等的　同时保证经常出现的字符其代码短注意　如果所有的字符都以相同的频率出现　那么要节省空间是不可能的 2.代表字母的二进制代码用二叉树来表示对上图的分析Analysis A1上图中的树只在树叶上有数据。每个字符通过从根节点开始用0指示左分支用1指示右分支而以记录路径的方法表示出来。如 s通过从根向左走然后向右最后再向右而达到于是它被编码为 011。这种数据结构叫做 trie树trie单词查找树A2如果字符 ci 在深度 di 处并且出现 fi次那么该字符编码的值就等于 ∑di * fiA3因为 newlinenl是仅有的一个儿子我们把它放到它的更高一层的父节点上如下图所示 A4上图中的树是满树full tree所有的节点或者是树叶或者有两个儿子 1.4综上所述我们看到基本的问题在于找到总价值最小的满二叉树其中所有的字符都位于树叶上下图显示了简单字母表的最优树 1.4.1那么问题来了如何构造编码树1.4.2解决方法引入哈夫曼编码 1952年 Huffman 给出了一个算法因此这种编码系统通常称为哈夫曼编码Huffman code 【2】哈夫曼算法 2.1算法描述算法对一个由树组成的森林进行。一棵树的权等于它的树叶的频率的和。任意选取最小权的两颗树T1 和 T2 并任意形成以 T1 和 T2 为子树的新树将这样的过程进行 C-1 次。在算法的开始存在C 颗单节点树——每个字符一颗。在算法结束时得到一颗树这颗树就是最优哈夫曼编码树了 2.2看个荔枝构建哈夫曼编码树的steps 2.3下面我们验证哈夫曼算法产生最优代码的证明思路 step1首先由反证法证明树是满的因为我们已经看到一颗不满的树是改进进成满树的step2其次我们必须证明两个频率最小的字符 α和β必然是两个最深的节点step3然后我们再证明在相同深度上任意两个节点处的字符可以交换而不影响最优性这说明总可以找到一颗树它含有两个最不经常出现的符号作为兄弟 2.4该算法是贪婪算法的原因在于在每一阶段我们都进行一次合并而没有进行全局的考虑我们只是选择两颗最小的树 2.5 如何实现 method1如果我们依权排序将这些树保存在一个优先队列中那么由于对元素个数不超过C的优先队列将进行一次 buildHeap 2C -2 次 deleteMin 和 C-2 次insert 故运行时间为 OClogC。 method2使用一个链表简单实现该队列将给出一个OC^2算法Conclusion 优先队列实现方法的选择取决于C有多大在ASCII 字符集下C是足够小的这使得二次运行时间是可以接收的。在这样的应用中实际上几乎所有的运行时间都将花费在读入输入文件和写出压缩文件所需要的磁盘I/O 操作上 2.6有两个细节要考虑details d1第一个问题是首先在压缩文件的开头必须传送编码信息因为否则将不可能译码对于一些小文件传送编码信息表的代价将超过压缩带来的任何可能的节省最后的结果很可能是文件扩大。当然这可以检测到且原文件可以原样保留而对于大型文件信息表的大小是无关紧要的d2第二个问题是该算法是一个两趟扫描算法。第一遍搜集频率数据第二遍进行编码。显然对于处理大型文件的程序来说这个性质不是我们所需要的【3】source code printing results 3.1download source code https://github.com/pacosonTang/dataStructure-algorithmAnalysis/tree/master/chapter10/p266_huffman 3.2source code at a glancefor complete code , please click the given link above 1st func: building huffman tree // building huffman tree void buildHuffman() { ElementTypePtr temp; char* codes;int off;off 0;codes buildCharArray(off1);temp buildElement(); initElement(temp);while(!isEmpty(bh)){ insertHeap(*temp, bh); initElement(temp);} temp-code \0;printf(\n the huffman tree we built just now is follows: \n);printHuffmanTree(temp, 1);printf(\n the huffman codes of left subtree \n);printHuffmanCode(temp-left, 1, off, codes);printf(\n the huffman codes of right subtree \n);printHuffmanCode(temp-right, 1, off, codes); } 2nd func: print huffman tree node void copyCharArray(char *a, char *b, int size) {int i;for(i0; isize; i)a[i] b[i]; }void printHuffmanTree(ElementTypePtr root, int depth) { int i;if(root) { for(i 0; i depth; i)printf( ); if(root-left!NULL) printf(%d\n, root-key); elseprintf(%d-%c\n, root-key, root-flag);printHuffmanTree(root-left,depth1); printHuffmanTree(root-right, depth1); // Attention: theres difference between traversing binary tree and common tree }else {for(i 0; i depth; i)printf( ); printf(NULL\n);} } 3rd func: print huffman code of every node void printHuffmanCode(ElementTypePtr root, int depth, int off, char *codes) { int i; char *innerCode buildCharArray(off2); copyCharArray(innerCode, codes, off);if(root) { innerCode[off] root-code;innerCode[off] \0; for(i 0; i depth; i)printf( ); if(root-left!NULL) printf(%d\n, root-key); elseprintf(%d-%c-%s\n, root-key, root-flag, innerCode);printHuffmanCode(root-left,depth1, off, innerCode); printHuffmanCode(root-right, depth1, off, innerCode); // Attention: theres difference between traversing binary tree and common tree }else {for(i 0; i depth; i)printf( ); printf(NULL\n);} }3.3printing results

查看全文

http://www.zqtcl.cn/news/889896/