网站做多宽,拍卖网站咋做,重庆市建设网站首页,教学类网站怎么做Bag-of-words词袋模型最初被用在信息检索领域。例如检索一篇文档#xff0c;只需考虑文档中出现单词的频率#xff0c;而不用考虑语法语序等。在图像领域#xff0c;如果把一幅图像当作文档#xff0c;图像中的图像块的特征向量视为文档内的词#xff0c;BoW在图像领域也可…Bag-of-words词袋模型最初被用在信息检索领域。例如检索一篇文档只需考虑文档中出现单词的频率而不用考虑语法语序等。在图像领域如果把一幅图像当作文档图像中的图像块的特征向量视为文档内的词BoW在图像领域也可以取得很好的效果。这个过程可以分为几步提取特征训练虚拟词表量化特征用虚拟词频表示图片。
1、特征提取
检测图像块归一化图像块用SIFT描述器表示2、训练虚拟词表
通过聚类k-means的方法把所有SIFT表示的特征归为几类这些归类的特征可视为虚拟词表visual vocabulary。
每一个归类的特征cluster center被称为虚拟词visual word然后量化特征。 3、用词频表表示图片
统计图像中每个词在图像中出现的频率用频率直方图表示。 4、BoW在图像检索中的应用
4.1 构建数据库
提取数据库图像的特征向量训练所有图像的词表计算每一个词的权重创建词-图的映射
4.2 TF-IDFterm frequency-inverse document frequency权重
单词 j 的IDF逆文本频率计算公式 单词 j 的TF词频计算公式 单词 j 的TF-IDF计算公式 TF-IDF的值越大说明这个词也重要也就是关键词。
4.3 创建词-图映射
把词映射到文档 5、图像的空间金字塔Spatial pyramid
计算每一块的直方图 计算金字塔图的每一个小区域的直方图 把金字塔和直方图结合在一起进行比较判断匹配项