当前位置: 首页 > news >正文

在线教育网站建设公司从零开始做网站数据库

在线教育网站建设公司,从零开始做网站数据库,设计之家广告设计,网页设计期末作品源代码Similarities#xff1a;精准相似度计算与语义匹配搜索工具包#xff0c;多维度实现多种算法#xff0c;覆盖文本、图像等领域#xff0c;支持文搜、图搜文、图搜图匹配搜索 Similarities 相似度计算、语义匹配搜索工具包#xff0c;实现了多种相似度计算、匹配搜索算法精准相似度计算与语义匹配搜索工具包多维度实现多种算法覆盖文本、图像等领域支持文搜、图搜文、图搜图匹配搜索 Similarities 相似度计算、语义匹配搜索工具包实现了多种相似度计算、匹配搜索算法支持文本、图像等。 1. 文本相似度计算文本匹配 余弦相似Cosine Similarity两向量求余弦点积Dot Product两向量归一化后求内积汉明距离Hamming Distance编辑距离Levenshtein Distance欧氏距离Euclidean Distance曼哈顿距离Manhattan Distance等 语义模型 CoSENT文本匹配模型【推荐】BERT模型文本向量表征SentenceBERT文本匹配模型 字面模型 Word2Vec文本浅层语义表征【推荐】同义词词林知网Hownet义原匹配BM25、RankBM25TFIDFSimHash 2.图像相似度计算图像匹配 语义模型 CLIP(Contrastive Language-Image Pre-Training)VGG(doing)ResNet(doing) 特征提取 pHash【推荐】, dHash, wHash, aHashSIFT, Scale Invariant Feature Transform(SIFT)SURF, Speeded Up Robust Features(SURF)(doing) 3.图文相似度计算 CLIP(Contrastive Language-Image Pre-Training) 4.匹配搜索 SemanticSearch向量相似检索使用Cosine Similarty topk高效计算比一对一暴力计算快一个数量级 6.Demo展示 Compute similarity score Demo: https://huggingface.co/spaces/shibing624/text2vec Semantic Search Demo: https://huggingface.co/spaces/shibing624/similarities 6.1 中文文本匹配模型评测结果 ModelATECBQLCQMCPAWSXSTS-BAvgQPSWord2Vec20.0031.4959.462.5755.7833.8610283SBERT-multi18.4238.5263.9610.1478.9041.992371Text2vec31.9342.6770.1617.2179.3048.252572 结果值使用spearman系数 Model: CilinHownetSimHashTFIDF Install pip3 install torch # conda install pytorch pip3 install -U similaritiesor git clone https://github.com/shibing624/similarities.git cd similarities python3 setup.py install7.使用场景推荐 7.1. 文本语义相似度计算 example: examples/text_similarity_demo.py from similarities import Similaritym Similarity() r m.similarity(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(fsimilarity score: {float(r)}) # similarity score: 0.855146050453186Similarity的默认方法 Similarity(corpus: Union[List[str], Dict[str, str]] None, model_name_or_pathshibing624/text2vec-base-chinese,max_seq_length128)返回值余弦值score范围是[-1, 1]值越大越相似corpus搜索用的doc集仅搜索时需要输入格式句子列表List[str]或者{corpus_id: sentence}的Dict[str, str]格式model_name_or_path模型名称或者模型路径默认会从HF model hub下载并使用中文语义匹配模型shibing624/text2vec-base-chinese如果是多语言景可以替换为多语言匹配模型shibing624/text2vec-base-multilingualmax_seq_length输入句子的最大长度最大为匹配模型支持的最大长度BERT系列是512 7.2. 文本语义匹配搜索 一般在文档候选集中找与query最相似的文本常用于QA场景的问句相似匹配、文本相似检索等任务。 example: examples/text_semantic_search_demo.py import syssys.path.append(..) from similarities import Similarity#1.Compute cosine similarity between two sentences. sentences [如何更换花呗绑定银行卡,花呗更改绑定银行卡] corpus [花呗更改绑定银行卡,我什么时候开通了花呗,俄罗斯警告乌克兰反对欧盟协议,暴风雨掩埋了东北部新泽西16英寸的降雪,中央情报局局长访问以色列叙利亚会谈,人在巴基斯坦基地的炸弹袭击中丧生, ] model Similarity(model_name_or_pathshibing624/text2vec-base-chinese) print(model) similarity_score model.similarity(sentences[0], sentences[1]) print(f{sentences[0]} vs {sentences[1]}, score: {float(similarity_score):.4f})print(- * 50 \n) #2.Compute similarity between two list similarity_scores model.similarity(sentences, corpus) print(similarity_scores.numpy()) for i in range(len(sentences)):for j in range(len(corpus)):print(f{sentences[i]} vs {corpus[j]}, score: {similarity_scores.numpy()[i][j]:.4f})print(- * 50 \n) #3.Semantic Search model.add_corpus(corpus) res model.most_similar(queriessentences, topn3) print(res) for q_id, c in res.items():print(query:, sentences[q_id])print(search top 3:)for corpus_id, s in c.items():print(f\t{model.corpus[corpus_id]}: {s:.4f})output: 如何更换花呗绑定银行卡 vs 花呗更改绑定银行卡, score: 0.8551 ...如何更换花呗绑定银行卡 vs 花呗更改绑定银行卡, score: 0.8551 如何更换花呗绑定银行卡 vs 我什么时候开通了花呗, score: 0.7212 如何更换花呗绑定银行卡 vs 俄罗斯警告乌克兰反对欧盟协议, score: 0.1450 如何更换花呗绑定银行卡 vs 暴风雨掩埋了东北部新泽西16英寸的降雪, score: 0.2167 如何更换花呗绑定银行卡 vs 中央情报局局长访问以色列叙利亚会谈, score: 0.2517 如何更换花呗绑定银行卡 vs 人在巴基斯坦基地的炸弹袭击中丧生, score: 0.0809 花呗更改绑定银行卡 vs 花呗更改绑定银行卡, score: 1.0000 花呗更改绑定银行卡 vs 我什么时候开通了花呗, score: 0.6807 花呗更改绑定银行卡 vs 俄罗斯警告乌克兰反对欧盟协议, score: 0.1714 花呗更改绑定银行卡 vs 暴风雨掩埋了东北部新泽西16英寸的降雪, score: 0.2162 花呗更改绑定银行卡 vs 中央情报局局长访问以色列叙利亚会谈, score: 0.2728 花呗更改绑定银行卡 vs 人在巴基斯坦基地的炸弹袭击中丧生, score: 0.1279query: 如何更换花呗绑定银行卡 search top 3:花呗更改绑定银行卡: 0.8551我什么时候开通了花呗: 0.7212中央情报局局长访问以色列叙利亚会谈: 0.2517余弦score的值范围[-1, 1]值越大表示该query与corpus的文本越相似。 7.2.1 多语言文本语义相似度计算和匹配搜索 多语言包括中、英、韩、日、德、意等多国语言 example: examples/text_semantic_search_multilingual_demo.py 7.3. 快速近似文本语义匹配搜索 支持Annoy、Hnswlib的近似语义匹配搜索常用于百万数据集的匹配搜索任务。 example: examples/fast_text_semantic_search_demo.py 7.4. 基于字面的文本相似度计算和匹配搜索 支持同义词词林Cilin、知网Hownet、词向量WordEmbedding、Tfidf、SimHash、BM25等算法的相似度计算和字面匹配搜索常用于文本匹配冷启动。 example: examples/literal_text_semantic_search_demo.py from similarities import SimHashSimilarity, TfidfSimilarity, BM25Similarity, \WordEmbeddingSimilarity, CilinSimilarity, HownetSimilaritytext1 如何更换花呗绑定银行卡 text2 花呗更改绑定银行卡corpus [花呗更改绑定银行卡,我什么时候开通了花呗,俄罗斯警告乌克兰反对欧盟协议,暴风雨掩埋了东北部新泽西16英寸的降雪,中央情报局局长访问以色列叙利亚会谈,人在巴基斯坦基地的炸弹袭击中丧生, ]queries [我的花呗开通了,乌克兰被俄罗斯警告 ] m TfidfSimilarity() print(text1, text2, sim score: , m.similarity(text1, text2))m.add_corpus(corpus) res m.most_similar(queries, topn3) print(sim search: , res) for q_id, c in res.items():print(query:, queries[q_id])print(search top 3:)for corpus_id, s in c.items():print(f\t{m.corpus[corpus_id]}: {s:.4f})output: 如何更换花呗绑定银行卡 花呗更改绑定银行卡 sim score: 0.8203384355246909sim search: {0: {2: 0.9999999403953552, 1: 0.43930041790008545, 0: 0.0}, 1: {0: 0.7380483150482178, 1: 0.0, 2: 0.0}} query: 我的花呗开通了 search top 3:我什么时候开通了花呗: 1.0000花呗更改绑定银行卡: 0.4393俄罗斯警告乌克兰反对欧盟协议: 0.0000 ...7.5. 图像相似度计算和匹配搜索 支持CLIP、pHash、SIFT等算法的图像相似度计算和匹配搜索。 example: examples/image_semantic_search_demo.py import sys import glob from PIL import Imagesys.path.append(..) from similarities import ImageHashSimilarity, SiftSimilarity, ClipSimilaritydef sim_and_search(m):print(m)# similaritysim_scores m.similarity(imgs1, imgs2)print(sim scores: , sim_scores)for (idx, i), j in zip(enumerate(image_fps1), image_fps2):s sim_scores[idx] if isinstance(sim_scores, list) else sim_scores[idx][idx]print(f{i} vs {j}, score: {s:.4f})# searchm.add_corpus(corpus_imgs)queries imgs1res m.most_similar(queries, topn3)print(sim search: , res)for q_id, c in res.items():print(query:, image_fps1[q_id])print(search top 3:)for corpus_id, s in c.items():print(f\t{m.corpus[corpus_id].filename}: {s:.4f})print(- * 50 \n)image_fps1 [data/image1.png, data/image3.png] image_fps2 [data/image12-like-image1.png, data/image10.png] imgs1 [Image.open(i) for i in image_fps1] imgs2 [Image.open(i) for i in image_fps2] corpus_fps glob.glob(data/*.jpg) glob.glob(data/*.png) corpus_imgs [Image.open(i) for i in corpus_fps]#2.image and image similarity score sim_and_search(ClipSimilarity()) # the best result sim_and_search(ImageHashSimilarity(hash_functionphash)) sim_and_search(SiftSimilarity())output: Similarity: ClipSimilarity, matching_model: CLIPModel sim scores: tensor([[0.9580, 0.8654],[0.6558, 0.6145]])data/image1.png vs data/image12-like-image1.png, score: 0.9580 data/image3.png vs data/image10.png, score: 0.6145sim search: {0: {6: 0.9999999403953552, 0: 0.9579654932022095, 4: 0.9326782822608948}, 1: {8: 0.9999997615814209, 4: 0.6729235649108887, 0: 0.6558331847190857}}query: data/image1.png search top 3:data/image1.png: 1.0000data/image12-like-image1.png: 0.9580data/image8-like-image1.png: 0.93277.6. 图文互搜 CLIP 模型不仅支持以图搜图还支持中英文图文互搜 import sys import glob from PIL import Image sys.path.append(..) from similarities import ImageHashSimilarity, SiftSimilarity, ClipSimilaritym ClipSimilarity() print(m) #similarity score between text and image image_fps [data/image3.png, # yellow flower imagedata/image1.png] # tiger image texts [a yellow flower, 老虎] imgs [Image.open(i) for i in image_fps] sim_scores m.similarity(imgs, texts)print(sim scores: , sim_scores) for (idx, i), j in zip(enumerate(image_fps), texts):s sim_scores[idx][idx]print(f{i} vs {j}, score: {s:.4f})output: sim scores: tensor([[0.3220, 0.2409],[0.1677, 0.2959]]) data/image3.png vs a yellow flower, score: 0.3220 data/image1.png vs 老虎, score: 0.2112参考链接:https://github.com/shibing624/similarities 如果github进入不了也可进入 https://download.csdn.net/download/sinat_39620217/88205346 免费下载相关资料
http://www.zqtcl.cn/news/294226/

相关文章:

  • 网站建设费用计入哪个科目深圳网站建设工资
  • 大岭山镇网站建设公司软文是什么文章
  • 网站正在建设张雪峰谈电子商务
  • 网站建设中标签导航的特征小型广告公司简介
  • 广西省建设厅网站jquery特效网站
  • 做推文的网站创意设计绘画作品
  • 做响应式网站的体会长沙域名注册公司
  • 网站备案照片 多少钱网站怎么做网页游戏
  • 金坛区建设局网站中搜网站提交
  • 建站之星如何建网站html静态网页作业成品
  • 商城类网站用什么做珠海找工作哪个网站好
  • 宁波建站模板厂家太原企业网站排名
  • 厦门网站建设定制多少钱wordpress能用一个数据库
  • 找人做网站需要准备什么材料怎么建设自己淘宝网站首页
  • 汽车网站建设费用js怎么做网站
  • 四川万景建设工程有限公司网站做公司网站用什么系统
  • 长沙企业建站系统3d视频制作公司
  • 长沙的网站制作公司网站建设方案的需求分析
  • 电子商务网站发展建设论文网站开发需要经过的几个主要阶段
  • 建设网站外贸做网站必须会php吗
  • 网站建设费用的请示丹徒区建设局网站
  • 上海网站制作机构个人做外贸网站违法吗
  • 咖啡厅网站开发目标汕头最新消息今天
  • 广州做外贸网站的公司简介做行业门户网站注意什么
  • 专业网页网站设计图书成都医院做网站建设
  • 浙江网站建设dyfwzx网站开发的广告词
  • 网站 seo 优化 效果中华室内设计网公众号下载
  • 如何自己建网站企业网站建站快车的优点
  • 目前做网站的公司有哪些管理系统中的计算机应用
  • 百度网站服务器企业网站报价