当前位置: 首页 > news >正文

怎么查询网站是什么时候做的湖南网站设计外包费用

怎么查询网站是什么时候做的,湖南网站设计外包费用,高埗镇做网站,北京海淀区开发导航的公司文章目录 1. 加载数据集2. 获取嵌入并保存以备将来使用 本笔记本提供了一个示例#xff0c;演示如何从大型数据集中获取嵌入。 1. 加载数据集 本示例使用的数据集是来自亚马逊的精细食品评论。该数据集包含截至2012年10月#xff0c;亚马逊用户留下的共568,454条食品评论。我… 文章目录 1. 加载数据集2. 获取嵌入并保存以备将来使用 本笔记本提供了一个示例演示如何从大型数据集中获取嵌入。 1. 加载数据集 本示例使用的数据集是来自亚马逊的精细食品评论。该数据集包含截至2012年10月亚马逊用户留下的共568,454条食品评论。我们将使用该数据集的一个子集包含最近的1,000条评论以说明目的。这些评论是用英语编写的倾向于是积极的或消极的。每个评论都有一个ProductId、UserId、Score、评论标题Summary和评论正文Text。 我们将把评论摘要和评论文本合并成一个单独的文本。模型将对这个合并的文本进行编码并输出一个单一的向量嵌入。 要运行这个笔记本您需要安装以下软件包pandas、openai、transformers、plotly、matplotlib、scikit-learn、torchtransformer dep、torchvision 和 scipy。 # 导入pandas和tiktoken模块 import pandas as pd import tiktoken# 导入自定义的get_embedding函数 from utils.embeddings_utils import get_embedding # 定义嵌入模型参数 embedding_model text-embedding-ada-002 # 定义嵌入编码方式 embedding_encoding cl100k_base # 这是text-embedding-ada-002的编码方式 # 定义最大标记数 max_tokens 8000 # text-embedding-ada-002的最大标记数为8191# 加载和检查数据集 input_datapath data/fine_food_reviews_1k.csv # 为了节省空间我们提供了一个经过预过滤的数据集 df pd.read_csv(input_datapath, index_col0) # 使用pandas库的read_csv函数读取csv文件并将第一列作为索引列 df df[[Time, ProductId, UserId, Score, Summary, Text]] # 选择数据集中的指定列 df df.dropna() # 删除包含缺失值的行 df[combined] ( # 创建一个新的列combined将Summary和Text两列的内容合并到一起Title: df.Summary.str.strip() ; Content: df.Text.str.strip() ) df.head(2) # 显示数据集的前两行数据TimeProductIdUserIdScoreSummaryTextcombined01351123200B003XPF9BOA3R7JR3FMEBXQB5where does one start...and stop... with a tre...Wanted to save some to bring to my Chicago fam...Title: where does one start...and stop... wit...11351123200B003JK537SA3JBPC3WFUT5ZP1Arrived in piecesNot pleased at all. When I opened the box, mos...Title: Arrived in pieces; Content: Not pleased... # subsample to 1k most recent reviews and remove samples that are too long # 将数据集抽样为最近的1000个评论并删除过长的样本top_n 1000 # 对数据集按照Time列进行排序然后取最后的2k个样本 df df.sort_values(Time).tail(top_n * 2) # first cut to first 2k entries, assuming less than half will be filtered out# 删除Time列 df.drop(Time, axis1, inplaceTrue)# 使用tiktoken库的get_encoding方法获取嵌入编码 encoding tiktoken.get_encoding(embedding_encoding)# 对于每个评论计算其编码后的token数量并将结果保存在新的列n_tokens中 df[n_tokens] df.combined.apply(lambda x: len(encoding.encode(x)))# 保留token数量不超过max_tokens的样本并取最后的top_n个样本 df df[df.n_tokens max_tokens].tail(top_n)# 返回数据集df的长度 len(df)10002. 获取嵌入并保存以备将来使用 # 确保您已按照README中的说明在环境中设置了API密钥https://github.com/openai/openai-python#usage# 这可能需要几分钟时间 # 将get_embedding函数应用于df的combined列并将结果存储在df的embedding列中 df[embedding] df.combined.apply(lambda x: get_embedding(x, modelembedding_model)) # 将df保存为CSV文件文件名为fine_food_reviews_with_embeddings_1k.csv df.to_csv(data/fine_food_reviews_with_embeddings_1k.csv)
http://www.zqtcl.cn/news/65498/

相关文章:

  • 上海 建网站网页美工设计教案网页元素设计
  • 济南一哥网站建设公司网站开发项目教程答案
  • 网站网页制作机构wordpress 小说插件
  • 成都网站建设公司湖南岚鸿建设银行网站为什么进不去
  • 做博客网站怎么赚钱吗建筑设计文字说明
  • 天津网站建设哪家做得好网站集约化建设的讲话
  • 南海网站制作公司扬州建设工程招聘信息网站
  • 赣州人才网赣州九一人才南昌seo数据监控
  • 西安建设局网站小孩把百度大搜是什么
  • 厦门专业的网站制作公司线上店免费推广的软件
  • 天津市工程建设项目报建网站网站建设具体步骤
  • 长宁专业网站制作公司什么是网站平台开发工具
  • 手机网站在线制作初级网站开发的自我推荐
  • 宁夏网站建设推广竞价托管多少钱
  • 做网站大家都找谁公司网站改版需要怎么做
  • 国际外贸网络交易平台黑帽seo论坛
  • 百度网站收录提交入口网站对于企业的好处
  • 18款免费软件app下载推荐长春seo推广外包
  • 网站导航栏图标贵阳网站制作 建设
  • wordpress搭建电影网站小程序api调用
  • 网站注册系统重庆网站建设技术托管
  • 北苑网站建设公司伍佰亿网站建设
  • 自己怎么做网址开网站石家庄网站建设价格低
  • 个人建站软件郑州网站建设找智巢
  • 深圳市建设交易网站WordPress 如何去域名授权
  • 做门户网站怎么赚钱运营推广网站建设
  • 做维修家具广告在哪个网站好柳州高端网站建设
  • 网站建设公司专业网站制作开发哪个网站做美食自媒体更好
  • 铜山区建设局局网站想给公司注册一个网站
  • 怎么仿一个复杂的网站普洱市网站建设