当前位置: 首页 > news >正文

物流网站模板免费辽宁建设工程信息网签章

物流网站模板免费,辽宁建设工程信息网签章,邢台县建设局网站,网站建设公司的年报Day03 词法分析作业辅导 本教程旨在辅导同学如何完成 AI Studio课程——『NLP打卡营』实践课3#xff1a;使用预训练模型实现快递单信息抽取 课后作业。 1. 更换预训练模型 在PaddleNLP Transformer API查询PaddleNLP所支持的Transformer预训练模型。选择其中一个模型…Day03 词法分析作业辅导 本教程旨在辅导同学如何完成 AI Studio课程——『NLP打卡营』实践课3使用预训练模型实现快递单信息抽取 课后作业。 1. 更换预训练模型 在PaddleNLP Transformer API查询PaddleNLP所支持的Transformer预训练模型。选择其中一个模型如bert-base-chinese只需将代码中的 from paddlenlp.transformers import ErnieTokenizer, ErnieForTokenClassificationmodel ErnieForTokenClassification.from_pretrained(ernie-1.0, num_classeslen(label_vocab)) tokenizer ErnieTokenizer.from_pretrained(ernie-1.0)修改为 from paddlenlp.transformers import BertTokenizer, BertForTokenClassificationmodel BertForTokenClassification.from_pretrained(bert-base-chinese, num_classeslen(label_vocab)) tokenizer BertTokenizer.from_pretrained(bert-base-chinese)即可将预训练模型从ernie-1.0切换至bert-base-chinese。 2. 更换数据集 PaddleNLP集成了一系列序列标注数据集用户可以一键调用相应API快速下载调用相关数据集我们在这里选择其中MSRA_NER数据集将 def load_dataset(datafiles):def read(data_path):with open(data_path, r, encodingutf-8) as fp:next(fp) # Skip headerfor line in fp.readlines():words, labels line.strip(\n).split(\t)words words.split(\002)labels labels.split(\002)yield words, labelsif isinstance(datafiles, str):return MapDataset(list(read(datafiles)))elif isinstance(datafiles, list) or isinstance(datafiles, tuple):return [MapDataset(list(read(datafile))) for datafile in datafiles]# Create dataset, tokenizer and dataloader. train_ds, dev_ds, test_ds load_dataset(datafiles(./data/train.txt, ./data/dev.txt, ./data/test.txt))修改为 from paddlenlp.datasets import load_dataset# 由于MSRA_NER数据集没有dev dataset我们这里重复加载test dataset作为dev_ds train_ds, dev_ds, test_ds load_dataset(msra_ner, splits(train, test, test), lazyFalse)# 注意删除 label_vocab load_dict(./data/tag.dic) label_vocab {label:label_id for label_id, label in enumerate(train_ds.label_list)}2.1 适配数据集预处理 为了适配该数据集我们还需要修改数据预处理代码修改utils.py中的convert_example函数为 def convert_example(example, tokenizer, label_vocab, max_seq_len128):labels example[labels]example example[tokens]no_entity_id label_vocab[O]tokenized_input tokenizer(example,return_lengthTrue,is_split_into_wordsTrue,max_seq_lenmax_seq_len)# -2 for [CLS] and [SEP]if len(tokenized_input[input_ids]) - 2 len(labels):labels labels[:len(tokenized_input[input_ids]) - 2]tokenized_input[labels] [no_entity_id] labels [no_entity_id]tokenized_input[labels] [no_entity_id] * (len(tokenized_input[input_ids]) - len(tokenized_input[labels]))return tokenized_input[input_ids], tokenized_input[token_type_ids], tokenized_input[seq_len], tokenized_input[labels]2.2 适配数据集后处理 不同于快递单数据集MSRA_NER数据集的标注采用的是’BIO’在前的标注方式因此还需要修改utils.py中的parse_decodes函数为 def parse_decodes(ds, decodes, lens, label_vocab):decodes [x for batch in decodes for x in batch]lens [x for batch in lens for x in batch]id_label dict(zip(label_vocab.values(), label_vocab.keys()))outputs []for idx, end in enumerate(lens):sent ds.data[idx][tokens][:end]tags [id_label[x] for x in decodes[idx][1:end]]sent_out []tags_out []words for s, t in zip(sent, tags):if t.endswith(B-) or t O:if len(words):sent_out.append(words)if t.startswith(B-):tags_out.append(t.split(-)[1])else:tags_out.append(t)words selse:words sif len(sent_out) len(tags_out):sent_out.append(words)outputs.append(.join([str((s, t)) for s, t in zip(sent_out, tags_out)]))return outputs
http://www.zqtcl.cn/news/598447/

相关文章:

  • wordpress的别名获得页面的别名优化大师电视版
  • 怎么查网站关键词排名微信上的h5页面是怎么制作的
  • 如何为一个网站做app手机软件大全
  • 哪家网络公司做网站工信部网站原来是
  • json取数据做网站asp网站 模板
  • 漳州做网站多少钱乐清网红餐厅
  • 淮安网站开发sem推广案例
  • 义乌网站建设郭云砺信息科技做网站
  • 重庆御临建筑公司官网网站更换域名seo
  • 北京大兴专业网站建设公司wordpress 加速乐
  • win7怎么做网站域名绑定邯郸最新通知今天
  • 苏州企业网站设计开发个人 网站备案
  • 威海哪有网站建设中国建设部网站失信名单
  • 重庆哪家在做网站建设php网站后台验证码不显示
  • 开发网站开票写什么google收录查询
  • dw做的网站如何上传图片服务器配置wordpress
  • 恩施网站优化七牛云可以做网站的存储空间吗
  • 网站建设的源代码有什么作用网站维护包括哪些
  • 广东广东网站建设工作网站qq登录 开发
  • 中山网页网站设计模板access 数据库做网站
  • 阿里云网站做网站的服务器用什么系统
  • 什么公司做网站最好怎么给网站做快照
  • 官方网站建设的方法有哪些方面邮箱号码大全
  • 电商app软件山东网络推广优化排名
  • 国内产品网站w源码1688网站关键词描述字数
  • 网站404 模板wordpress 文字插件下载
  • 河南民基建设工程有限公司网站齐齐哈尔建设局网站首页
  • 响应式网站建设推荐乐云践新三丰云免费云服务器
  • 长沙网站建设模板uc浏览器访问网站
  • 擼擼擼做最好的导航网站陕西政务服务网注册公司流程