半导体网站建设,aso.net 网站开发,门户网站制作方法,网络热词有哪些0. 说明#xff1a;
从 Hugging Face 上下手动载预训练的蛋白质语言模型#xff08;以ProstT5为例#xff09;#xff0c;用模型中的 encoder 部分对蛋白质进行编码#xff0c;得到 embedding features#xff0c;用于下游的任务。
【ps. 除了手动下载之外#xff0c;…0. 说明
从 Hugging Face 上下手动载预训练的蛋白质语言模型以ProstT5为例用模型中的 encoder 部分对蛋白质进行编码得到 embedding features用于下游的任务。
【ps. 除了手动下载之外还可以用其他的下载方式详情可见 https://zhuanlan.zhihu.com/p/663712983】 【ps. 如果是自动下载默认下载位置在 ~/.cache/huggingface/】
1. 手动下载与训练模型
直接从 Hugging Face 网站上下载所有的文件如下图所示以 ProstT5 为例URL https://huggingface.co/Rostlab/prot_t5_xl_half_uniref50-enc/tree/main 2. 将下载的预训练模型保存到服务器并加载模型
将上述所有文件放到一个文件夹中然后上传到服务器上。
加载模型的时候直接将路径放到T5Tokenizer.from_pretrained()和T5EncoderModel.from_pretrained()中的第一个参数位置即可。
3. 关于模型的使用可以见 Hugging Face 上提供的案例
PS. 如果有其他问题会更新本文 . . .
参考:
[1]. https://zhuanlan.zhihu.com/p/663712983