当前位置: 首页 > news >正文

外贸网站平台是不是很难做二手网站建设方案

外贸网站平台是不是很难做,二手网站建设方案,常州网站制作推广,网站搭建玩要多长时间文章目录 关于 xinference使用1、启动 xinference设置其他参数 2、加载模型3、模型交互 其它报错处理 - transformer.wte.weight 关于 xinference Xorbits Inference#xff08;Xinference#xff09;是一个性能强大且功能全面的分布式推理框架。 可用于大语言模型#xff… 文章目录 关于 xinference使用1、启动 xinference设置其他参数 2、加载模型3、模型交互 其它报错处理 - transformer.wte.weight 关于 xinference Xorbits InferenceXinference是一个性能强大且功能全面的分布式推理框架。 可用于大语言模型LLM语音识别模型多模态模型等各种模型的推理。 通过 Xorbits Inference你可以轻松地一键部署你自己的模型或内置的前沿开源模型。 无论你是研究者开发者或是数据科学家都可以通过 Xorbits Inference 与最前沿的 AI 模型发掘更多可能。 github : https://github.com/xorbitsai/inference文档 https://github.com/xorbitsai/inference/blob/main/README_zh_CN.md https://inference.readthedocs.io/zh-cn/latest/getting_started/using_xinference.html 使用 1、启动 xinference xinference-local -H 0.0.0.0 -p 8094设置其他参数 Xinference 也允许从其他模型托管平台下载模型。可以通过在拉起 Xinference 时指定环境变量比如如果想要从 ModelScope 中下载模型可以使用如下命令 XINFERENCE_MODEL_SRCmodelscope xinference-local --host 0.0.0.0 --port 8094 xinference 缓存地址~/.xinference/cache 模型缓存地址我使用 modelscope 下载模型被缓存到 ~/.cache/modelscope/hub/qwen/Qwen-7B-Chat 2、加载模型 搜索点击 chat model 设置参数然后点击 飞机 来加载模型 如果你的第1个cuda 被占用又设置 N-GPU 为 auto可能会报如下错误 Server error: 400 - [address0.0.0.0:46785, pid12000] Some modules are dispatched on the CPU or the disk. Make sure you have enough GPU RAM to fit the quantized model. If you want to dispatch the model on the CPU or the disk while keeping these modules in 32-bit, you need to set load_in_8bit_fp32_cpu_offloadTrue and pass a custom device_map to from_pretrained. Check https://huggingface.co/docs/transformers/main/en/main_classes/quantization#offload-between-cpu-and-gpu for more details. 将 N-GPU 设置为 可用的cuda 就好 可以在 Running Models 中看到刚调起来的模型 3、模型交互 没有交互的 UI 界面你可以使用代码进行交互 以下代码来自https://inference.readthedocs.io/zh-cn/latest/index.html client Client(http://localhost:8094) model client.get_model(qwen-chat) # 填入上面的 model id # xinference.client.restful.restful_client.RESTfulChatModelHandle object at 0x7f203fb8e050# Chat to LLM model.chat(promptWhat is the largest animal?,system_promptYou are a helpful assistant,generate_config{max_tokens: 1024} )得到 {id: chat744c3bf4-e5e3-11ee-8014-ac1f6b206f62,object: chat.completion,created: 1710847556,model: qwen-chat,choices: [{index: 0,message: {role: assistant,content: The largest animal on Earth is the blue whale, which can grow up to 100 feet (30 meters) in length and weigh as much as 200 tons (90 metric tonnes). It has the biggest brain of any living creature, with an estimated volume of around 70 cubic feet (26 liters). The blue whale also has one of the strongest voices in the world, capable of producing a loud noise that can be heard over 5 miles (8 kilometers) away.},finish_reason: stop}],usage: {prompt_tokens: 24,completion_tokens: 103,total_tokens: 127} }其它 报错处理 - transformer.wte.weight KeyError: [address0.0.0.0:41435, pid40327] ‘transformer.wte.weight’ 如果出现这个错误可以检查下 cuda 是否能正常被 torch 调用 python -c import torch; print(torch.cuda.is_available())伊织 2024-03-19二
http://www.zqtcl.cn/news/193457/

相关文章:

  • 浙江虎霸建设机械有限公司网站哪个网站做简历好
  • 网站做电商资质吗网站开发作品
  • 大型彩灯制作公司临清聊城网站优化
  • 网站建设灬金手指下拉十五网络运维工程师简历怎么写
  • 黄岛建设局网站动漫采集WordPress
  • 做网站现在挣钱吗wordpress 网址导航主题
  • 外贸网站什么采集wordpress主题更换logo
  • 唐山开发网站的公司长沙营销型网站设计
  • 数据库策略网站推广的有效方法有美辰网站建设
  • c 网站开发构想做网站的点子
  • 个人网站模板下载提供网站建设备案公司
  • 做网站需要会写代码6山东东营
  • 兼职刷客在哪个网站做网站搬家数据库配置
  • 做搬运的话哪个网站好网站模板建站
  • 建设个人信息网站wordpress 用户权限
  • 网站不显示域名解析错误怎么办公益网站设计
  • 怎么上传网站图片的链接手表网站排行榜
  • 网站推广方法100种百度排名规则
  • 上海专业网站建设公司站霸网络萝岗区网站建设推广
  • 做微商网站的公司永久免费crm管理系统
  • 网站开发的环境专业的建设网站
  • 公司网站建设知识注册网站备案
  • 营销型网站建设申请域名在域名做网站
  • 电商网站设计公司立找亿企邦山东德州网站建设哪家最好
  • 免费自建网站工具网站建设公司那个好
  • wordpress集成环境搭建短视频优化
  • 做网站一般把宽度做多少中国企业报集团官网
  • 什么软件可以建网站网站建设应该计入什么费用
  • 网站制作 手机版重庆网站建设mswzjs
  • 网站建设犀牛云品牌建设方案和思路