当前位置: 首页 > news >正文

RTX5060TI 配置Xinference

RTX5060TI 配置Xinference

CUDA

(llama-factory) D:\P\llm\LLaMA-Factory>nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Wed_Apr__9_19:29:17_Pacific_Daylight_Time_2025
Cuda compilation tools, release 12.9, V12.9.41
Build cuda_12.9.r12.9/compiler.35813241_0(llama-factory) D:\P\llm\LLaMA-Factory>nvidia-smi
Thu Oct 23 15:24:02 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 576.88                 Driver Version: 576.88         CUDA Version: 12.9     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                  Driver-Model | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 5060 Ti   WDDM  |   00000000:01:00.0  On |                  N/A |
|  0%   38C    P0             24W /  180W |    2728MiB /  16311MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

配置环境和安装依赖

conda create -n Xinference python=3.10.14
conda activate Xinference
pip install "xinference[all]"
pip uninstall torch torchvision torchaudio -y
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu128 --no-deps

下载模型

在这个网站自助 https://modelscope.cn/

运行Xinference

windows不支持0.0.0.需要使用127.0.0.1 ip的方式

xinference-local --host 0.0.0.0 --port 9997

xinference-local --host 127.0.0.1 --port 9997

Windows下启动Xinference报错 RuntimeError: Cluster is not available after multiple attempts-CSDN博客

http://www.gsyq.cn/news/28491.html

相关文章:

  • js函数声明和函数表达式的理解
  • P13382 解题报告
  • 免费搜索下载ICON图标的网站
  • 6ES7592-1BM00-0XA0 32路dq接线端子
  • Excel 实现下拉多选功能
  • CodeForces-1620D Exact Change
  • Python爬虫:获取某平台数据的下载链接 - 指南
  • 厨房电子秤芯片方案:SIC8632
  • 贡献法算法思维
  • 让cherry studio访问使用Docket Desktop中的Docker Model Runner运行的模型
  • SQL SERVER死锁查询,死锁分析,解锁,查询占用
  • DolphinScheduler依赖机制、Open-Falcon告警推送与监控的优化实践
  • centos7 安装mysql5.7
  • 监控系统搭建集成实例
  • verilog - 指南
  • 2025 年集装箱拖车供应厂家最新推荐榜,技术实力与市场口碑深度解析助力企业选品
  • Windows Server 2022 中文版、英文版下载 (2025 年 10 月更新)
  • 深入解析:软考系统架构设计师知识点-软件可靠性基础
  • Windows Server 2019 中文版、英文版下载 (2025 年 10 月更新)
  • Windows 7 Windows Server 2008 R2 简体中文版下载 (2025 年 10 月更新)
  • 20 万奖金池就位!Higress AI 网关开发挑战赛参赛指南
  • 10.17 NOIP 模拟赛 T2. 箱思客
  • Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
  • 2025 最新瓷砖厂家推荐榜:精选绿色创新与优质服务品牌,助力家装工程选购不踩坑
  • 零样本学习(Zero-Shot Learning‌)
  • docker 创建私有仓库
  • 视频汇聚平台EasyCVR如何构建智慧农业监控监管系统? - 实践
  • 2025-10-23 在游戏开发领域中,cocos是什么,有什么用,对于前端而言如何入手,和其它的游戏引擎的区别是什么,优缺点是什么
  • 上传图片后图片加载失败,或因后台ftp传输共享目录延迟导致获取不到
  • 劳务工招聘助手小程序管理系统:革新劳务招聘管理的高效解决方案