当前位置: 首页 > news >正文

【vLLM 学习】Reproduciblity

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →vllm.hyper.ai/

*在线运行 vLLM 入门教程:零基础分步指南

源码 examples/offline_inference/reproduciblity.py

# SPDX-License-Identifier: Apache-2.0importos from vllmimportLLM, SamplingParams# 为了性能考虑,vllm 不能保证结果的默认情况下可重复性,# 您需要做以下事情才能实现# 可复现结果:# 1.关闭多处理以使计划确定性。# Note (Woosuk) :这是不需要的,对于 V0而言,这将被忽略。os.environ["VLLM_ENABLE_V1_MULTIPROCESSING"]="0"# 2.修复五十年据种子以获得可重复性。默认种子为 None,不可复现。SEED=42# Note (Woosuk) :即使使用上述两个设置,vLLM 也仅提供# 当它在相同的硬件和相同的 vLLM 版本上运行时,它的可重复性。# 此外,在线服务 API ( "vLLM 服务") 不支持可重复性# 因为几乎不可能在在线服务设置。llm=LLM(model="facebook/opt-125m",seed=SEED)prompts=["Hello, my name is","The president of the United States is","The capital of France is","The future of AI is",]sampling_params=SamplingParams(temperature=0.8,top_p=0.95)outputs=llm.generate(prompts, sampling_params)foroutputinoutputs: prompt=output.prompt generated_text=output.outputs[0].text print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
http://www.gsyq.cn/news/181889.html

相关文章:

  • 华为OD机试双机位C卷 - 魔法收积木 (C++ Python JAVA JS GO)
  • PyTorch自定义算子开发环境搭建:Miniconda-Python3.9指南
  • 「地质约束显式+数据驱动模型」的新路径,浙江大学团队实现跨区域矿产远景预测性能和可解释性提升
  • PyTorch批处理任务调度:Miniconda-Python3.9环境自动化脚本
  • Miniconda-Python3.9环境下实现PyTorch模型差分隐私训练
  • 吃透可编程控制器,可编程控制器基本知识介绍
  • Mac M1芯片适配:Miniconda-Python3.9安装PyTorch ARM版本
  • PyTorch模型注册中心对接:Miniconda-Python3.9环境准备
  • Miniconda-Python3.9环境下实现PyTorch服务熔断与降级
  • Miniconda-Python3.9是否支持PyTorch 2.x最新特性体验?
  • Java锁相关概念的简单理解
  • Miniconda-Python3.9环境下使用PyTorch进行张量运算测试
  • 揭秘背后真相:为何大厂都在秘密布局AI Agent?普通人如何以低成本加入这场科技革命
  • Qt QPointer 快速入门
  • Miniconda-Python3.9环境下实现PyTorch模型公平性检测流程
  • Miniconda-Python3.9环境下实现PyTorch模型安全沙箱运行
  • PyTorch可信执行环境(TEE)实验:Miniconda-Python3.9准备
  • PyTorch官方安装命令在Miniconda-Python3.9中的实际应用
  • Miniconda-Python3.9如何支持PyTorch与Airflow工作流集成
  • Miniconda-Python3.9环境下监控PyTorch GPU显存使用情况
  • COMSOL 使用-后续测试
  • k8s1.29.15+containerd搭建集群
  • Java 拦截器 2025 终极指南:从入门到“卷死”同事
  • 算法题 链表的中间结点
  • 使用Miniconda-Python3.9同时运行不同版本PyTorch项目
  • CUDA occupancy calculator:Miniconda-Python3.9计算最优block大小
  • 发稿渠道哪家公司效果更可靠?2025年终7家服务商横向评测及最终推荐! - 十大品牌推荐
  • 贪心算法专题(十一):一箭双雕的快乐——「用最少数量的箭引爆气球」
  • 一次拿下 Web Dynpro ABAP 运行时全景:用 IF_WD_APPLICATION 把应用信息、启动环境、客户端能力都摸清
  • 企业宣传软文公司哪家效果靠谱?2025年终7家服务商权威测评与最终推荐! - 十大品牌推荐