当前位置: 首页 > news >正文

CANN/GE LLM-DataDist CacheDesc API文档

# CacheDesc

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

函数功能

构造CacheDesc,通常在KvCacheManager的allocate_cache接口中作为参数类型使用。

函数原型

__init__(self, num_tensors: int, shape: Union[Tuple[int], List[int]], data_type: DataType, placement: Placement = Placement.DEVICE, batch_dim_index: int = 0, seq_len_dim_index: int = -1, kv_tensor_format: str = None)

参数说明

参数名称数据类型取值说明
num_tensorsintcache中tensor的个数。
shapeUnion[Tuple[int], List[int]]tensor的shape。
data_typeDataTypetensor的data type。
placementPlacement表示cache所在的设备类型。默认值Placement.DEVICE。
batch_dim_indexint表示shape中batch size所在维度。默认值0,表示在第0维。
seq_len_dim_indexint表示shape中seq_len所在维度。默认值-1,表示未配置。
kv_tensor_formatstr表示cache的format。

调用示例

from llm_datadist import CacheDesc cache_desc = CacheDesc(80, [4, 2048, 1, 128], DataType.DT_FLOAT16)

返回值

正常情况下返回CacheDesc的实例。

传入数据类型错误情况下会抛出TypeError或ValueError异常。

约束说明

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1632696.html

相关文章:

  • UniApp相关知识点整理
  • 10分钟掌握Touch WX单文件开发模式,告别传统四文件烦恼
  • PyTorch神经网络基础与实战:从FNN到RNN
  • SteamShutdown终极指南:让电脑在Steam下载完成后自动关闭
  • CANN PID控制性能指标
  • nwpu-cram之机器人编程:ROS基础与应用
  • MEGA_F 00000-2006-000-06 直线驱动器模块
  • Kronos股票预测AI:三分钟搭建你的智能投资大脑,准确率突破85%的终极方案
  • YOLOv8工业落地全流程:从网络解析到多平台部署实战
  • 新能源汽车热管理系统核心零部件及工作原理详解
  • PyMiniRacer异常处理全攻略:解析错误类型与调试技巧
  • 炉石传说加速器:用HsMod提升游戏效率300%的终极指南
  • Kimi Chat vs GPT-4o中文编程实测:从LeetCode到Django开发
  • BK7259 WiFi6音视频SoC:智能家居视频流处理技术解析
  • RTL8761BTV蓝牙双模芯片特性与应用解析
  • Gloom的Compose UI组件库:可复用UI组件开发实战
  • Gemini四款主力模型选型指南:从物理约束到工程落地
  • 如何快速上手LIII:零基础也能玩转的多平台BT下载工具
  • OpenClaw机械臂抓取系统:核心技术解析与应用实践
  • 昇腾/GE LLM数据分发分配缓存块API
  • Video2X终极指南:免费AI视频放大与帧率提升神器
  • eldarion-ajax与Bootstrap集成:构建响应式AJAX界面的完整教程
  • DeepSeek与豆包中文实测:办公学习场景下的AI应用选择指南
  • E-Hentai Downloader与其他工具对比:为什么选择这个高效下载方案
  • TVA:具身智能的动力引擎与能力底座(2)
  • Boss Show Time:5分钟掌握招聘时间先机,告别错过最新岗位的遗憾!
  • 如何在30分钟内开始你的DD奇幻冒险:dnd-tldr项目完全指南
  • CANN/cannbot-skills Ascend C算子白盒测试设计模板
  • Blazingly-fast AI聊天新纪元:开源免费应用chat0全面解析
  • 线性回归模型评估:5个核心指标(R²、MSE、MAE)的Python实现与解读