当前位置: 首页 > news >正文

CANN/GE NPU模型装饰器API文档

npu_model

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

函数功能

如果UDF部署在host侧,执行时数据需要从device拷贝到本地进行运算。对于PyTorch场景,如果计算全在device侧,输入输出也是在device侧,执行时数据需要从device拷贝到host,执行后PyTorch再将数据搬到device侧,影响执行性能,使用npu_model可以优化为不搬移数据(即直接下沉到device执行)的方式触发执行。

函数原型

装饰器@npu_model

参数说明

参数名称数据类型取值说明
optimize_levelint- 1:PyTorch场景下,通过UDF nn引擎完成输入输出数据下沉到device执行,默认值为1。
- 2:把PyTorch模型编译成图,直接作为nn模型导出,优化为npu模型加载执行,需要配合input_descs使用。 说明: 该配置项在修饰类的时候起作用,修饰函数不能配置。
input_descs[TensorDesc]当optimize_level=2时,用于表达torch导出成图的输入tensor描述,示例如下:
input_descs=[TensorDesc(dtype = df.DT_INT64, shape = [2,1,4]),TensorDesc(dtype =
df.DT_FLOAT, shape = [2,1,4])],
当shape中某一维度为负值,表示输入是动态的,通过npu_model最终会导出成动态图。
num_returnsint装饰器装饰函数时,用于表示函数的输出个数,不设置该参数时默认函数返回一个返回值。该参数与使用type annotations方式标识函数返回个数与类型的方式选择其一即可。
resourcesdict用于标识当前func需要的资源信息,支持memory、num_cpus和num_npus。memory单位为M; num_npus表示需要使用npu资源数量,为预留参数,当前仅支持1。例如:{"memory": 100, "num_cpus": 1, "num_npus": 1}
env_hook_funcfunction此钩子函数用于给用户自行扩展在Python UDF初始化之前必要的Python环境准备或import操作。
visible_device_enablebool开启后,UDF进程会根据用户配置num_npus资源自动设置ASCEND_RT_VISIBLE_DEVICES,调用get_running_device_id接口获取对应的逻辑ID,当前num_npus仅支持1,因此该场景下get_running_device_id结果为0。

返回值

正常场景下返回被装饰的函数。

异常情况下会抛出DfException异常。可以通过捕捉异常获取DfException中的error_code与message查看具体的错误码及错误信息。详细信息请参考DataFlow错误码。

调用示例

@df.npu_model(optimize_level=1) class FakeModel1(nn.Module): def __init__(self): super().__init__() # 模拟模型推理 @df.method() def forward(self, input_image): return F.interpolate(input_image, size=(256, 256), mode='bilinear') @df.npu_model(optimize_level=1, input_descs=[df.TensorDesc(dtype=df.DT_FLOAT, shape=[1, 3, 768, 768])]) class FakeModel2(nn.Module): def __init__(self): super().__init__() self.mean = 0.5 self.std = 0.5 # 模拟模型推理 @df.method() def forward(self, input_image): return (input_image - self.mean) / self.std @df.npu_model() def preprocess(input_image): # 模拟图片裁切 transform = transforms.Compose([transforms.CenterCrop(512)]) return transform(input_image) @df.npu_model() def postprocess(input_image): mean = 0.5 std = 0.5 img = input_image * std + mean return F.interpolate(img, size=(512, 512), mode='bilinear')

约束说明

  • 需安装对应Python版本的torch_npu包。
  • 输入输出必须为npu tensor。
  • 一组输入对应一组输出,不支持流式输入输出。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1558451.html

相关文章:

  • 模糊函数:信号时频分析与雷达波形设计的核心工具
  • SoundCleod深度解析:揭秘Electron框架下的SoundCloud桌面客户端技术实现
  • 如何快速掌握AI提示工程:开发者的完整实战指南
  • Django树形结构扩展:如何基于django-treenode定制复杂业务模型
  • Mac Intel本地部署龙虾AI(OpenClaw)实战指南
  • 5分钟快速上手:用Retrieval-based-Voice-Conversion-WebUI打造专属AI歌手
  • Angular Timer实战:构建电商秒杀倒计时组件终极指南 [特殊字符]
  • MC68HC908GR8 ADC模块深度解析:从原理到实战避坑指南
  • 深入解析ARM Cortex-M3微控制器架构与LPC13xx系列开发实践
  • 如何通过AionUi与OpenClaw集成打造你的专属AI办公助手
  • 3步解锁PS4潜力:PPPwn内核漏洞利用完全指南
  • 1688运营培训/店铺有流量却零询盘?1688运营培训拆解低转化真实原因
  • MI50在Linux下跑AI推理的完整实战指南:ROCm 6.2.1+Ubuntu 22.04适配手记
  • Seedance 2.0本地部署与视频生成工作流实战指南
  • 终极指南:Hermes WebUI - 构建企业级自托管AI助手管理平台
  • DeepSeek-Coder:让AI代码生成变得前所未有的简单
  • SneakerBot安全最佳实践:保护信用卡信息与API密钥的10个关键步骤 [特殊字符]️
  • 5分钟解锁你的QQ音乐:qmcdump开源解密工具让音乐重获自由
  • React-accessible-accordion样式定制完全教程:打造个性化手风琴UI
  • PingFangSC字体包:跨平台中文字体渲染的技术架构与实施指南
  • Sub2API+Codex中转站实战:构建高可用大模型API网关
  • Java自动化测试实战:从框架搭建到持续集成,以社交应用为例
  • GLM-5.2 开源引爆全球,马斯克点赞、Hugging Face 免费支持,国产模型终于出圈了
  • 华为OD机试真题 新系统 2026-05-27 PythonJS 实现【Skill执行链完整性检测】
  • 高级Android工程师之路:Android工程师进阶手册中的架构思维培养
  • 2026襄阳漏水检测维修精选优质服务商TOP5推荐!卫生间漏水/厨房漏水/屋顶天花板漏水/阳台漏水/地下室漏水防水补漏检测维修-正规防水补漏公司优选口碑榜测评推荐 - 即刻修防水
  • (2026新)湛江正规防水补漏公司口碑榜TOP5权威推荐!卫生间/厨房/阳台/屋顶/天花板/地下室渗漏水检测维修攻略-靠谱漏水检测维修师傅推荐 - 安佳防水
  • (2026新)清远正规防水补漏公司口碑榜TOP5权威推荐!卫生间/厨房/阳台/屋顶/天花板/地下室渗漏水检测维修攻略-靠谱漏水检测维修师傅推荐 - 安佳防水
  • 钢结构施工安装方案
  • 从自举电路到死区控制:深入解析IR2104在半桥驱动中的核心机制