当前位置: 首页 > news >正文

昇腾GE性能分析初始化函数

aclgrphProfInit

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

产品

是否支持

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

头文件/库文件

  • 头文件:#include <ge/ge_prof.h>
  • 库文件:libmsprofiler.so

功能说明

初始化Profiling,设置Profiling参数(目前供用户设置保存性能数据文件的路径)。

函数原型

Status aclgrphProfInit(const char *profiler_path, uint32_t length)

参数说明

参数名

输入/输出

说明

profiler_path

输入

指定保存性能数据的文件的路径,路径支持绝对路径和相对路径。

length

输入

profiler_path的长度,单位为字节。最大长度不超过4096字节。

返回值说明

参数名

类型

说明

-

Status

SUCCESS:成功。

FAILED:失败。

ACL_ERROR_FEATURE_UNSUPPORTED:动态Profiling场景下不支持调用aclgrphProfInit接口。

约束说明

  • 不支持多次重复调用aclgrphProfInit,并且该接口需和aclgrphProfFinalize配对使用,先调用aclgrphProfInit接口再调用aclgrphProfFinalize接口。
  • 建议该接口在GEInitialize之后,AddGraph之前被调用,可采集到AddGraph时的Profiling数据。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1558492.html

相关文章:

  • Vssue性能优化技巧:提升评论系统加载速度的7个方法
  • Qwen音频与多模态模型本地部署实战指南
  • CANN/ge图引擎替换API
  • 2026许昌漏水检测维修精选优质服务商TOP5推荐!卫生间漏水/厨房漏水/屋顶天花板漏水/阳台漏水/地下室漏水防水补漏检测维修-正规防水补漏公司优选口碑榜测评推荐 - 即刻修防水
  • (2026新)玉溪正规防水补漏公司口碑榜TOP5权威推荐!卫生间/厨房/阳台/屋顶/天花板/地下室渗漏水检测维修攻略-靠谱漏水检测维修师傅推荐 - 安佳防水
  • Onebox常见问题解答:从安装到部署的全面解决方案
  • i.MX53xD外部接口时序深度解析:从基础概念到工程实践
  • PPP认证实战:从PAP明文到CHAP加密的eNSP安全演进
  • 问界授权用户中心福利政策实力测评,2026口碑榜单零套路 - mypinpai
  • 【图像加密】基于matlab混合混沌移位变换和于修正 Henon映射的图像加密算法密码分析【含Matlab源码 15646期】
  • WorkshopDL终极指南:5分钟掌握免Steam下载创意工坊模组
  • (2026新)潮州正规防水补漏公司口碑榜TOP5权威推荐!卫生间/厨房/阳台/屋顶/天花板/地下室渗漏水检测维修攻略-靠谱漏水检测维修师傅推荐 - 安佳防水
  • LTX-2开源贡献完全指南:如何参与音频-视频生成模型的开发与改进
  • MC68HC908GP32 TIM模块PWM与中断机制深度解析
  • 认知时代的教师重塑:从知识二传手到意义编织者的专业成长路径(世毫九实验室原创研究)
  • CANN/GE NPU模型装饰器API文档
  • 模糊函数:信号时频分析与雷达波形设计的核心工具
  • SoundCleod深度解析:揭秘Electron框架下的SoundCloud桌面客户端技术实现
  • 如何快速掌握AI提示工程:开发者的完整实战指南
  • Django树形结构扩展:如何基于django-treenode定制复杂业务模型
  • Mac Intel本地部署龙虾AI(OpenClaw)实战指南
  • 5分钟快速上手:用Retrieval-based-Voice-Conversion-WebUI打造专属AI歌手
  • Angular Timer实战:构建电商秒杀倒计时组件终极指南 [特殊字符]
  • MC68HC908GR8 ADC模块深度解析:从原理到实战避坑指南
  • 深入解析ARM Cortex-M3微控制器架构与LPC13xx系列开发实践
  • 如何通过AionUi与OpenClaw集成打造你的专属AI办公助手
  • 3步解锁PS4潜力:PPPwn内核漏洞利用完全指南
  • 1688运营培训/店铺有流量却零询盘?1688运营培训拆解低转化真实原因
  • MI50在Linux下跑AI推理的完整实战指南:ROCm 6.2.1+Ubuntu 22.04适配手记
  • Seedance 2.0本地部署与视频生成工作流实战指南