当前位置: 首页 > news >正文

CANN/asc-devkit:UB到GM数据拷贝函数

asc_copy_ub2gm【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√功能说明将数据从Unified Buffer (UB) 搬运到 Global Memory (GM)。函数原型前n个数据搬运__aicore__ inline void asc_copy_ub2gm(__gm__ void* dst, __ubuf__ void* src, uint32_t size)高维切分搬运__aicore__ inline void asc_copy_ub2gm(__gm__ void* dst, __ubuf__ void* src, uint16_t n_burst, uint16_t len_burst, uint16_t src_gap, uint16_t dst_gap)同步计算__aicore__ inline void asc_copy_ub2gm_sync(__gm__ void* dst, __ubuf__ void* src, uint32_t size)参数说明参数名输入/输出描述dst输出目的GM地址。src输入源UB地址。size输入搬运数据大小字节。n_burst输入待搬运的连续传输数据块个数。取值范围[1, 4095]。len_burst输入待搬运的每个连续传输数据块的长度单位为DataBlock32字节。取值范围[1, 65535]。src_gap输入源操作数相邻连续数据块的间隔前面一个数据块的尾与后面一个数据块的头的间隔。单位为DataBlock32字节。dst_gap输入目的操作数相邻连续数据块的间隔前面一个数据块的尾与后面一个数据块的头的间隔。单位为DataBlock32字节。返回值说明无流水类型PIPE_MTE3约束说明dst的起始地址要求按照对应数据类型所占字节数对齐。src的起始地址要求32字节对齐。如果需要执行多条asc_copy_ub2gm指令且asc_copy_ub2gm指令的目的地址存在重叠需要插入同步指令保证多个asc_copy_ub2gm指令的串行化防止出现异常数据。同步计算包含同步等待。当采用前n个数据搬运接口时搬运数据大小要求32字节对齐。调用示例// total_length指参与搬运的数据总个数。dst是外部输入的half类型的GM内存。 constexpr uint64_t total_length 128; __ubuf__ half src[total_length]; asc_copy_ub2gm(dst, src, total_length * sizeof(half));【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
http://www.gsyq.cn/news/1348344.html

相关文章:

  • python笔记和练习----少儿编程课程【阶段一(一)】
  • 不用手动改到疯:2026靠谱降AI率工具实测指南
  • 终极大麦网自动抢票指南:轻松搞定热门演出门票的完整教程
  • 3步终极方案:永久解决Navicat Mac版14天试用限制
  • 5大核心功能深度解析:如何用wvp-GB28181-pro构建企业级视频监控系统
  • Applite完整指南:免费开源macOS软件管家,告别命令行操作烦恼
  • 有哪些AI写作辅助平台是真的坚守学术严谨,而不是通用套壳?
  • CANN asc-devkit C API向量归约函数
  • NoisePage查询编译技术深度剖析:LLVM JIT如何实现10倍性能提升
  • 2026年5月温州直流屏/交直流一体化电源/不间断电源/消防应急电源/eps应急电源厂家哪家好,认准温州平源电气有限公司 - 2026年企业推荐榜
  • ShawzinBot完全指南:如何在Warframe中轻松实现MIDI自动演奏
  • H3CSE 高性能园区网:MAD分裂检测技术详解
  • 百度健康杨明璐拆解AI大健康落地实践:从技术赋能到价值创造,构建全链路服务体系
  • CANN asc-devkit向量反量化函数
  • 泾县黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 2026年北京有害生物防制服务商深度横评:从应急消杀升级到科学防制体系 - 企业名录优选推荐
  • OpenCalib:自动驾驶多传感器外参标定工具箱深度解析与技术实现
  • 深度探索WinBtrfs:Windows环境下的Btrfs文件系统完整解决方案
  • 琅琊区黄金回收白银回收铂金回收店铺哪家好 靠谱门店推荐 - 莘州文化
  • 5分钟掌握ToolsFx:终极数据安全与密码学工具箱解决方案
  • 环烷基变压器油技术参数解析与场景适配全指南 - 奔跑123
  • 2026高效之选:专业的食品加工压滤机江苏厂家推荐 - 品牌2025
  • 2026年建筑模板、覆膜板与小红板优质厂家甄选指南top5 - 深度智识库
  • Vue Tree List 使用教程:3分钟上手Vue树形组件,轻松构建层级数据界面
  • Giter8高级技巧:掌握条件渲染和动态参数配置的终极指南
  • 内存安全分析与数据提取:Windows进程内存扫描技术在微信数据库解密中的应用
  • 大学生班级|基于SprinBoot+vue的大学生班级管理系统(源码+数据库+文档)
  • 需求跟踪矩阵的定义和作用
  • Aeneas音频文本对齐工具:3分钟实现专业级音画同步的终极指南
  • 如何快速掌握APK逆向:APKToolGUI图形化工具的完整实战教程