当前位置: 首页 > news >正文

Ascend C数据解压搬运API

LoadDataUnzip

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

x

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品 AI Core

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

x

功能说明

将GM上的数据解压并搬运到A1/B1/B2上。执行该API前需要执行LoadUnzipIndex加载压缩索引表。

函数原型

template <typename T> __aicore__ inline void LoadDataUnzip(const LocalTensor<T>& dst, const GlobalTensor<T>& src)

参数说明

表 1参数说明

参数名称

输入/输出

含义

dst

输出

目的操作数,类型为LocalTensor,支持的TPosition为A1/B1/B2。

LocalTensor的起始地址需要保证:TPosition为A1/B1时,32字节对齐;TPosition为B2时,512B对齐。

支持的数据类型为:int8_t。

src

输入

源操作数,类型为GlobalTensor。数据类型需要与dst保持一致。

约束说明

  • 操作数地址对齐要求请参见通用地址对齐约束。

返回值说明

调用示例

该调用示例支持的运行平台为Atlas 推理系列产品AI Core。

uint32_t srcLen = 896, dstLen = 1024, numOfIndexTabEntry = 1; AscendC::LocalTensor<int8_t> weightB1 = inQueueB1.AllocTensor<int8_t>(); AscendC::LoadUnzipIndex(indexGlobal, numOfIndexTabEntry); // 加载索引数据,加载GM上的压缩索引表到内部寄存器 AscendC::LoadDataUnzip(weightB1, weGlobal); // 根据内部寄存器里的索引表加载数据

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1328897.html

相关文章:

  • 深入RPMsg-Lite virtqueue:拆解异构多核芯片共享内存通信的‘黑盒子’
  • Abiotic Factor多人生存建筑游戏《非生物因素》 专用服务器搭建教程
  • 3步掌握TransNet V2:从零开始实现智能视频镜头检测
  • Gemini赋能安全工程师:自动写PoC脚本
  • CANN Ascend C数据转换临时空间API
  • CANN/asc-devkit DeepNorm API 文档
  • 如何3分钟搞定专业级虚拟背景:obs-backgroundremoval快速上手指南
  • Perplexity环境新闻检索失效真相(2024最新API响应延迟根因分析)
  • 工业视觉系统选型实战:CCD相机与镜头参数计算全解析
  • Sora之后的真相:2026年真正落地的8款工业级AI视频引擎,含API吞吐量、帧间PSNR均值与商用SLA承诺明细
  • Qt QSettings管理Windows环境变量:原理、实现与实战优化
  • 5分钟彻底净化Windows 11:Win11Debloat终极优化指南
  • 5分钟快速上手Vue3思维导图:打造专业级数据可视化应用
  • 2026招聘网站平台排行榜 易直聘好用排第一求职招聘优选 - 博客万
  • 猫抓浏览器扩展:基于网络请求拦截的智能资源嗅探技术实现
  • 告别DDPG训练不稳定!用SAC(软性演员-评论家)算法搞定复杂环境强化学习
  • 3天掌握Dify工作流开发:从零构建企业级AI应用的完整指南
  • 空洞骑士模组管理器Scarab:2024年最完整的安装与使用指南
  • 收藏!2026年AI大厂抢人才!大模型工程师成香饽饽,高薪高发展路径揭秘
  • 抖音无水印下载终极指南:从技术原理到实战应用完整解析
  • 东莞市CPPM和SCMP总授权报名机构公示及联系方式 - 众智商学院课程中心
  • Vant Calendar组件实战:手把手教你打造一个可折叠的月度学习计划表(Vue3 + TypeScript)
  • 2026年医用微动力系统全国采购指南:从无刷电机到手术钻的深度横评与官方对接 - 企业名录优选推荐
  • 终极指南:如何用MangaOCR实现日语漫画文本识别的革命性突破
  • 收藏!小白程序员6个月免费学通AI智能体,保姆级路线图助你毕业
  • 终极指南:5分钟在Windows上安装安卓APK文件,无需模拟器
  • GC9A01驱动踩坑记:从供应商代码到自研优化,软件SPI这些细节别忽略
  • 163MusicLyrics:一站式跨平台歌词管理解决方案
  • 为claude code配置taotoken后端解决访问不稳定问题
  • 熬夜肌抗皱抗糖面霜推荐:长效抗氧抗糖配方,减少熬夜自由基损伤延缓肌肤老化进程 - 博客万