当前位置: 首页 > news >正文

CANN/ops-blas strttp算子

strttp 算子

【免费下载链接】ops-blas本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。项目地址: https://gitcode.com/cann/ops-blas

功能描述

三角常规格式转压缩格式:将常规二维三角矩阵压缩为 packed format 存储。

  • uplo == ACLBLAS_LOWER:将A的下三角复制到AP
  • uplo == ACLBLAS_UPPER:将A的上三角复制到AP

目录结构

blas/trttp/ ├── README.md # 说明文档 └── arch35/ # 算子实现(trttp=操作族, strttp=float32, arch35=ascend950) ├── strttp_host.cpp ├── strttp_kernel.cpp └── strttp_tiling_data.h test/trttp/ # 测试代码 ├── CMakeLists.txt ├── strttp_param.h ├── strttp_golden.h └── arch35/ ├── strttp_npu_wrapper.h ├── strttp_test.cpp └── strttp_test.csv

接口定义

aclblasStatus_t aclblasStrttp(aclblasHandle_t handle, aclblasFillMode_t uplo, int n, const float *A, int lda, float *AP);

参数说明

参数类型说明
handleaclblasHandle_tACL 流句柄
uploaclblasFillMode_tACLBLAS_LOWER(122) 或ACLBLAS_UPPER(121)
nint方阵维数
Aconst float*常规三角矩阵(device),维度 lda x n
ldaintA 的 leading dimension,lda >= max(1, n)
APfloat*输出压缩格式(device),长度 n*(n+1)/2

编译运行

bash build.sh --ops=strttp --run --soc=ascend950

测试说明

ST 采用 GTest 参数化 +strttp_test.csvBlasTest<StrttpParam>fixture,精度模式为EXACT

注意makeBlasArray的 size 参数为int64_t,调用时需显式转换:makeBlasArray(static_cast<int64_t>(p.lda) * p.n, p.a),确保负值 n 正确返回空数组。

【免费下载链接】ops-blas本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。项目地址: https://gitcode.com/cann/ops-blas

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1552506.html

相关文章:

  • 四川省九州游汽车租赁靠谱哪家靠谱?2026真实口碑榜,价格透明不踩雷 - 工业品牌热点
  • 抖音批量下载终极指南:如何快速下载无水印视频和用户主页内容
  • 2026奥迪专修公司排名:五家风格各异的专业机构深度解析 - mypinpai
  • CANN/asc-devkit频率统计函数
  • DeepSeek V4 Lite百万上下文技术真相:分块稀疏注意力与工程落地瓶颈
  • 优化长尾关键词以提升SEO排名的实用策略与技巧
  • 从零开始:在本地搭建一个带知识库的 AI 助手(Ollama + Open WebUI)
  • Serverless-plugin-typescript高级配置:自定义tsconfig.json和打包策略详解
  • 淄博六家黄金回收门店实地走访推荐 - 余生黄金回收
  • 基于YOLOv8+pyqt5的摔倒检测系统1(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_可以扫码
  • 目前短视频点赞按钮识别速度已经达到0.7s水平
  • emWin Flex皮肤机制详解:从回调函数到自定义控件外观实战
  • 台式旧电脑回收哪家好,2026实力测评榜单价格透明避坑指南 - mypinpai
  • 端午安康
  • 2026年6月淄博黄金回收实测六家门店推荐 - 余生黄金回收
  • 2026录音转写工具保姆级指南:免费付费、无需下载、电脑手机高精准软件手把手教学
  • 基于YOLOv8火灾烟雾检测系统 火灾报警识别系统
  • 三分钟搭建高效QQ机器人:LuckyLilliaBot终极指南
  • 淄博黄金回收门店实测推荐六家靠谱店铺盘点 - 余生黄金回收
  • 第16期 专业管理隐藏启动项工具 revo_uninstaller_pro
  • 跨平台应用开发技术栈选型指南
  • PowerPC嵌入式开发实战:CodeWarrior调试与编译器优化深度解析
  • Golang crypto/rand 安全随机数生成:原理、实践与性能优化
  • 云识慧一脸通模块二:人脸门禁系统
  • Qwen3.5-Flash深度实测:T4上工业级低延迟推理全链路解析
  • Linux多线程编程(五):线程池实现与线程安全的单例模式
  • 数字政府大数据政务云平台顶层设计全解析:从建设目标到技术架构,一文搞懂智慧政务!(PPT)
  • 2026年6月自贡黄金回收市场六店走访全实测 - 余生黄金回收
  • 从零开始:Visual Studio 2026 安装配置及第一个程序编写
  • 【C++】解构C++对象模型:你与“高手”之间,就差这篇类和对象-上