当前位置: 首页 > news >正文

rk3588的ai功能和deepseek

rk3588的ai功能

该型号cpu支持 6TOPS NPU、Mali-G610 MP4 GPU。

支持针对rk系列开发的RKNN框架,能够完成模型转换,量化,推理,性能评估,内存评估和量化分析功能。

 

TOPS是Tera Operations Per Second的缩写,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。

GOPS(Giga Operations Per Second),MOPS(Million Operation Per Second)算力单位。1GOPS代表处理器每秒钟可进行十亿次(109)操作,1MOPS代表处理器每秒钟可进行一百万次(106)操作。

 

目前在其上面已有模型能够完成的工作有:图像分类(clip),图片语义分割(deeplabv3),文字转换语音(mms_tts),人像分割(ppseg),语音识别(whisper),人脸检测(retinaface),实时目标识别等(ppyoloe)等。

 

并支持 其他框架,如Caffe、TensorFlow、TensorFlow Lite、ONNX、DarkNet、PyTorch产生的模型转换为rknn模型。

 

 

deepseek R1

R1采用三阶段训练策略

  1. 基础阶段:1.2T tokens的多语言文本(中英为主)基于冷启动数据,进行有监督微调
  2. 强化阶段:加入300B tokens的代码/数学专项数据
  3. 对齐阶段:使用RLHF优化10B条人类反馈数据

R1引入多目标奖励模型,同时优化:

  • 事实准确性(0.85权重)
  • 逻辑一致性(0.75权重)
  • 有害内容抑制(0.9权重)

混合专家系统(MoE)通过动态路由机制将输入分配值不同专家子网络。包含128个专家模块,每个模块参数量为2.3B,总参数量达294B(激活参数量37B

通过量化压缩技术(如4bit量化)保持较高精度。

 

R1引入滑动窗口注意力(SWA),将全局注意力分解为局部窗口(512 tokens)和稀疏全局连接,使长文本处理效率提升3倍。

R1微调要点

  • 仅需更新路由网络和领域专家(约12B参数)
  • 使用LoRA技术可将显存占用从120GB降至32GB

 

deepseekV3

V3训练策略

V3则通过连续预训练在2.8T tokens的单一语料上完成训练,数据分布更均匀但缺乏领域强化。

 

V3仅使用单一准确性奖励函数,导致在复杂推理场景下表现较弱。

 

DeepSeek-V3采用稠密Transformer架构,参数量固定为67B,通过深度扩展(128层)提升模型容量。

V3则沿用传统多头注意力,通过扩大上下文窗口(32K tokens)提升长文本能力。

V3微调要点

  • 必须全参数微调(67B参数)
  • 建议使用ZeRO-3优化器分阶段训练



http://www.gsyq.cn/news/9437.html

相关文章:

  • EPSON L1300打印机清零教程
  • tomcat CPU数量和线程数的关系
  • python处理Excel单机小程序:匹数据,增强版VLookup
  • CF623B Array GCD
  • Python爬虫实现双色球历史数据抓取
  • 酵母细胞工厂全球调控策略研究进展:从遗传编辑到智能响应
  • Java实现双色球历史开奖对比器
  • 成都恒利泰HT-SCA-4-10+是一款1分4射频功分器
  • 研发项目管理能力建设路线图
  • 好用的提示词
  • 使用 AI app 模板扩展来创建基于订制数据进行聊天的 .NET AI 应用
  • 用光学计算加速AI模型中的卷积和矩阵乘法操作
  • 船舶运动控制,PID控制算法,反步积分控制器
  • 光隔离探头与高压差分探头的可替代性讨论
  • 【笔记】人工智能原理
  • HTTPS 映射如何做?(HTTPS 映射配置、SNI 映射、TLS 终止、内网映射与 iOS 真机验证实战)
  • STM32 FreeRTOS + LwIP 集成实践:基于 MQTT 的通信示例 - 实践
  • 深入解析:HDR 动态元数据生成:场景自适应与质检脚本
  • CSS-渐变
  • 利用MCMC方法产生平稳的马尔科夫链
  • No.72 阿里图标库的使用
  • 接私活神器!一个轻量级的 Java 快速开发平台!
  • 第四届能源与动力工程国际学术会议(EPE 2025)
  • 实用指南:揭秘Pixie Dust攻击:利用路由器WPS漏洞离线破解PIN码接入无线网络
  • 2025 年(2026 届)计算机保研记录
  • 变分法和欧拉-拉格朗日方程 - Emi
  • 【Android】View 的滑动 - 实践
  • 实用指南:Vue开发准备
  • 完整教程:WPF 程序用户权限模块利用MarkupExtension实现控制控件显示
  • AppSpider 7.5.020 for Windows - Web 应用程序安全测试