嘉楠-基于RT-Smart在K230离线部署Qwen3.pptx

编号:713609 PPTX 19页 12.78MB 下载积分:VIP专享
下载报告请您先登录!

嘉楠-基于RT-Smart在K230离线部署Qwen3.pptx

1、基于RT-Smart在K230离线部署Qwen3,Transforming Tomorrow:Smarter Efficiency,Better Lives.,提升社会运行效率 改善人类生活方式,张扬2025-06,目录,K230模型编译上板推理,K230,1.CPU-cpu0:800MHZ-cpu1:1.6GHZ,VLEN=128,rvv 1.02.KPU-支持uint8/int8/int16量化,https:/,K230 SDK,K230 开发板,-01Studio CanMV K230 AI开发板,https:/wiki.01studio.cc/docs/canmv_k230/intro

2、/canmv_k230/,K230 RT-Smart镜像,1.环境搭建 docker环境:ubuntu 20.04,依赖软件参考K230 RTOS如何编译固件,2.下载仓库#repo init-u:canmv-k230/manifest.git-m rtsmart.xml-repo-url=:canmv-k230/git-repo.git#repo sync-j$(nproc),3.下载工具链#make dl_toolchain,4.编译镜像#make k230_rtos_01studio_defconfig#make menuconfig#time make log,调整用户态和mmz配置(

3、各分配1GB内存),模型编译,Qwennncase模型转换,Qwen,-Qwen2.5于2024年9月发布-基于K230 Linux跑通并优化Qwen2.5-0.5B-Instruct,https:/qianwen-res.oss-cn-,Qwen,-Qwen3.0于2025年4月底发布-基于K230 Linux/K230 RT-Smart 跑通Qwen3.0-0.6B,https:/www.eet-,nncase,-嘉楠科技主推的神经网络编译工具链-支持K210/K510/K230等多款产品,https:/,nncase,模型转换,1.huggingface下载qwen3-0.6B$git

4、clone https:/huggingface.co/Qwen/Qwen3-0.6B,模型转换,2.hugginface转换为onnxfork开源llm-export工程,修改并支持qwen3.0大模型导出$git clone https:/cd llm-export$pip install.$llmexport-path/mnt/huggingface/model/qwen3.0/Qwen3-0.6B/-export onnx-dst_path/mnt/huggingface/model/qwen3.0/Qwen3-0.6B/,模型转换,3.onnx转换为kmodel-量化配置ptq_op

5、tions.quant_type=int16ptq_options.w_quant_type=uint8-shape_bucket配置shape_bucket_options.enable=trueshape_bucket_options.segments_count=8shape_bucket_options.range_info=seq_len:1,512,history_len:1,512-编译kmodel,上板推理,1.onnx-llm-fork开源onnx-llm工程,适配支持nncase linux/rtos/simulator runtime-修改/编译可执行程序$git clo

6、ne https:/cd onnx-llm/$git checkout qwen3.0$mkdir-p toolchain$wget-c-P toolchain/https:/riscv64-unknown-linux-musl-rv64imafdcv-lp64d-20230420.tar.bz2$tar-xjf toolchain/riscv64-unknown-linux-musl-rv64imafdcv-lp64d-20230420.tar.bz2-C toolchai

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(嘉楠-基于RT-Smart在K230离线部署Qwen3.pptx)为本站 (科技新城) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠