飞桨x昇腾生态适配方案:00_整体方案介绍
前言
- 本文重点介绍Paddle与NPU的适配工作,PaddlePaddle是一个深度学习框架,类似于pytorch;PaddleCustomDeviece是适配层代码,类似于pytorch adapter;模型侧代码根据领域分为PaddleNLP、PaddleMix、PaddleClas、PaddleOCR等。
- 如果需要运行在线的训练或者推理,可以直接参考模型仓的README,并更改deviece为NPU即可。当前已经支持了大部分主流模型且在持续增加中,具体的模型列表可参照,大部分模型的性能基本持平V100,少部分专项调优模型可以达到0.8*A800(主要是大模型,多模态)。
- 如果在线推理性能较差且只需要推理的场景,统一建议使用离线场景,Paddle2ONNX工具转化为ONNX,并使用atc转换为OM,具体可参照Paddle转OM以及离线推理章节内容。
硬件适配说明
- 当前的适配工作主要针对A2芯片,以下所有内容如果没有特殊说明都只针对A2芯片;
- A1芯片在大部分情况下没有问题,且使用方式与A2相同,如遇到类似项目可自行使用相同方式进行验证,遇到问题单点支撑;
- 310系列芯片没有进行过适配,建议直接走离线推理路径。
常用Paddle模型仓
- NLP代码仓PaddleNLP:
- 多模态代码仓PaddleMIX:
- 小模型总体仓库PaddleX:
- 其余仓库可查看Paddle主页面:
- 随机文章
- 热门文章
- 热评文章
- 深入了解显卡性能测试工具:关键工具、性能指标与测试方法显卡性能测试软件什么好
- 深入解析LoadRunner压力测试:原理、实践与优化loadrunner压力测试500并发
- 有趣的心理测试 选一扇门看穿你的性格
- 国内最大的MCP中文社区来了,4000多个服务等你体验
- 鸿蒙远程调试技术解析:开发者的“千里眼”与“顺风耳”【华为根技术】
- Java 企业级应用:SOA 与微服务的对比与选择
- 4月阅读周·HTTP权威指南:客户端识别与cookie机制之会话跟踪和缓存篇
- 弹性公网IP:云时代的”智能通讯管家“
- 全栈开发者硬核实测:明基 RD280U 编程显示器能否重塑编码体验?
上一篇:支配欲望强烈 你会是老虎型性格的人吗 下一篇:UDP协议(特点与应用场景)
回归分析



