2 开发基础

本章帮助用户熟悉K230软件开发的基础底层工具，对K230_SDK和nncase进行简单介绍，帮助用户熟悉SDK环境搭建、镜像编译烧录、kmodel转换的过程。

2.1 K230 SDK

2.1.1. K230 SDK 简介

K230 SDK 是面向K230 开发板的软件开发包，包含了基于Linux&RT-smart 双核异构系统开发需要用到的源代码，工具链和其他相关资源。源码地址：kendryte/k230_sdk: (github.com) 或 kendryte/k230_sdk: (gitee.com)。

SDK

K230 SDK软件架构层次如图所示：

K230 SDK软件架构层次

2.2. nncase简介

2.2.1. nncase介绍

nncase是面向 AI 加速器的神经网络编译器，用于为 Kendryte系列芯片生成推理所需要的模型文件 .kmodel，并提供模型推理所需要的 runtime lib。

本教程主要包括以下内容：

使用 nncase完成模型编译，生成 kmodel。
在PC和开发板上执行 kmodel推理。

2.2.1.1. 原始模型说明

nncase目前支持 tflite、onnx格式的模型，更多格式的支持还在进行中。

Tips：

对于TensorFlow的pb模型,请参考官方文档将其转换为tflite格式。注意不要设置量化选项,直接输出浮点模型即可。如果模型中存在quantize和dequantize算子,则属于量化模型，目前不支持。

对于PyTorch的pth等格式模型,需使用torch.export.onnx接口导出onnx格式。

2.2.1.2. 编译参数说明

进行模型编译前,您需要了解以下关键信息:

KPU推理使用定点运算。因此在编译模型时,必须配置量化相关参数,用于将模型从浮点转换为定点。详见 nncase文档中的PTQTensorOptions说明。
nncase支持将前处理层集成到模型中，这可以减少推理时的前处理开销。相关参数和示意图见 nncase文档的CompileOptions部分。

2.2.1.3. 编译脚本说明

本Jupyter notebook：(github.com)或Jupyter notebook：(gitee.com)分步骤详细描述了使用nncase编译、推理kmodel的流程，notebook内容涵盖:

参数配置:介绍如何正确配置编译参数,以满足实际部署需求；
获取模型信息:说明从原始模型中获取网络结构、层信息等关键数据的方法；
设置校正集数据:阐述如何准备好校正集样本数据，包括单输入和多输入模型两种情况，以用于量化校准过程；
设置推理数据格式:讲解推理部署时如何配置输入数据，支持不同需求场景；
配置多输入模型:介绍处理多输入模型时,如何正确设置每个输入的形状、数据格式等信息；
PC模拟器推理:说明如何在PC上利用模拟器推理kmodel，这是验证编译效果的关键步骤；
比较推理结果:通过与不同框架(TensorFlow、PyTorch等)的推理结果比较,验证kmodel的正确性；

以上步骤系统地介绍了模型编译的全流程,既适合初学者从零开始学习,也可作为经验丰富用户的参考指南。

2 开发基础

2.1 K230 SDK​

2.1.1. K230 SDK 简介​

2.2. nncase简介​

2.2.1. nncase介绍​

2.2.1.1. 原始模型说明​

2.2.1.2. 编译参数说明​

2.2.1.3. 编译脚本说明​