Skip to main content

K230 场景实战-猫眼POC

1.K230 猫眼

在K230平台开发的一套集成UI、视频对讲、人形检测功能的产品级程序。猫眼产品支持远程猫眼和本地猫眼两种,所谓远程猫眼即猫眼设备可以与远程手机设备进行交互。

1.1 硬件环境

  • K230-USIP-LP3-EVB-V1.0/K230-USIP-LP3-EVB-V1.1 * 2个
  • 配套的LCD模组 * 2个
  • K230-USIP-IMX335-SENSOR-V1.1模组 * 2个
  • typeC转网口接口 * 2个
  • 外置音频子板一块
  • 网线一根

除外置音频子板和网线外,远程猫眼需要两套设备,一套作为猫眼设备,一套模拟手机设备。音频子板用于猫眼设备端。

peephole boards

上图中左面的evb板运行猫眼设备端,右面的evb板运行模拟手机端。 界面UI上的按键功能如下:

  • 对讲键:控制对讲的开始/取消。
  • 变声键:控制变声的使能/取消。
  • 播放键:进去回放界面,回放录制的视频或抓拍的图片。
  • 关机键:控制猫眼设备端关机。

2.概述

猫眼程序作为一个POC项目,提供给客户如何使用lvgl、大小核通信、网络通信、多媒体pipeline及ai等功能的参考。

程序的主要功能:

  1. 模拟两种唤醒模式:PIR唤醒和门铃唤醒。
    • PIR唤醒:
      • 猫眼设备端进行人形检测并抓拍存盘。
    • 门铃唤醒:
      • 可进行远程可视对讲,本地语音对讲,存盘及回放。
  2. rtsp网络服务以及rpc服务。
  3. 大小核事件、数据通信。
  4. 图像抓拍、录像以及回放。
  5. GUI显示。

程序主要两大部分:

  • 猫眼设备侧程序:包括大核程序和小核程序两个
    1. 大核程序 主要完成ai人形检测、视频输入、视频/图像编码、音频输入及编码、音频解码及输出功能。
    2. 小核程序 主要完成UI界面控制、音视频的推流、存盘、回放、与手机设备交互实现视频对讲功能,以及本地语音对讲功能。
  • 手机设备侧程序:只包括小核程序 小核侧程序主要完成通过UI界面控制视频对讲的开始、结束、变声功能,和猫眼设备交互实现视频对讲功能。

3.功能演示

3.1 门铃模式

猫眼设备 通过长按按键的方式启动,启动UI界面,按键功能如下:

  • 对讲键:对讲使能/取消,仅用于本地门铃对讲。程序运行起来第一次按下后,对讲开始。
  • 变声键:控制变声使能/取消,仅用于本地门铃对讲,默认不变声。
  • 播放键:按键为回放,用于播放本地存储的视频和图像。(注意本地对讲时,需要先取消对讲再进行回放)
  • 关机键:控制设备关机。

对讲按钮上方显示的为本地IP地址。

当门铃唤醒猫眼设备后,屏幕显示本地摄像头采集的视频,可以通过两种方式进行视频对讲。一种为本地门铃语音对讲,另外一种为远程门铃可视对讲。

3.1.1 本地门铃语音对讲

点击猫眼设备端的对讲按键,开始门内外对讲。将耳机连接到猫眼设备的evb板载耳机接口和子板耳机接口,可以听到对端声音。

3.1.2 远程门铃可视对讲

远程对讲,需要另外一块开发板运行手机端程序。当与设备端连接上之后,手机端会弹框显示”Connected”,随后弹框消失,继续显示主界面。下方的三个按键功能:

  • 对讲键:控制对讲使能/取消,程序运行起来后,会出现唤醒模式的弹框。此后通过此按键触发对讲,第一次按下后,对讲开始。
  • 变声键:控制变声使能/取消,默认不变声。
  • 关机键:远程控制猫眼设备端关机。

4.限制条件及说明

  1. 目前仅支持网络直连测试,手机端和设备端均配置了静态IP。
  2. 远程可视对讲挂断后,不支持再次连接。
  3. 回放结束后,不支持远程可视对讲。
  4. 门铃模式开机后开始存盘,存储格式为mp4。再次通过门铃模式开始,会覆盖上一次的存盘。
  5. PIR模式检测人形之后的抓拍图像,需要通过门铃模式唤醒后,点击回放按键查看。
  6. 目前配置的存储空间为256MB。

5.源码位置

  • 猫眼设备大核程序源码路径位于k230_sdk/src/reference/business_poc/peephole/big
  • 猫眼设备小核程序源码路径位于 k230_sdk/src/reference/business_poc/peephole/peephole_device
  • 模拟手机设备程序源码路径位于k230_sdk/src/reference/business_poc/peephole/peephole_phone

6.编译程序

6.1 猫眼设备

猫眼设备端需要用猫眼设备配置脚本进行编译,编译命令为make CONF=k230_evb_peephole_device_defconfig需要注意,配置过CONF后,后面的编译命令即使不配置CONF,也会用上一次的CONF进行编译,编译产物在k230_sdk/output/${CONF}目录下 默认的CONF为k230_evb_defconfig。 生成的镜像在output/k230_evb_peephole_device_defconfig/images/sysimage-spinor32m.img,烧录该镜像,启动后自动运行猫眼设备端。

6.2 模拟手机设备

可以通过make CONF=k230_evb_peephole_phone_defconfig编译生成手机端镜像,生成的镜像在output/k230_evb_peephole_phone_defconfig/images/sysimage-sdcard.img.gz,烧录该镜像,启动后自动运行模拟手机端程序。

7.运行程序

7.1 运行猫眼设备端程序

猫眼设备端如下图所示,可以通过两种方式启动。

  • 方式一:将拨码开关拨到ON,此方式模拟PIR唤醒。
    • 设备会进行首帧抓拍,人形检测,检测到人形10秒后抓拍。本文中所指人形检测为整个人形。
    • 此模式启动后,可以通过短按门铃按键进入门铃模式。
  • 方式二:长按按键,此方式模拟门铃唤醒。
    • evb板上的mic和耳机,模拟门外场景;音频子板上的mic和耳机模拟门内场景。

peephole_device

猫眼镜像为自启动模式,烧录猫眼镜像后,需要分别将J1的1、2引脚,13、14引脚,9、15引脚两两短接,如下图所示。

pmu connection

7.2 运行模拟手机端

烧录模拟手机端镜像后,启动后自动运行手机端程序。待弹框提示连上成功之后,可以通过按键控制与猫眼设备端交互。