Skip to content

Latest commit

 

History

History
executable file
·
98 lines (87 loc) · 5.41 KB

README.md

File metadata and controls

executable file
·
98 lines (87 loc) · 5.41 KB

C++例程

cpp目录下提供了C++例程以供参考使用,具体情况如下:

序号 C++例程 说明
1 openpose_bmcv 使用FFmpeg解码、BMCV前处理、BMRT推理

1. 环境准备

1.1 x86/arm PCIe平台

如果您在x86/arm平台安装了PCIe加速卡(如SC系列加速卡),可以直接使用它作为开发环境和运行环境。您需要安装libsophon、sophon-opencv和sophon-ffmpeg,具体步骤可参考x86-pcie平台的开发和运行环境搭建arm-pcie平台的开发和运行环境搭建

1.2 SoC平台

如果您使用SoC平台(如SE、SM系列边缘设备),刷机后在/opt/sophon/下已经预装了相应的libsophon、sophon-opencv和sophon-ffmpeg运行库包,可直接使用它作为运行环境。通常还需要一台x86主机作为开发环境,用于交叉编译C++程序。

2. 程序编译

C++程序运行前需要编译可执行文件。

2.1 x86/arm PCIe平台

可以直接在PCIe平台上编译程序:

cd cpp/openpose_bmcv
mkdir build && cd build
cmake .. 
make
cd ..

编译完成后,会在openpose_bmcv目录下生成openpose_bmcv.pcie。

2.2 SoC平台

通常在x86主机上交叉编译程序,您需要在x86主机上使用SOPHON SDK搭建交叉编译环境,将程序所依赖的头文件和库文件打包至soc-sdk目录中,具体请参考交叉编译环境搭建。本例程主要依赖libsophon、sophon-opencv和sophon-ffmpeg运行库包。

交叉编译环境搭建好后,使用交叉编译工具链编译生成可执行文件:

cd cpp/openpose_bmcv
mkdir build && cd build
#请根据实际情况修改-DSDK的路径,需使用绝对路径。
cmake -DTARGET_ARCH=soc -DSDK=/path_to_sdk/soc-sdk ..  
make

编译完成后,会在openpose_bmcv目录下生成openpose_bmcv.soc。

3. 推理测试

对于PCIe平台,可以直接在PCIe平台上推理测试;对于SoC平台,需将交叉编译生成的可执行文件及所需的模型、测试数据拷贝到SoC平台中测试。测试的参数及运行方式是一致的,下面主要以PCIe模式进行介绍。

3.1 参数说明

可执行程序默认有一套参数,请注意根据实际情况进行传参,具体参数说明如下:

Usage: openpose_bmcv.pcie [params]

        --bmodel (value:../../models/BM1684/pose_coco_fp32_1b.bmodel)
                bmodel file path
        --dev_id (value:0)
                TPU device id
        --help (value:true)
                print help information.
        --input (value:../../datasets/test)
                input path, images direction or video file path
        --performance_opt (value:no_opt)
                performance optimization type, supporting [tpu_kernel_opt, tpu_kernel_half_img_size_opt, cpu_opt, no_opt]

注意: C++程序的传参方式与python不同,需要用等于号,例如./openpose_bmcv.pcie --bmodel=xxx

3.2 测试图片

图片测试实例如下,支持对整个图片文件夹进行测试。

./openpose_bmcv.pcie --input=../../datasets/test --bmodel=../../models/BM1684X/pose_coco_fp32_1b.bmodel --dev_id=0

仅在BM1684X上,若需要使用tpu_kernel后处理来加速,则可以使用以下命令。

./openpose_bmcv.pcie --input=../../datasets/test --bmodel=../../models/BM1684X/pose_coco_fp32_1b.bmodel --dev_id=0 --performance_opt=tpu_kernel_opt

进一步,若在后处理中仅仅放大输出特征图到原图一半,精度轻微下降的同时性能能够大幅提高,使用以下命令。

./openpose_bmcv.pcie --input=../../datasets/test --bmodel=../../models/BM1684X/pose_coco_fp32_1b.bmodel --dev_id=0 --performance_opt=tpu_kernel_half_img_size_opt

若需要使用针对算法的后处理性能优化来加速,同时伴随精度轻微下降,可以使用以下命令。

./openpose_bmcv.pcie --input=../../datasets/test --bmodel=../../models/BM1684X/pose_coco_fp32_1b.bmodel --dev_id=0 --performance_opt=cpu_opt

测试结束后,会将预测的图片保存在results/images下,预测的关键点坐标保存在results/pose_coco_fp32_1b.bmodel.bmodel_test_bmcv_cpp_result.json下,同时会打印预测结果、推理时间等信息。

res

3.3 测试视频

视频测试实例如下,支持对视频流进行测试。在BM1684X上,后处理加速命令与3.2中类似,若使用算法后处理加速也与3.2中类似。

./openpose_bmcv.pcie --input=../../datasets/dance_1080P.mp4 --bmodel=../../models/BM1684X/pose_coco_fp32_1b.bmodel --dev_id=0

测试结束后,会将预测结果画在图片上并保存在results/images中,同时会打印预测结果、推理时间等信息。