DAC SDC(System Design Contest)的比赛任务是在Xilinx Ultra96v2平台上实现高速、高准确率且低功耗的飞行器高空目标检测深度学习算法。比赛所用的训练与测试数据集均由大疆公司提供,训练集包含95种目标共93K张图片,测试集包含52K张图片,最终将以检测精度(IoU)高、速度(FPS)快和功耗低为评判准则。
DAC SDC(System Design Contest)的比赛任务是在Xilinx Ultra96v2平台上实现高速、高准确率且低功耗的飞行器高空目标检测深度学习算法。比赛所用的训练与测试数据集均由大疆公司提供,训练集包含95种目标共93K张图片,测试集包含52K张图片,最终将以检测精度(IoU)高、速度(FPS)快和功耗低为评判准则。
自动驾驶汽车应对在高速公路和主干道等高速行驶场景以及对各种突然事件需要做出及时的反应,如旁边车辆变道、前方车辆突发故障或前方行人突然出现等,检测系统要求具备较高的实时性,其中硬件加速平台是整个系统中最关键的部分。本项目设计的智能加速平台能够推理加速多种深度学习算法,帮助自动驾驶系统快速全面认知复杂路况、精准感知、预测车辆行驶过程中的交通情况,并且实时对周边环境做出准确的判断。此外,还可以应用在智能安防、智慧交通、工业生产等嵌入式领域。
该项目是我的本科毕业设计,主要设计了一种卷积神经网络(用于手写数字识别)推理的硬件加速器,使用 16 位定点数对网络参数进行量化,实验基于ZYNQ(XC7Z010)硬件平台,完成了加速器的实现与测试,最终使用 MNIST 测试集的准确率为 98.42%,与Tensorflow 32 位浮点数计算结果仅相差 0.05%;与CPU(i5-6200U)推理速度相比,单张图片推理加速比达到了84.8倍,10000 张图片推理加速比达到了43.6倍。
在神经网络中,存在着大量的参数,如果这些参数都用浮点数表示,将会消耗大量的硬件资源,这对于硬件资源有限的嵌入式平台是十分不友好的。在实际硬件实现中,往往采用将浮点数进行定点化处理,用定点数来表示浮点数。
Update your browser to view this website correctly. Update my browser now