DAC SDC(System Design Contest)的比赛任务是在Xilinx Ultra96v2平台上实现高速、高准确率且低功耗的飞行器高空目标检测深度学习算法。比赛所用的训练与测试数据集均由大疆公司提供,训练集包含95种目标共93K张图片,测试集包含52K张图片,最终将以检测精度(IoU)高、速度(FPS)快和功耗低为评判准则。
DAC SDC(System Design Contest)的比赛任务是在Xilinx Ultra96v2平台上实现高速、高准确率且低功耗的飞行器高空目标检测深度学习算法。比赛所用的训练与测试数据集均由大疆公司提供,训练集包含95种目标共93K张图片,测试集包含52K张图片,最终将以检测精度(IoU)高、速度(FPS)快和功耗低为评判准则。
自动驾驶汽车应对在高速公路和主干道等高速行驶场景以及对各种突然事件需要做出及时的反应,如旁边车辆变道、前方车辆突发故障或前方行人突然出现等,检测系统要求具备较高的实时性,其中硬件加速平台是整个系统中最关键的部分。本项目设计的智能加速平台能够推理加速多种深度学习算法,帮助自动驾驶系统快速全面认知复杂路况、精准感知、预测车辆行驶过程中的交通情况,并且实时对周边环境做出准确的判断。此外,还可以应用在智能安防、智慧交通、工业生产等嵌入式领域。
该项目是我的本科毕业设计,主要设计了一种卷积神经网络(用于手写数字识别)推理的硬件加速器,使用 16 位定点数对网络参数进行量化,实验基于ZYNQ(XC7Z010)硬件平台,完成了加速器的实现与测试,最终使用 MNIST 测试集的准确率为 98.42%,与Tensorflow 32 位浮点数计算结果仅相差 0.05%;与CPU(i5-6200U)推理速度相比,单张图片推理加速比达到了84.8倍,10000 张图片推理加速比达到了43.6倍。
本文详细介绍了评估DNN加速器时需要考虑的指标和影响因素,并讨论了在设计DNN加速器时应该如何做trade-off。
Week3:本周学习的知识主要包括:Verilog的基本语法知识以及一个简单的RISC处理器的硬件组成,并使用Verilog描述了各个硬件模块的功能。
Week2:本周学习的知识主要包括:首先介绍了芯片工艺制造过程中缩放定律(Dennard Scaling)的变迁,在该变迁过程中,由于受到功耗的限制,产生了所谓的暗硅现象(Dark Silicon);其次介绍了指令集架构(ISA)的概念和研究内容,详细阐述了CISC和RISC的区别,并介绍了一个评判ISA性能的理论公式;最后介绍了一个4条指令的极简RISC-V指令集的案例。
Week1:本周主要介绍了人工智能时代下计算机体系结构的现状、计算机的发展历史以及早期神经科学的发展与神经网络(多层感知机)的原理。
在神经网络中,存在着大量的参数,如果这些参数都用浮点数表示,将会消耗大量的硬件资源,这对于硬件资源有限的嵌入式平台是十分不友好的。在实际硬件实现中,往往采用将浮点数进行定点化处理,用定点数来表示浮点数。
Update your browser to view this website correctly. Update my browser now