
书: https://pan.baidu.com/s/1xhc2t938Uhd6HLI6pHjlVg?pwd=77ya
笔记如下:
- FPGA架构核心:基于可编程逻辑块(CLB)、查找表(LUT)和布线资源实现硬件重构。
- AI加速优势:并行计算架构适配矩阵运算(GEMM)、卷积神经网络(CNN)等高吞吐需求。
- 量化技术:FP32→INT8/INT4模型压缩,提升资源利用率(DSP效率提高3-5倍)。
- 流水线设计:数据流(Dataflow)任务级并行,实现低延迟推理(如5ms内目标检测)。
- HLS开发:C/C++/OpenCL直接生成RTL代码,降低硬件开发门槛。
- 专用优化:Winograd算法减少卷积计算量,脉动阵列(Systolic Array)优化数据流动。
- 内存层级:BRAM缓存+数据复用策略减少外部存储访问,缓解带宽瓶颈。
- 动态功耗管理:时钟门控(Clock Gating)和电压调节实现能效优化(10 TOPS/W)。
- 异构计算:Zynq系列集成ARM核,CPU+FPGA协同处理控制与加速任务。
- IP核复用:调用预置AI加速核(如Xilinx DPU)快速部署ResNet/YOLO等模型。
- 边缘计算:无人机/工业质检场景中,FPGA低延迟特性优于GPU。
- 数据中心应用:微软Catapult项目加速Bing搜索,AWS F1实例支持定制化推理。
- 自动驾驶适配:激光雷达点云处理的确定性延迟满足实时性要求。
- 新兴架构:Xilinx Versal AIE引擎、Intel Agilex BF16支持强化AI算力。
- 工具链生态:TVM/Vitis AI编译器优化模型部署,开源工具(Verilator)降低开发成本。
- 安全机制:比特流加密保护IP,对抗侧信道攻击(如功耗分析)。
- 对比GPU:FPGA在能效比(TOPS/W)和延迟确定性上占据优势。
- 对比ASIC:FPGA灵活性适合算法迭代,ASIC适合量产固化场景。
- 开发实践:PYNQ等开发板快速原型验证,Vivado分析时序关键路径。
- 行业趋势:FPGA+AI向边缘智能、可重构计算(CGRAs)方向演进。