本书系统介绍了关于FPGA的设计与实现的研究成果。首先,引入数字系统的设计概念,使用FPGA设计实现,并给出基于FPGA的高性能加速的仿真结果;其次,展现更多有限状态机(FSM)的理论,阐述减少FPGA基本资源的方法,并讲述如何在FPGA中实现小化电路的延时。本书着重介绍了完全综合的硬件描述规范,提供大量基于提出的模型和方法的实际设计,探索了涉及核配置逻辑器件和大量嵌入模块的建模方法。本书可作为普通高等学校微电子、电气工程、自动化、能源工程等专业本科生和研究生相关课程的教材或参考书,也可为相关专业的工程技术人员对FPGA系统的研究设计提供参考。
现场可编程门阵列(FPGA)是Xilinx公司在1985年发明的。FPGA对工程各个方向的影响持续迅速增长。这样的进步有多方面原因,其中最重要的是FPGA的固有配置性及其廉价的升级成本。预测表明FPGA的影响会持续增长且应用范围会增加。近代的现场配置芯片合并了多核处理器和重复配置逻辑附件的一些常用器件,如数字信号处理器件和块存储器。基于FPGA的系统是可综合的,可在普通计算机使用集成设计环境中执行。这样的系统实验和探索普遍基于连接到相同环境的原型机板。
众所周知,且已证实FPGA可高效应用于工程应用中。一个原因是系统复杂性的增长很难使轮船设计不出错。因此,有必要在制造之后修正错误,而这个可在自定义器件中轻松完成。
当代芯片的复杂性随着时间呈指数增长,可用的晶体管数量比有意义的设计能力增长更快。这个情况是众所周知的设计生产力差距,且这个差距还在持续增长。
因此,设计生产力是将来系统的真实挑战。尽管在单位产量和收入方面,专用集成电路(ApplicationSpecificIntegratedCircuits,ASIC) 和专用标准产品(ApplicationSpecificStandardProducts,ASSP)超过了FPGA,但是预测FPGA设计开始数量是领先于ASIC/ASSP的设计开始。因此,FPGA高度参与设计电路和系统,并且需要更佳的设计产品,无疑需要巨大工程资源,这是技术普遍性的主要输出,本书旨在辅助相关课程。
FPGA的操作时钟频率比普通电脑和ASIC更低。最先进器件的成本很高,稍微便宜的芯片操作的时钟频率比不便宜的广泛使用的电脑更低。FPGA的最重要的应用是改善被执行系统的性能。为了实现通常较慢的器件加速,并行性需要高阶应用。
本书有两个目的,且由两部分组成。第一部分包含第1~5章及附录A和B(由ValerySklyarov和IouliiaSkliarova编写),引入数字系统的设计概念,使用现代FPGA并将作者所得结果呈现到基于FPGA的高性能加速。这一部分由5章节组成,这些章节具有扩展主题,通常包含数字系统,在这种方式下讨论基于FPGA的设计,由实例例证,由相关便宜的原型机板的实验支持。本书的第二部分包含第6~9章(由AlexanderBarkalov和LarisaTitarenko编写),覆盖更多的有限状态机(FSM)的理论知识,以及减少FPGA基本资源的主要目的(器件或查找表),最小化电路的延时,在FPGA中达到更佳的基础器件优化。
原书前言Ⅴ 与FPGA领域其他同类书相比,本书具有以下特点:
(1)每章都提供简明易懂的摘要(甚至对该领域的初学者都是合适的),扩展到更先进的主题,覆盖提出的、作者传播的和实际应用中的众多实例例证的新技术。
(2)完全综合的硬件描述规范(尤其是VHDL),对于众多描述的电路和系统,已经可以被测试和组成实际工程设计,对于未毕业和已毕业的学生而言都是必不可少的。
(3)大量实际设计基于提出的模型和方法,对于完全应用,讨论的领域如数据处理、组合搜索和计算,依赖层次有限状态机模型。
(4)探索模型和方法,涉及核配置逻辑器件和大量嵌入模块(如存储器和数字信号处理器件)和基于模板的电路。
本书提供以下额外特性:
(1)设计实例都在Xilinx和AlteraFPGA三类原型机板上测试过。最新的Nexys-4板属于Digilent,最新的Artix-7FPGA属于Xilinx7系列,以及众所周知的DigilentAtlys板,属于Spartan-6FPGA,用于大量实例中。许多工程也在DE2-115板中测试过,使用AlteraCyclon-IVeFPGA,这个芯片专为教育设计并广泛应用于大学课程。
(2)本书中所有VHDL例子都是可在线下载的,网址是http: //sweetuapt/skl/Springer2014html。该网址也提供最新升级的工程。这些工程可以下载测试并立即评估。每个实例包括简明的说明、VHDL代码、用户约束文件和所选择FPGA的比特流。
本书各章内容如下:
第1章引入FPGA结构,通过表现现代器件的普通结构并解释核器件,以及最重要的嵌入模块,比如存储器和数字信号处理器件。讨论一些典型的基于FPGA的设计方案,覆盖了规范阶段,提供物理约束、执行、配置和最后的测试。在这章的摘要部分,设计规范表现在原理图级,其中电路从供应商特供库中的可用器件、用户定义模块或合理定制的知识产权核。给出的一些简化实例可在基于FPGA的原型机板上测试。本书用的三类原型机板简要特色化,并介绍了在FPGA中执行电路和系统之间的交流。所有处理步骤都通过大量实例进行介绍。
第2章简要介绍综合VHDL,足够用于在没有太多背景知识的情况下理解给出的设计方法和例子。这一章的主要目的是解释基本VHDL模块及其规范能力。有许多很好地介绍VHDL的书可用于补充本书。我们的初级目的是综合和优化基于FPGA的电路和系统,VHDL是本书用于描述理想功能和结构的工具。因此,本章旨在便于读者阅读后续内容。
第3章首先简要介绍广泛使用的简单组合和时序电路。许多实例与在FPGA中执行的电路同时给出。接下来介绍众多优化技术,特别强调板并行性,对于基于基于FPGA的系统优化与综合Ⅵ FPGA的应用很重要。引入更复杂的数字电路和系统,比如并行网络用于排序和搜索、汉明权重计数器/比较器、并发向量处理单元和先进的有限状态机。设计这样的电路使得众多操作数据可以并行执行。基于网络的方案,比如排序和计数网络,足够映射电路到FPGA原语(查找表)。讨论并评估大量可用竞争方法。所有电路和系统都用VHDL描述,在FPGA中执行和测试,最后应用各种标准评估。提出的许多新方法都是可综合的,使得很复杂的工程在FPGA中完成,用于解决不同领域的先进问题,比如数据处理核组合搜索。
第4章首先例证商业可用知识产权核可以嵌入不同设计中。尤其描述了数字信号处理片构建的算术电路和参数化存储块提供支持数据缓冲(如FIFO,即先进先出)。给出数字信号处理器的更多细节,且表明这些如何高效用于实际电路,如汉明权重计数器/比较器。本章的主要致力于主机和基于FPGA的原型机板通过Digilent增强并行接口和通用异步接收和传输(UniversalAsynchronousReceiverandTransmitter,UART)接口的交互。描述了交流模块的完整细节,包括由C语言发展的通用计算机的软件和FPGA的硬件。下一部分将设计的模块用于包含不同目的的交流工程。更复杂的设计用于第3章基于网络的迭代数据排序,以这种方式执行和测试,并作为完整的功能实例。本章总结简要的描述可编程片上系统(PSoC),组合了嵌入处理系统和重复配置逻辑,通向更高效的应用执行。给出并讨论提出的映射第3章的设计到PSoC的方法。
第5章概述基于层次和并行规范的设计技术。首先引入层次计算图(HGS),使复杂的数字控制算法被解体为更高效的描述。HGS描述的模块是基本实体,提供技术基础,是自动、完整和潜在可重复使用的器件。必须设计模块如下:①可以独立于其他模块测试;②具有良好定义的外部接口可重复用于不同规范。这表明HGS(模块)可以在具有栈存储器的层次有限状态机(HFSM) 执行。给出许多VHDL实例用于例证HFSM可以执行层次算法和支持递归算法。描述多类HFSM和可综合VHDL模板,也讨论并行规范和并行HFSM。许多全功能的VHDL实例对以上所有类型的HFSM进行了介绍和评价。这也表明软件程序可以通过使用HFSM模块映射到硬件。最后提出HFSM的变体优化技术。
第6章致力于在FPGA执行的MooreFSM的逻辑电路优化。给出功能和结构解体方法的普通特性。FPGA的特色是可分析的,减少查找表(LUT) 器件在MooreFSM的逻辑电路的数量。对于MooreFSM,分类的优化方法包括:①状态代码转换为伪等状态代码(PES);②状态代码表现为PES代码的并置和微操作集;③逻辑条件替换(FSM的输入变量)和其他变量。所有讨论的方法由实例例证。
第7章处理MooreFSM基于使用嵌入存储块(EMB)。讨论基于简单EMB的执行逻辑电路Moore和MealyFSM的方法。在这种情况下,一片EMB足以执行电路。
接下来讨论优化方法,基于逻辑条件替换和微操作集编码。考虑的方法基于编码FSM结构表的行。所有这些方法通向两级MealyFSM模块和三级MooreFSM模块。
原书前言Ⅶ 接下来,组合这三种方法用于FSM逻辑电路硬件优化。最后一部分考虑将基于PES的方法应用在基于EMB的MooreFSM中。所有讨论的方法均通过实例例证。
第8章致力于基于EMB的FSM的逻辑电路优化。首先讨论基于逻辑条件替换表的设计方法,用于Moore和MealyFSM。接下来提出优化方法,这些方法基于分离逻辑条件集。这个方法减少了逻辑条件替换块中的电路的LUT数量。在MooreFSM的情况下,优化方法基于优化状态赋值和状态代码转换到PES类代码。所有讨论的方法均通过实例例证。
第9章致力于使用数据通路减少基于FPGA的MooreFSM逻辑电路中的LUT数量。首先提出内状态转换的可操作执行准则。基于可操作器件的使用(加法器、计数器、移位器等) 对于计算代码的状态转换。接下来,为MooreFSM和内状态转换的可操作执行提出综合进程的基本结构。综合进程的结构依赖初始状态,比如FSM状态代码操作集。讨论操作执行转换的典型结构。接下来,对于计算状态转换代码,这个方法混合了传统和提出的方法。本章的最后一部分讨论所提出方法的有效性。
附录A包含简短描述本书的综合VHDL结构和保留字。
附录B提供大量代码实例,支持本书第一部分的工程。所有例子都在附录B中呈现,以便直接
译者序
原书前言
缩略语
第一部分 基于FPGA的数字电路与系统设计
第1章 FPGA结构、可重构结构、嵌入模块和设计工具3
1.1 介绍FPGA 3
1.2 FPGA器件的基础7
1.2.1 XilinxFPGA的可配置逻辑模块7
1.2.2 AlteraFPGA的逻辑器件10
1.3 嵌入模块11
1.3.1 嵌入存储器12
1.3.2 嵌入DSP模块15
1.4 时钟分配和复位17
1.5 设计工具19
1.6 执行和原型机24
1.7 基于FPGA的电路和系统的交互29
参考文献35
第2章 基于FPGA器件的综合VHDL 37
2.1 介绍VHDL 37
2.2 数据类型、对象和操作数43
2.3 组合进程和时序进程48
2.3.1 组合进程49
2.3.2 时序进程52
2.4 函数、进程和模块56
2.5 类和生成62
2.6 库、包和文件67
2.7 行为仿真72
2.8 原型机76
参考文献78
第3章 设计技术80
3.1 组合电路80
3.1.1 译码器83
3.1.2 解码器83
3.1.3 多路复用器84
3.1.4 比较器85
3.1.5 算术电路85
3.1.6 桶形移位器86
3.2 顺序电路86
3.2.1 寄存器86
3.2.2 移位寄存器87
3.2.3 计数器87
3.2.4 有累加器的算术电路88
3.3 有限状态机89
3.4 基于FPGA电路和系统的优选92
3.4.1 高并行性的基于网络的解决方案93
3.4.2 硬件加速器98
3.4.3 块化分层FSM运行的并行算法98
3.5 并行排序的设计实例99
3.6 并行搜索的设计实例104
3.7 并行计数器的设计实例109
3.8 计数网络的设计实例112
3.9 基于LUT的汉明权重计数器/比较器的设计实例115
3.10 向量操作的设计实例121
参考文献125
第4章 嵌入模块和系统设计127
4.1 IP芯片127
4.2 嵌入DSP 136
4.3 FPGA交互141
4.3.1 Digilent并行端口接口141
4.3.2 UART接口149
4.4 软硬件协同设计和协同仿真160
4.4.1 Digilent并行接口的软硬件协同设计161
4.4.2 UART接口的软硬件协同设计168
4.5 可编程片上系统177
基于FPGA的系统优化与综合
Ⅹ
参考文献181
第5章 基于层次和并行技术规范182
5.1 模块化层次结构规范182
5.2 层次有限状态机186
5.2.1 具有明确模块的HFSM的HDL模板187
5.2.2 具有不明确模块的HFSM的HDL模板195
5.3 HFSM的综合196
5.3.1 具有明确模块的HFSM的综合196
5.3.2 具有不明确模块的HFSM的综合203
5.4 并行规范和并行HFSM 204
5.5 基于HFSM模型的软件程序的硬件执行212
5.6 嵌入式或分布式栈存储器215
5.7 优化技术217
5.7.1 层次返回217
5.7.2 HGS的多入口点219
5.7.3 快栈解除219
5.8 实际应用219
参考文献225
第二部分 基于FPGA电路和系统的有限
状态机的优化方法
第6章 MooreFSM 逻辑电路的硬件减少231
6.1 现有方法的一般特点231
6.2 MooreFSM中的目标转换237
6.3 MooreFSM的状态代码扩展式241
6.4 替代逻辑条件综合MooreFSM 248
参考文献252
第7章 嵌入存储模块设计FSM 254
7.1 Mealy和MooreFSM的简单执行254
7.2 FSM的结构解体259
7.3 解码微操作集设计MealyFSM 262
7.4 解码兼容微操作域设计MealyFSM 265
目 录
Ⅺ
7.5 解码结构表行设计MealyFSM 267
7.6 基于MooreFSM的伪等状态优化BIMF 272
参考文献276
第8章 优化具有嵌入存储块的FSM 278
8.1 MPMealyFSM的简单执行278
8.2 LUTer的优化285
8.3 基于伪等状态优化LUTer 290
8.4 基于微操作集编码优化LUTer 299
参考文献306
第9章 操作实现转换的FSM 307
9.1 转换操作执行的概念307
9.2 转换可操作生成的FSM组织309
9.3 FSM设计实例312
9.4 具有OAT的FSM的综合进程结构表达315
9.4.1 具有OAT的FSM的综合进程的基本结构316
9.4.2 改良综合进程的基本结构317
9