1. 把N个互相独立的数叫做"向量",对这样一组数的运算叫做"向量处理"。一条向量指令可以处理N个或N对操作数。
2. 向量处理的方式
(1). 横向处理方式:向量计算是按行的方式从左至右横向进行。
(2). 纵向处理方式:向量计算是按列的方式自上而下纵向进行。
(3). 纵横处理方式:横向处理和纵向处理相结合的方式
3. 向量处理机一般有如下两种结构:
(1). 利用几个独立的内存模块来支持对相互独立的资料的并发访问,从而达到所要求的内存带宽,即存储器-存储器结构。在运算流水线的输入端和输出端增加了缓冲器以便消除争用内存的现象。
(2). 构造一个具有所要求带宽的高速中间内存,并能实现该高速中间内存与主存储器之间的快速资料交换,即寄存器-寄存器结构。设计这种系统结构的主要思想是使操作数离处理器很近,以保证处理器一直处于忙状态。中间内存提供给处理器快速存取的资料,而成本又比较低。
4. 向量数据表示
(1)从标量到向量
(2)等间距向量表示法
(3)带位移量的向量表示法
(4)稀疏向量表示法
5. 向量处理机系统结构的设计目标
(1). 较好的维持向量/标量性能平衡。
(2). 可扩展性随处理机数目的增加而增加。
(3). 可扩展性的三个目标是:规模可扩展性,换代可扩展性,问题可扩展性。
(4). 增加内存系统的容量和性能。
(5). 提供高性能的I/O和易访问的网络。
6. 提高向量处理机性能的常用技术
(1). 链接技术
(2). 向量循环或分段开采技术
(3). 向量递归技术
8 向量指令的处理时间
其中,Ts为向量流水线的建立时间,它包括向量起始地址的设置、计数器加1、条件转移指令执行等。Tvf为向量流水线的流过时间,它是一条指令从开始译码到流过流水线得到第一个结果元素的时间。Tc为流水线"瓶颈"段的执行时间。
一组向量操作的执行时间主要取决于下面三个因素:向量的长度、向量操作之间是否存在流水功能部件的冲突和数据的相关性。
9 最大性能R∞表示当向量长度为无穷大时的向量流水线的最大性能。常在评价峰值性能时使用,单位为MFLOPS。它可表示为:

因为分子的值与n无关,所以
10 n1/2为达到一半R∞值所需的向量长度。它是评价向量流水线建立时间对性能影响的参数。它表示为建立流水线而导致的性能损失。
11 向量长度临界值nv表示向量流水方式的工作速度优于标量串行方式工作时所需的向量长度临界值。该参数既衡量建立时间,也衡量标量、向量速度比对性能的影响。
|