、(12分,每空1分)填空


    (1) 在虚拟存储器中有三种地址空间,一种是应用程序员用来编写程序的地址空间,称为 ,第二种是 的地址空间,第三种是辅存地址空间,也就是磁盘存储器的地址空间。它们对应的三种地址分别是 和辅存地址。

    (2) 按照Flynn分类法,根据指令流和数据流的不同组织方式,计算机系统的结构可以分为SISD(单指令流单数据流)、MISD、

    (3) 为了满足向量计算机中运算器带宽的要求,通常有两种存储器系统结构,它们是

    (4) 在CISC中,各种指令的使用频度相差悬殊,大致有以下的结果。大约有 (比例)的指令使用频度较高,占据了 (比例)的处理机时间。

    (5) 我们可以把流水线分成不同的类别。多功能流水线可以分为两种,即根据它在同一时间内是否能连成多种方式,可以分为


   

二、(10分,每题2分)解释下列名词

    (1) MIPS

    (2) 虫蚀寻径(wormhole)

    (3) 向量链接

    (4) 超标量处理机

    (5) 机群计算机系统


 

三、 问答题


    1.(8分)一台模型机共有7条指令,各指令的使用频度分别为35%,25%,20%,10%,5%,3%,2%,有8个通用数据寄存器,2个变址寄存器。 (1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。 (2) 设计8位字长的寄存器-寄存器型指令3条,16位字长的寄存器-存储器型变址寻址方式指令4条,变址范围不小于正、负127。请设计指令格式,并给出各字段的长度和操作码的编码。


    2.(10分)某工作站采用时钟频率f为15MHZ,处理速率为10MIPS的处理机来执行一个已知混合程序。假定每次存储器存取为1周期延迟,试问: (1)(4分)此计算机的有效CPI是多少 (2)(6分)假定将处理机的时钟频率f提高到30MHZ,但存储器子系统速率不变。这样,每次存储器存取需要两个时钟周期,如果30%指令每条只需要一次存储存取,而另外5%每条需要两次存储存取,还假定已知混合程序的指令数不变,并与原工作站兼容,试求改进后的处理机性能。




    3.(10分)在下列不同结构的处理机上执行6×6的矩阵乘法C=A×B,计算所需要的最短时间。只计算乘法指令和加法指令的执行时间,不计算取操作数、数据传送和程序控制等指令的执行时间。加法部件和乘法部件的延迟时间都是3个时钟周期,另外,加法指令和乘法指令还要经过"取指令"和"指令译码"的时钟周期,每个时钟周期为20ns,C的初始值为"0"。各操作部件的输出端有直接数据通路连接到有关操作部件的输入端,在操作部件的输出端设置有足够容量的缓冲寄存器。 (1) (4分)处理机内只有一个通用操作部件,采用顺序方式执行指令。 (2) (6分)单流水线标量处理机,有一条两个功能的静态流水线,流水线每个功能段的延迟时间均为一个时钟周期,加法操作和乘法操作各经过3个功能段。



    4.(10分)假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段的时间分别为△t、2△t和3△t。在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。
     (1)(3分)顺序执行方式。 (2)(7分)"取指令"、"分析"和"执行"重叠。




   5.(10分)已知一个Cache共有4个块,每个块大小为4个字。采用直接映像方式,假设该Cache的缺失代价为8个时钟周期。初始时Cache为空,当程序执行过程中访存的字地址序列为0,7,12,9,16,8,17,0,12,2时 (1)(7分)试计算Cache的命中率 (2)(3分)计算Cache缺失(不命中)代价


    6.(10分)假设一个网络的频宽为10兆位/秒,发送方开销和接收方开销分别等于230微秒和270微秒。如果两台机器相距100米,现在要发送一个1000字节的消息给另一台机器,试计算总时延。如果两台机器相距1000公里,那么总时延为多大?



    7.(10分)设有下列流水线预约表:

 

1

2

3

4

S1

X

   

X

S2

 

X

   

S3

   

X

 

    分别写出禁止表F、冲突向量C、画出状态转换图,求出最小平均延迟及流水线的最大吞吐率(假设流水线的时钟周期为τ=20ns)。



    8.(10分)一台单处理机可以以标量方式运行,也可以以向量方式运行。在向量方式情况下,计算可比标量方式快9倍。设某基准程序在此计算机上运行的时间为T。另外,已知T的25%用于向量方式,其余的时间则以标量方式运行。 (1) 计算在上述条件下与完全不用向量方式条件下相比的加速比,并计算上述程序中向量化代码所占的比例 。 (2) 假设我们改进硬件使向量方式与标量方式之间的速度比加倍,试计算可达到的加速比。 (3) 如果要达到与(2)相同的加速比,用的方法是改进编译器,而不是改进硬件,那么,用向量化编译器支持同样的基准程序,其新的向量化比率是多少?