Untitled Document

（1）（Million Instructions Per Second）
它表示每秒百万指令条数。对于一个给定的程序，MIPS 定义为：

程序的执行时间为：

MIPS愈高，则机器的执行愈快。
但是MIPS有三个方面的缺陷：
1）MIPS依赖于指令集，所以用MIPS来比较指令集不同的机器的性能好坏是很不准确的。
2）在同一台机器上，MIPS因程序不同而变化，有时是很大的。
3）MIPS可能与性能相反！
最后一种情况的典型例子就是具有可选硬件浮点运算部件的机器。因为浮点运算远慢于整数运算，所以很多机器提供了可选的硬件浮点运算部件，但是软件实现浮点运算的MIPS高，然而硬件实现浮点运算的时间少，这时MIPS与机器性能恰好相反。类似的情况在具有优化功能的编译器中也可发现。
（2）MFLOPS(Million Floating Point Operations Per Second)
另一种替代标准是MFLOPS即每秒百万次浮点操作次数。

MFLOPS 仅仅能用来衡量机器浮点操作的性能，而不能体现机器的整体性能。例如编译程序，不管机器的性能有多好，它的MFLOPS不会太高。
MFLOPS是基于操作而非指令的，所以它可以用来比较两种不同的机器。因为同一程序在不同的机器上执行的指令可能不同，但是执行的浮点运算却是完全相同的。
　　MFLOPS也并非可靠，因为不同机器上浮点运算集却不同，例如CRAY-2没有除法指令，而Motorola 68882 却有。另外MFLOPS还依赖于操作类型。例如100%的浮点加要远快于100%的浮点除。单个程序的MFLOPS值并不能反映机器的性能。所以MFLOPS也不是一个十分有用的替代标准。
（3）用基准测试程序来测试评价机器的性能
一般有四种级别的程序可采用。下面按评价准确性递减的顺序分别予以列出：
1）实际的应用程序-运行例如C编译程序、 Tex 正文处理软件等等。
2）核心程序方法-人们实际的程序中抽取少量关键循环程序段，并用它们来评价机器的性能。Livermore Loops和Linpack就是最好的例子。
3）玩具基准测试程序-通常只有10-100行而且运行结果是可以预知的。例如Sieve of Erastosthenes, Puzzle 和Quicksort等程序。
4）综合基准测试程序-它类似于核心程序，但它考虑了各种操作和各种程序的比例，Whetstone和Dhrystone 是典型代表。