(1)(Million Instructions Per Second)
它表示每秒百万指令条数。对于一个给定的程序,MIPS 定义为:

程序的执行时间为:

MIPS愈高,则机器的执行愈快。
但是MIPS有三个方面的缺陷:
1)MIPS依赖于指令集,所以用MIPS来比较指令集不同的机器的性能好坏是很不准确的。
2)在同一台机器上,MIPS因程序不同而变化,有时是很大的。
3)MIPS可能与性能相反!
最后一种情况的典型例子就是具有可选硬件浮点运算部件的机器。因为浮点运算远慢于整数运算,所以很多机器提供了可选的硬件浮点运算部件,但是软件实现浮点运算的MIPS高,然而硬件实现浮点运算的时间少,这时MIPS与机器性能恰好相反。类似的情况在具有优化功能的编译器中也可发现。
(2)
MFLOPS(Million Floating Point Operations Per Second)
另一种替代标准是MFLOPS即每秒百万次浮点操作次数。

MFLOPS 仅仅能用来衡量机器浮点操作的性能,而不能体现机器的整体性能。例如编译程序,不管机器的性能有多好,它的MFLOPS不会太高。
MFLOPS是基于操作而非指令的,所以它可以用来比较两种不同的机器。因为同一程序在不同的机器上执行的指令可能不同,但是执行的浮点运算却是完全相同的。
  MFLOPS也并非可靠,因为不同机器上浮点运算集却不同,例如CRAY-2没有除法指令,而Motorola 68882 却有。另外MFLOPS还依赖于操作类型。例如100%的浮点加要远快于100%的浮点除。单个程序的MFLOPS值并不能反映机器的性能。所以MFLOPS也不是一个十分有用的替代标准。
(3)用基准测试程序来测试评价机器的性能
一般有四种级别的程序可采用。下面按评价准确性递减的顺序分别予以列出:
1)实际的应用程序-运行例如C编译程序、 Tex 正文处理软件等等。
2)核心程序方法-人们实际的程序中抽取少量关键循环程序段,并用它们来评价机器的性能。Livermore Loops和Linpack就是最好的例子。
3)玩具基准测试程序-通常只有10-100行而且运行结果是可以预知的。例如Sieve of Erastosthenes, Puzzle 和Quicksort等程序。
4)综合基准测试程序-它类似于核心程序,但它考虑了各种操作和各种程序的比例,Whetstone和Dhrystone 是典型代表。