计算机体系结构（复习资料）

第一章：计算机体系结构的基本概念

1.存储程序计算机（冯诺依曼）：4部分

            运算器（用于完成数值运算）

            存储器（用于存储程序和数据）

            输入输出设备（用于完成计算机与外部信息交互）

            控制器（根据程序形成控制序列，完成对数据的运算）

** 冯诺依曼计算机特点**：

    （1）机器以运算器为中心

    （2）采用存储程序原理，程序（指令）和数据放在同一存储器中

    （3）存储器事按地址访问的，线性编址空间。

    （4）控制流由指令流产生。

    （5）指令由操作码和地址码组成。

    （6）数据以二进制代码表示。

2.程序员所看到的机器属性：

** ** （1）数据表示，硬件能直接辨认和处理的数据类型。

    （2）寻址规则，包括最小寻址单元，寻址方式及其表示。

    （3）寄存器定义，包括各种寄存器的定义，数量，使用方式。

    （4）指令系统，包括机器指令的操作类型和格式，指令间的排序和控制机构。

    （5）中断系统，中断的类型和中断响应

    （6）机器工作状态的定义和切换，如管态和目态

    （7）存储系统，主存容量，程序员可用的最大容量

    （8）信息保护，包括信息保护方式和硬件对信息保护的支持。

    （9）I/O结构，包括i/o连接方式，处理机/存储器与i/o设备数据的传送方式和格式及i/o操作的状态

** 3.计算机体系结构包括计算机系统设计的三个方面：**

** **计算机指令系统

    计算机组成

    计算机硬件

4，并行性概念：在同一时刻或是同一时间间隔内完成两种或者两种以上性质相同或者不相同的工作。（把两个或多个事件在同一时刻发生的并行性交错同时性，把两个或者多个事件在同一时间间隔内发生的并行性交错并发性）

5.提高并行性的技术途径：

** ** （1）时间重叠：（多个处理过程在时间上相互错开，轮番使用同意硬件的各个部分）

    （2）资源重复：（通过重复设置硬件资源，从而大幅提升计算机系统性能）

    （3）资源共享：（多个任务按照一定的时间顺序轮流使用同一套硬件设备）

6.Amadahl定律：

** **加速比=（改前）总执行时间/（改后）总执行时间

               =1/（1-可改比）+可改进比例/部件加速比

例1：

解答：

例2：

解答：

7.CPU性能：

    CPU时间=总时钟周期数/时钟频率

    CPI（指令时钟数）=总时钟周期数/IC（指令数）

第2章指令系统

1，指令系统结构的分类：

    堆栈型结构：

    累加器结构：

    通用寄存器结构：根据操作数不同又细分。RM型（寄存器-储存器型操作数可来自存储器）RR型（寄存器-寄存器结构操作数都来自通用寄存器）

2，设计指令的基本准则

    完整性：在有限可用存储空间内，解决任何问题指令系统提供的指令都足够使用。

    规整性：所有指令系统相关的存储使用，操作码的设置是对称的，不同操作数类型，字长，和数据存储单元，指令的设置都要同等对待。

    正交性：指令中各个不同含义的字段在编码时互不相关。相互独立

    高效性：指令执行的速度快，使用频度高。

    兼容性：实现向后兼容，指令系统可增加新指令。

3，RISC指令：尽可能把指令系统简化，指令条数少，功能简单。

  CISC指令：增强指令功能，把越来越多功能给硬件实现。存在（1）指令频度相差悬殊（2）指令系统庞大，条数太多，太复杂占用大量cpu面积，成本高（3）操作繁琐，规整性不好的问题

4，指令操作码设计

    例：

解答：

第三章：流水线技术

1，流水线技术及特点：流水指将一个重复的时序过程，分解成若干个子过程，每个子过程都可以有效的在其专用功能段上与其他子过程共同执行。

    特点：（1）流水由多个相关联的子过程组成，每个过程称为流水的“级”或“段”。段数称为“深度”或“流水深度”。（2）每个子过程由专用的功能段实现。（3）各段的时间应尽量相等（4）流水线需要有通过时间，此后进入稳定状态。（5）流水技术适合大量重复的过程。

2，流水的分类：

** **1，单功能流水（完成单一功能）和多功能流水（完成不同功能）。

    2，静态流水（各段按同一功能的连接方式工作）和动态流水（一些段实现某种运算，另一些段实现其他运算）。

    3，部件级，处理机级及处理机间流水线。

    4，标量流水处理机和向量流水处理机。（有无向量数据表示）

    5，线性流水和非线性流水。（有无反馈机制）

3，MIPS流水线改进：

简单的数据通路：

增加数据寄存器：

增加定向路径：

优化分支：

4，流水性能分析：

 吞吐率：是单位时间内流水线所完成的任务数或输出结果数量。

 最大吞吐率：稳定流水的吞吐率TPmax=1/▲t（与最慢的那一段执行时间有关）

 加速比：指m段流水线的速度和等功能非流水速度之比（不用流水的X轴坐标/用流水的X轴坐标）   

 效率：流水设备的利用率（运行的格子/总格子数）

例题：

时空图：

计算：

效率：E=n/m=46+34/18*8=0.25

5，流水中的相关

    结构相关：指令在同步重叠执行过程中，硬件资源满足不了指令重叠执行的要求。

    数据相关：当前一条指令需要用到前面指令的执行结果，而这些指令都在流水折叠执行。

    控制相关：当流水线遇到分支指令和其他能改变pc值的指令就会发生控制相关。

6，数据相关分类

** **写后读相关：读的操作先于写，导致读到不正确的值。

    写后写相关：第一个写操作速度没有第二个写操作快，导致写入的值应为操作2实际是操作1

    读后写相关：本应该先读后写，结果写快了，读到的数据是后来新写进去的值发生错误。

**7，定向技术:**某条指令产生一个计算结果之前，其他指令并不真正需要这个计算结果，如果能够将该计算结果从其产生的地方直接送到其他指令需要的地方，就可避免暂停。

8.通过时间、排空时间：分别指第一个任务和最后一个任务进入流水到流出结果的时间段。这两个流水都不是满载的。

第四章：指令级并行

1，指令级并行的概念：当指令之间不存在相关时，在流水上可以叠加执行则为指令并行。

2.循环展开：将循环中多个基本块展开成一个基本块，从而可以在其中填充stall。

例题：115页 4.2

3.指令调度：通过预先分离出指令，并重排指令的顺序避免指令流水线停顿。

** 动态调度：**通过硬件重新安排指令的执行顺序，调整相关指令实际执行时的关系减少空转。

4.记分牌：记分牌算法允许乱序执行，将基本流水的（译码）阶段再分为（流出）和（读操作数）两个阶段。

5.Tomasulo算法：

    Tomasulo算法的基本思想，只要操作数有效，就将其取到保留站，避免指令流出时才到达寄存器中取数据，使得即将执行的指令从相应的保留站中取得操作数，而不是从寄存器中。指令的执行结果也将直接送到等待数据的其它保留站中去。

    换名功能由（保留站的编号）来完成的要扩充Tomasulo算法支持前檐执行，需将Tomasulo算法中写结果段分为（写结果）和（指令确认）两个阶段。

第五章：存储层次

1，多级存储层次：寄存器-Cache-主存-辅存。分别为M1，M2，M3，M4.

两种存储层次的关系：在cpu和主存之间增加cache弥补主存速度不足的缺陷。另一个是在主存外面增加一个容量更大，价格更低的辅存（磁盘）。

2.性能参数:

   命中率：H=N1/N1+N2（N1，N2为在M1与M2访问的次数）

 平均每位价格C=C1S1+C2S2/S1+S2（C1，C2为M1，M2的价格，S1，S2为M1，M2的容量）

  平均访问时间 TA=TA1+(1-H)TM

3.改进cache性能的三种方式：

（1）降低失效率：调节cache块的大小，提高相联度，Victim cache，硬件预取，编译优化

（2）减少失效开销：写缓冲写合并，读失效优先于写，请求字处理，多级cache，非阻塞cache

（3）减少cache命中时间：用小容量结构简单的cache，虚拟cache，访问流水，多体cache等等

** 5.三种映射的特点：**

    直接映射：主存块只能被放置到唯一的一个cache的方式。

    全相联映射：主存块可以被放置到任意一个cache块位置

    组相联映射：主存块可以放到cache中唯一一个组的任何一个位置.

6.写直达：不仅把信息写入cache中响应的块，而且也写入下一级存储器中。

写回法：只把信息写入Cache中相应的块。该块只有在被替换的时候才被写回下一级存储器。

第六章：输入输出系统

1.I/O系统可以通过（响应时间）和（可靠性）参数衡量其性能

2.磁盘阵列

    RAID0：数据直接分布在多个磁盘上，无冗余。（速度快，容量大，可靠差）

    RAID1：数据采用镜像，拥有一个冗余。（读写操作快，容量小，可靠性高）

    RAID5:交叉分布式奇偶校验(冗余小，读写快，但是设计复杂)

3.DMA访问方式

    1.使操作系统在I/O的传输过程中确保DMA设备访问的页面都位于物理存储器中，这些页面都是锁定在主存的页面。

    2.采用“虚拟DMA技术”，它允许DMA设备直接使用虚拟地址，DMA期间由硬件将虚拟地址映射到物理地址。

4.通道：为减轻CPU负担管理外设的I/O

            1通道的功能：接受来自cpu的i/o指令，根据指令与指定的外设进行连接

            2执行CPU为通道组织的通道程序

            3为主存和外设设置传输控制信息。

            4指定后才能送工作结束时进行的操作

            5检查外设的工作方式

            6在传输数据过程中完成必要的数据格式变换。

选择题：

1，从计算机系统结构来看，机器语言程序员看到的机器属性是（ A ）。

    A.编程要用到的硬件组织             B.计算机硬件的全部组成

    C.计算机软件所完成的功能         D.计算机各部件的硬件实现

2，计算机系统结构不包括（C）

    A.机器工作状态        B.信息保护

    C.主存速度               D.数据表示

3，多处理器实现的并行主要是（B）

A.指令级并行 B.任务级并行 C.操作级并行 D.操作步骤的并行

4，RISC执行程序的速度比CISC要快的原因是（A）

A.RISC的指令平均执行周期数少 B.RISC的指令系统中指令条数较少

C.程序在RISC上编译生成的目标程序较短 D.RISC只允许load和store指令访问

5.下列符合RAID5的说法正确的使（D）

A.磁盘所能使用的空间只有磁盘容量的一半 B .有单独指定的奇偶盘

C.没有冗余或错误修复能力 D.交叉存取数据及奇偶校验信息于所有磁盘上

6.i/o数据不经过cpu内部寄存器的i/o方式是（D）

A程序控制i/o方式 B中断输入输出方式

C堆栈访问方式 D直接存储访问方式

7.当计算机系统通过执行通道程序完成i/o工作时，执行通道程序的是（A）

A通道 B.cpu C.cpu和通道 D.指定的外设

8.磁盘存储器适合连接到（B）

A.字节多路通道或选择通道 B.字节多路通道或者数组多路通道

C选择通道或者数组多路通道 D.任意一组通道

标签：系统架构

本文转载自: https://blog.csdn.net/qq_48496633/article/details/124431262
版权归原作者 小拇指～ 所有，如有侵权，请联系我们删除。