一. 计算机习题概述1.计算机硬件的基本组成1.1 冯诺依曼结构1.2 现代计算机结构2.各个硬件功能概况2.1 主存储器2.2 运算器2.3 控制器2.4 计算机层次结构3. 计算机的性能指标3.1 存储器的性能指标3.2 CPU的性能指标3.3 系统整体性能指标3.4 总结二. 数据的表示与运算1. 进位计数制1.1 $r$ 进制转化为十进制1.2 二进制转化为八进制和十六进制1.3 十进制转化任意进制1.4 真值和机器数2. BCD码2.1 8421码2.2 其他码3. 无符号整数的表示和运算4. 带符号整数在计算机中应用4.1 原码表示法4.2 原码计算方式4.3 移码4.4 原码、补码、反码和无符号整数特性4.5 定点小数表示和运算4.6 奇偶校验码5. 字符与字符串6. 算术逻辑单元6.1 最基本的逻辑运算6.2 复合逻辑运算逻辑运算实现偶校验位逻辑运算实现一位全加器6.3 并行加法器优化7. 补码加减运算器7.1 补码加法器原理7.2 标志位的生成7.3 加减运算和溢出判断8. 移位运算8.1 算数移位8.2 反码算数移位8.3 补码算数移位8.4 逻辑移位8.5 循环移位9. 原码与补码的运算9.1 乘法运算原码乘法运算补码乘法运算9.2 除法运算原码的除法补码的除法9.3 C语言强制类型转换10. 数据的存储与排列10.1 大小端存储10.2 边界对齐11. 浮点数表示与运算11.1 浮点数表示11.2 浮点数尾数规格化11.3 浮点数标准IEEE 75411.4 浮点数运算11.5 浮点数强制类型转换三. 存储系统1. 主存储器基本组成1.1 存储芯片基本原理1.2 寻址方式实现2. SRAM和DRAM2.1 SRAM和DRAM区别2.2 DRAM的刷新2.3 DRAM地址线复用技术3. ROM3. 主存优化3.1 双端口RAM3.2 多体并行存储器3.3 单体多字存储器4. 主存储器与CPU连接4.1 位扩展4.2 字扩展4.3 几种常见译码器5. 磁盘存储器5.1 磁盘设备的组成5.2 磁盘的性能指标5.3 磁盘工作原理5.4 磁盘阵列6. 固态硬盘SSD7. Cache缓存7.1 Cache基本原理与概念Cache工作原理性能分析有待解决的问题7.2 Cache主存映射方式全相联映射直接映射组相联映射7.3 Cache替换算法随机替换算法先进先出替换算法近期最少使用算法最不经常使用算法7.4 Cache写策略写命中写不命中多级Cache8. 页式存储器8.1 页表8.2 快表9. 虚拟存储器9.1 页式虚拟存储器9.2 其他虚拟存储器

一. 计算机习题概述

$=$ $+$ 软件

硬件：计算机的物理性能，决定计算机性能天花板在哪

软件：计算机的虚拟性能，决定硬件性能可以发挥到什么程度。可分为系统软件和应用软件：

系统软件：用来管理整个计算机系统。如：操作系统，DBMS，服务程序等。
应用软件：按任务需要编制成的各种程序。如：微信，QQ等。

计算机功能好坏取决于"软"，"硬"件功能的总和。计算机组成原理重点讨论硬件内容。

计算硬件发展：

计算机目前的发展趋势：一方面向更微型、多用途方向发展；另一方面向更巨型，超高速方向发展。

1.计算机硬件的基本组成

1.1 冯诺依曼结构

提出设想：

提出"存储程序的概念"：将指令以二进制的形式先输入计算机的主存储器，然后按其在存储中的首地址执行程序的第一条指令，以后就按该程序的规定顺序执行其他指令，直到程序执行结束。

冯诺依曼机

处理步骤：

输入设备：将信息转化成机器能识别的形式
存储器：存放数据和程序
运算器：算术运算和逻辑运算
控制器：指挥程序运行
输出设备：将结果输出

在计算机系统中，软件和硬件在逻辑上是等效的。对于同一个功能，既可以用软件实现也可以用硬件实现，但用软件实现成本低，效率也低；而用硬件实现成本高，效率也高。如：对于乘法运算，可以设计一个专门的硬件电路实现乘法运算也可以用软件的方式，执行多次加法运算来实现。

冯诺依曼计算机的特点：

计算机由五大部件组成
指令和数据以同等地位存于存储器，可按地址寻访
指令和数据用二进制表示
指令由操作码(如：加减乘除)和地址码组成
存储程序：会提前将指令和程序存放到存储器中
$/$ 输出设备与存储器之间的数据传送通过运算器完成。由于运算器还要完成数据中转操作，所以执行效率会降低。

1.2 现代计算机结构

现代计算机结构本质上是冯诺依曼结构的优化。

优化后的冯诺依曼结构：

传统冯诺依曼结构是以运算器为中心，数据传输都需要通过运算器作为中转。而现代计算机通常以存储器为中心，同时运算器和控制器之间的联系也十分紧密，所以将其结合起来就是CPU。即 $=$ $+$ 控制器。

现代计算机结构：

$I/O$ 设备会直接和主存储器进行数据交换。

控制器控制运算器进行数据操作(如：加减乘除)，另外也会控制主存储对CPU的读写，及输入输出设备的停止和启动。

$x,y$ 之类的变量)。另一种是放在控制器中的指令，指令会由控制器解析其含义。

主存储器和CPU统称为主机。

现代计算机硬件结构：

$I/O$ 设备。

现代冯诺依曼结构

总结：

2.各个硬件功能概况

2.1 主存储器

主存储器由三个部分构成：

$MAR$ 发送的数据地址，取出数据。
MAR(存储地址寄存器)：CPU将想要的数据地址存放到MAR中，即数据地址。
MDR(存储数据寄存器)：将存储体中取出的数据，写入MDR中，CPU可以通过数据线路从MDR中拿走数据。

存储步骤是：CPU将数据地址放入MAR中，将数据放入MDR中，之后存储体根据CPU指令将MDR中数据放入MAR指定的存储体地址中。

读取步骤是：CPU将读取地址放入MAR，存储体根据CPU指令将MAR中对应地址在存储体中找到并写入MDR中，CPU再从MDR中读取数据。

重点在存储体上：数据按地址存放在存储体中。

存储体结构：

存储单元：每个存储单元存放一串二进制代码。
存储字(word)：存储单元中二进制代码的组合。
存储字长：存储单元中二进制代码的位数（如：8bit，16bit，32bit，64bit）。
存储元：存储二进制的电子原件，每个存储元可存1bit。

数据在存储体中按地址存储，类似于Excel的一列表格。每个表格代表一个存储单元，每个存储单元存放一串二进制代码称为存储字，每个存储字包含多少个二进制位称为存储字长。

注： $=$ 存储字长。

$=$ $\Longrightarrow$ $2^4$ 个存储单元。(4位的排列组合：4！=4*3*2*1=24)

$=$ $\Longrightarrow$ $16bit$ $=16bit$ 。

计算机基本单位：

$/$ 字（bit）：最小的数据单位
$8$ $8$ $=$ 8b)，存储空间的最小单位。
B：1B=8b，K：1KB = 1024B，M：1MB=1024KB，G：1GB=1024MB，T,P,E

2.2 运算器

用于实现算术运算(如：加减乘除)、逻辑运算(如：与或非)

有四部分构成：

ACC：累加器，用于存放操作数，或运算结果。
MQ：乘商寄存器，在乘除运算时，用于存放操作数或运算结果。
X：通用的操作数寄存器，用于存放操作数。
ALU(核心部件)：算术逻辑单元，通过内部复杂的电路实现算术运算、逻辑运算。是运算器的核心单元。

ACC、MQ、X在进行加减乘除操作区别：

	加	减	乘	除
ACC	被加数、和	被减数、差	乘积高位	被除数、余数
MQ			乘数、乘积低位	商
X	加数	减数	被乘数	除数

2.3 控制器

指挥各个部件，使程序可以正常运行

主要有三部分构成：

CU(核心元件)：控制单元，分析指令，给出控制信号。是控制器核心元件。
IR：指令寄存器，存放当前执行的指令
$1$ 的功能

代码相当于指令，每完成一条指令过程：

取指令(PC)
根据PC中所记录的指令地址，从内存中取出该指令。
分析指令(IR)
将取出的指令由IR进行分析这条指令可以干什么。
执行指令(CU)。
分析完成后CU会控制其他部件完成指令具体执行。

程序在计算机中的运行过程：

$\Longrightarrow$ $\Longrightarrow$ $\Longrightarrow$ $\Longrightarrow$ $\Longrightarrow$ $\Longrightarrow$ $\Longrightarrow$ $\Longrightarrow$ ACC

例：给定以下高级语言分析其在计算机内执行过程。


1
int a=2,b=3,c=1,y=0;
2
void main(){
3
    y=a*b+c;
4
}

代码在主存结构如下：

$0\sim4$ y=a*b+c $5\sim8$ $a,b,c,y$ $16bit$ 。

运行步骤：

$=0$ $0$ 的第一行的指令
$PC$ $MAR$ $(PC)\xrightarrow{0}MAR$ $(MAR)=0$ $0$ 号地址所对应的指令。同时控制器会通过控制总线向主存发送读操作指令。
$MAR$ $0$ $MDR$ $主存(MAR)\rightarrow MDR$ $(MDR)=000001\quad 0000000101$
$(MDR)$ $IR$ $(MDR)\rightarrow IR$ $(IR)=000001\quad 0000000101$
$(IR)\xrightarrow{000001}CU$ $IR$ $000001$ $CU$ $CU$ 分析后得知，这是取数指令。
$(IR)\xrightarrow{0000000101}MAR$ $IR$ $MAR$ $(MAR)=5$ $0000000101$ $5$
$主存(MAR)\xrightarrow{5}MDR$ $(MDR)=0000000000000010=2$ $MAR$ $MDR$ 中
$MDR$ $ACC$ $(MDR)\xrightarrow{0000000000000010=2}ACC$ $(ACC)=0000000000000010=2$
$a=2$ $1,3,4$ $5$ $6,8,9$ 执行取数指令。
$PC$ $1$ $(PC)=1$ $1$ 的第二行的指令
$(PC)=1$ $(ACC)=\{a=2\}$
$PC\xrightarrow{1}MAR$ $(MAR)=1$
$主存(MAR)\rightarrow MDR$ $(MDR)=000100\quad0000000110$
$(MDR)\rightarrow IR$ $(IR)=000100\quad0000000110$
$(IR)\xrightarrow{000100}CU$ $IR$ $(000100)$ $CU$ $CU$ 分析后得知，这是乘法指令
$(IR)\xrightarrow{0000000110}MAR$ $IR$ $MAR$ $(MAR)=0000000110=6$
$主存(MAR)\xrightarrow{6}MDR$ $(MDR)=0000000000000011=3$
$主存(MDR)\xrightarrow{3}MQ$ $MDR$ $MQ$ 当中
$(ACC)\xrightarrow{a=2}X$ $ACC$ $a$ $2$ $X$ $(X)=2$
$CU$ $ALU$ $(MQ)*(X)\xrightarrow{2*3=6}ACC$ $(ACC)=6$ $MQ$ 辅助存储。
$a*b$ $1,3,4$ $5$ $6,8,9,10,11$ 执行乘法指令。
$PC$ $1$ $(PC)=2$ $2$ 的第三行的指令
$(PC)=2$ $(ACC)=\{6\}$
$PC\xrightarrow{2}MAR$ $(MAR)=2$
$主存(MAR)\rightarrow MDR$ $(MDR)=000011\quad000000011$
$(MDR)\rightarrow IR$ $(IR)=000011\quad000000011$
$(IR)\xrightarrow{000011}CU$ $IR$ $(000011)$ $CU$ $CU$ 分析后得知，这是加法指令
$(IR)\xrightarrow{000000011}MAR$ $IR$ $MAR$ $(MAR)=000000011=7$
$主存(MAR)\xrightarrow{7}MDR$ $(MDR)=0000000000000001=1$
$(ACC)$ $(MDR)\xrightarrow{1}X$ $(X)=1$
$CU$ $ALU$ $ALU$ $(ACC)$ $(X)$ $(ACC)$ $(ACC)+(X)\xrightarrow{6+1=7}ACC$ $(ACC)=7$ 。
$a*b+c$ $1,3,4$ $5$ $6,8,9,10$ 执行相加指令。
$PC$ $1$ $(PC)=3$ $3$ 的第四行的指令
$(PC)=3$ $(ACC)=\{7\}$
$PC\xrightarrow{3}MAR$ $(MAR)=3$
$主存(MAR)\rightarrow MDR$ $(MDR)=000010\quad000001000$
$(MDR)\rightarrow IR$ $(IR)=000010\quad000001000$
$(IR)\xrightarrow{000010}CU$ $IR$ $(000010)$ $CU$ $CU$ 分析后得知，这是存数指令
$(IR)\xrightarrow{000001000}MAR$ $IR$ $MAR$ $(MAR)=000001000=8$
$ACC$ $MDR$ $(ACC)\xrightarrow{7}MDR$ $(MDR)=7$
$CU$ $MDR$ $MAR$ $(MDR)\xrightarrow{7}地址为8的存储单元$ $y=7$
$y=a*b+c$ $1,3,4$ $5$ $6,7,9$ 执行存数指令。
$PC$ $1$ $(PC)=4$ $4$ 的第五行的指令
$(PC)=4$
$PC\xrightarrow{4}MAR$ $(MAR)=4$
$主存(MAR)\rightarrow MDR$ $(MDR)=000110\quad000000000$
$(MDR)\rightarrow IR$ $(IR)=000110\quad000000000$
$(IR)\xrightarrow{000110}CU$ $IR$ $(000110)$ $CU$ $CU$ 分析后得知，这是停机指令
利用中断机制通知操作系统终止该进程。

总结：

OP：操作码
AD：地址码
CPU区分指令和数据的依据：根据指令周期的不同阶段

运行汇总

汇总二

2.4 计算机层次结构

最底层：由传统机器(机器语言的机器)和微程序机器(微指令系统)组成。

这一层传统机器执行二进制机器指令，而机器指令可以分解为多个微指令，微程序机器就是执行这些微指令的。

再上一层是：虚拟机器(汇编语言机器)

汇编语言编写的代码需要翻译成机器码，所以是虚拟机器。

再上一层是：虚拟机器(高级机器语言)

需要用编译程序翻译成汇编语言。

而我们编写的程序往往需要用到操作系统的调用，向上提供广义指令。

所以总的计算机层次：

计算机层次结构特点：下层是上层的基础，上层是下层的扩展

计算机硬件层：微程序机器MO(微指令系统)------>传统机器M1(用机器语言的机器)
计算机软件层：虚拟机器M2(操作系统机器)------>虚拟机器M3(汇编语言机器)------>虚拟机器M4(高级语言机器)

硬件层位于最底层，具有下层是上层的基础，上层是下层的扩展的特点。

编译型程序：将高级语言编写的源程序全部语句一次全部翻译成机器语言程序，而后再执行机器语言程序（只需翻译一次)

解释型程序：将源程序的一条语句翻译成对应于机器语言的语句，并立即执行。紧接着再翻译下一句(每次执行都要翻译)

注意：编译、汇编、解释程序可以统称为翻译程序。

3. 计算机的性能指标

3.1 存储器的性能指标

$=$ $\times$ 存储字长bit

$32$ $8$ $=2^{32}*8=4GB$

3.2 CPU的性能指标

$2.9GHZ$ $3.7GHZ$
可以理解为指挥CPU内部部件工作的节奏。
CPU震荡图：
其中每个脉冲信号的时间称为CPU的时钟周期(微秒，纳秒)
CPU主频与时钟周期关系： $=\frac{1}{CPU时钟周期(赫兹)}$ 。即 $=$ CPU主频的倒数
$2.9GHZ$ $2.9*10^{9}$ 个周期。
CPI
CPI：指执行一条指令所需的时钟周期数
CPI性能是变化的：不同的指令，CPI不同。甚至相同的指令，CPI也可能有变化。
$=$ $CPI*CPU时钟周期$
$CPI=3$ 。该程序在该CPU上执行需要多久?
$\begin{aligned} 解： \\ 总耗时 = C P I * \frac{1}{C P U 主频 (时钟频率)} \\ ∴ 100 \times \frac{1}{1000} \times 3 = 0.3 s \end{aligned}$
$=\frac{(指令条数*CPI)}{主频(时钟周期)}=\frac{CPU时钟周期数}{主频}$
IPS
每秒执行多少条指令
$IPS=\frac{主频}{平均CPI}$
单位：单位一般在指标名称前。如：KIPS、MIPS
FLOPS
每秒执行多少次浮点运算
单位：单位一般在指标名称前。如：KPS、MPS、KFLOPS…………
注： $K=千=10^3$ $M=百万=10^6$ $G=十亿=10^9$ $T=万亿=10^{12}$

3.3 系统整体性能指标

数据通路带宽
是数据总线一次所能并行传送信息的位数（各硬件部件通过数据总线传输数据)
$I/O$ $8bit$ $16bit$ 信息需要两次。所以数据通路带宽会直接影响到各个部件之间传输的效率。
吞吐量
吞吐量：指系统在单位时间内处理请求的数量。如：网站处理用户请求。
它取决于信息能多快地输入内存，CPU能多快地取指令，数据能多快地从内存取出或存入，以及所得结果能多快地从内存送给一台外部设备。这些步骤中的每一步都关系到主存，因此，系统吞吐量主要取决于主存的存取周期。
响应时间
响应时间:指从用户向计算机发送一个请求，到系统对该请求做出响应并获得它所需要的结果的等待时间。
$I/O$ 操作、操作系统开销等时间)。
基准程序
基准程序是用来测量计算机处理速度的一种实用程序，以便于被测量的计算机性能可以与运行相同程序的其它计算机性能进行比较。常见的基准程序有各类跑分软件。

注：

$A$ $2GHz$ $CPI=10$ $B$ $1GHz$ $CPI=1$ $B$ $CPI$ $A$ 快。
$A$ $B$ 支持乘法指令。
基准程序(跑分软件)执行得越快也不能说明机器性能越好：基准程序中的语句存在频度差异，运行结果也不能完全说明问题

3.4 总结

计算机性能指标

二. 数据的表示与运算

1. 进位计数制

十进制

$975.36$

$9\times10^2+7\times10^1+5\times10^{0}+3\times10^{-1}+3\times10^{-2}$

由十进制可以推广到多进制。

$r$ 进制转化为十进制

$0\sim9$ $r$ $0\sim r$ 。

下面是一些常见进制的基数：

$0,1$
$0,1,2,3,4,5,6,7$
$0,1,2,3,4,5,6,7,8,9$
$0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F$

$r$ 进制转化为十进制例题：

$B$ $101.1\xrightarrow{转换为十进制}$ $1\times2^2+0\times2^1+1\times2^0+1\times2^{-1}=5.5$
$5.4\xrightarrow{转换为十进制}$ $5\times8^0+4\times8^{-1}=5.5$
$D$ $5.5\xrightarrow{转换为十进制}$ $5\times10^0+5\times10^{-1}=5.5$
$0X/H$ $5.8\xrightarrow{转换为十进制}$ $5\times16^0+8\times16^{-1}=5.5$

计算机用二进制好处是：

可使用两个稳定状态的物理器件表示。
$0$ $1$ 正好对应逻辑值假、真。方便实现逻辑运算。
可很方便地使用逻辑门电路实现算术运算。

1.2 二进制转化为八进制和十六进制

二进制转化为八进制
从小数点开始向两端三位一组(因为最大排列为八)，不够补零：小数点左边不够三位向左边补零；右边不够三位向右边补零。每组转换成十进制，再由十进制得到对应的八进制符号
例：1111000010.01101
001 111 000 010 . 011 010
1 7 0 2 . 3 2
八进制转化为二进制
每位八进制对应三位的二进制
$(251.5)_8$ $\xrightarrow{转换为二进制}$ (010 101 001.101)₂
$2\xrightarrow{二进制}010$ $5\xrightarrow{二进制}101$ $1\xrightarrow{二进制}001$ $5\xrightarrow{二进制}101$
二进制转化为十六进制
四位一组(最大的排列为十六)，每组转换成十进制，再由十进制得到对应的十六进制符号
例子：1111000010.01101
0011 1100 0010 . 0110 1000
3 C 2 . 6 8
十六进制转化为二进制
每位十六进制对应四位二进制

$(AE86.1)_{16}\xrightarrow{转换为二进制}$ (1010 1110 1000 0110.0001)₂
$A\xrightarrow{转换为二进制}1010$ $E\xrightarrow{转换为二进制}1110$ $8\xrightarrow{转换为二进制}1000$ $6\xrightarrow{转换为二进制}0110$ $1\xrightarrow{转换为二进制}0001$

八进制与十六进制互换
这两者之间的转换可以借助十进制或者二进制完成，可以先将八进制转换成十进制或二进制，再转换成十六进制。通过间接转换来实现。

1.3 十进制转化任意进制

$\frac{十进制数}{r进制}=商\cdots 余数$ $r$ $0$ ，再将余数倒叙排列即可。
75转二进制：
$十进制数\times r进制=小数D$ 取走 $r$ $D=原十进制数或者等于0.0$ 即可，最后正序排序取走整数部分即可。
$D=原十进制数$ 时停止。
$0.3$ 转换为二进制：
也可以将十进制转换为二进制，然后二进制再转换为八进制或十六进制。
进制速查表：

1.4 真值和机器数

$+15$ $0$ $1$ $+15\xrightarrow{二进制}0\quad1111$ $-15\xrightarrow{转换为二进制}1\quad1000$

$+15$ $-15$
$0\quad1111$ $1\quad1000$

2. BCD码

$8421$ 码 $3$ $2421$ 码。

由于机器数(二进制)转换为真值(十进制)过程较为麻烦，而BCD码就是为了解决这个问题。

$4bit$ $4bit$ $2^4=16$ $0\sim9$ 这十种情况。同时也会与六种状态是冗余的。

2.1 8421码

$8421$ $8、4、2、1$ $5\xrightarrow{8421码}0101$ $4$ $1$ $5$

$0\sim9$ $8421$ 码表：

$985\xrightarrow{8421码}1001\quad1000\quad0101$ $8421$ $985$ 这个数字

$8421$ 码的加法运算：

$5(0101)+8(1000)=13(0001\quad0011)_{8421码}$

$5(0101)+8(1000)=13(1101)$ $1101$ $8421$ $0\sim9$ $10(1010)\sim15(1111)$ $8421$ $13(1101)+6(0110)$ $6$ $1$ $3$ $13(1101)+6(0110)=19(1\quad0011)$ $0011\xrightarrow{转换为十进制}3$ $1$ $3$ $0$ $0001$ $1(0001)\quad 3(0011)$ $13$ $5+8$ $8421$ $0001\quad0011$ 。

$9(1001)+9(1001)=18(10010)$ $8421$ $6$ $0010+0110=1\quad1000$ $(1000)_{8421码}\xrightarrow{十进制}8$ $1$ $0$ $0001\quad1000$ $9(1001)+9(1001)=18(0001\quad1000)_{8421码}$

$10(1010)\sim18(10010)$ $6$ 修正。如果在合法范围内无需修正。

2.2 其他码

$3$ 码
$8421$ $+3(0011)_{2}$
$3$ 码每个进制位并没有权值。
$2421$ 码
$8421$ $2,4,2,1$
$2421$ $0\sim4$ $0$ $5\sim9$ $1$ 。这是因为要避免歧义性。

3. 无符号整数的表示和运算

$0,1,2\cdots$

$8$ $8$ 位。

$255\xrightarrow{二进制}11111111$ $8$ 位的寄存器中。

$256\xrightarrow{二进制}100000000$ $8$ $00000000$ 。

而这八位都有权值，没有符号位，所以称为无符号整数。

无符号整数特点：

$i$ $2^i-1$
$n$ $0\sim2^{n}-1$ ，超出则溢出，意味着该计算机无法一次处理这么多位
$0$ $1$ 。

$99(01100011)_{2}+9(00001001)$ ，其实二进制位相加即可。

无符号整数的减法：

首先"被减数"不变，"减数"全部位 $+1$ ，减法变加法
从最低位开始，按位相加，并往更高位进位

$99(01100011)_{2}-9(00001001)$

$00001001\xrightarrow{按位取反}11110110$ $11110110$ $+1$ $11110111$

$01100011+11110111=90(101011010)$ $1$ $01011010$

4. 带符号整数在计算机中应用

$-2,-1,0,1,2\cdots$

带符号整数可以用原码、反码、补码三种不同编码方式来表示。

$8$ $8$ $8$ 位运算

4.1 原码表示法

$0$ $1$ ，剩下后七位是数值位。

$+19\xrightarrow{二进制}+10011$ $8bit$ $0,0010011$

$-19\xrightarrow{二进制}-10011$ $8bit$ $1,0010011$

原码特性：

$n+1$ 原码表示范围 $-(2^n-1)\le x\le2^n-1$
$0/1$ $正/负$ ，剩余的数值位表示真值的绝对值
$0$ 有两种形式 $+0$ $-0$ $[+0]_{原}=0,0000000$ $[-0]_{原}=1,0000000$

原码缺点：符号位不能参与运算，需要设计复杂的硬件电路才能处理。

4.2 原码计算方式

$\xrightarrow{转换}$ $\xrightarrow{转换}$ 补码。在进行正常二进制计算即可。

正数转换为补码不变

$\xleftrightarrow{符号位不变,数值位取反}$ $\xrightarrow{末位+1}$ 补码

原码转换为补码快速技巧 $1$ $1$ 左边的数值位按位取反就可以变为补码。同样补码转换为原码方式一样。

$[-19]_{原}=1,0010011$ $[-19]_{补}=1,1101101$

计算机硬件如何做补码的加法：从最低位开始，按位相加(符号位参与运算)，并往更高位进位。

注意：负数补码的数值为不能解读成位权。我们需要将其转换为原码。

$[-38]_{补}=1,1011010\xrightarrow{转换为原码}1,0100110$ $1,0100110\xrightarrow{十进制}-38$

$[A]_{补}-[B]_{补}=[A]_{补}+[-B]_{补}$

方法是 $[B]_{补}\xrightarrow{全部位按位取反,末位+1}[-B]_{补}$

$[19]_{补}\xrightarrow{全部位按位取反}[11101100]\xrightarrow{末位+1}[11101101]_{补}=[-19]_{补码}$

$1$ $1$ 左边的全部位按位取反就可以变为负值补码。

可以看出有符号整数减法和无符号整数减法方法一样，这样就意味着可以用同一套电路就可以实现处理所有加减法。

所以有符号整数的减法：

首先"被减数"不变，"减数"全部位 $+1$ ，减法变加法
从最低位开始，按位相加，并往更高位进位

原码计算总结：

注意：计算机内部所有带符号整数的加减法都要先转换为补码形式。

4.3 移码

$[A]_{补}$ $[B]_{移}$ 。

$0$ $10000000$ $n+1$ $-2^n\le x\le2^n-1$

4.4 原码、补码、反码和无符号整数特性

$n+1bit$	合法表示范围	最大的数	最小的数	$0$ 的表示
带符号的整数：原码	$-(2^n-1)\le x\le 2^n-1$	$0,111\cdots111=2^n-1$	$1,111\cdots111=-(2^n-1)$	$[+0]_{原}=0,000\cdots000$ $-[0]_{原}=1,000\cdots000$
带符号整数：反码	$-(2^n-1)\le x\le2^n-1$	$0,111\cdots111=2^n-1$	$1,000\cdots000=-(2^n-1)$	$[+0]_{反}=0,000\cdots000$ $[-0]_{反}=1,111\cdots111$
带符号整数：补码	$-2^n\le x\le 2^n-1$	$0,111\cdots111=2^n-1$	$1,000\cdots000=-2^n$	$[0]_{补}=0,000\cdots000$ $0$ 只有一种补码
带符号整数：移码	$-2^n\le x\le 2^n-1$	$1111\cdots111=2^n-1$	$0000\cdots000=-2^n$	$[0]_{移}=1000\cdots000$ $0$ 只有一种移码
无符号整数	$0\le x\le2^{n+1}-1$	$1111\cdots111=2^{n+1}-1$	$0000\cdots000=0$	$0000\cdots000$

$0$

$A$ $B$ 进行某种运算后，是否发生溢出。可以手算做题可以带入十进制验证，是否超出合法范围

$8$ $A=B=-64$ $A+b=-128$ 会溢出。而用补码表示则不会溢出。

几种码的表示：

4.5 定点小数表示和运算

之前的定点整数，即带符号的整数，小数点隐含在数值部分末尾。

而定点小数小数点位置是在符号位和数值位中间

$2^{-1},2^{-2},2^{-3}\cdots$

$[x]_{原}=1.1100000$

定点小数原码、反码补码转换和定点整数一样。其计算方法也一样。

定点小数和定点整数对比：

4.6 奇偶校验码

数据在计算机内部进行计算存取过程中可能会发生错误，所以要用到校验。

$1$ 的个数为奇数。

$1$ 的个数为偶数。

$n$ 位是信息位

$1001101$ $11001101$ $1$ $4$ $1$ $1$ $5$ 是奇数。

$1001101$ $01001101$ $1$ $4$ $1$ $0$ 即可。

$1$ 个数，如果个数是偶数，则证明发生错误，会要求重新发送。如果是奇数，这没有问题。

奇偶校验码可能检测不出来错误。特别是在发生多位跳变时候。

偶校验的硬件实现：各信息进行异或 (模2加)运算，得到的结果即为偶校验位。

$1001101\xrightarrow{偶校验码}01001101$ $0$ 则说明正确。

5. 字符与字符串

字母，数字和字符等都是以ascll码的数字形式存储再电脑中
补充：字符数字转整型数字：'1'—'0'=1
整型数字转字符数字：1+'0'='1'

ASCLL码：

字母表示
字母加上各种符号，总共128个。具体如上ASCLL码
汉字表示
国标码：专门用于汉字的ASCLL码，为了防止与字母冲突ASCLL值从128开始。
输入(拼音)：输入法会将输入的拼音转换为国标码，再将国标码转换为与之相对应的汉字内码。
输出：用到汉字字形码具体如下：

字形码：

总结：

6. 算术逻辑单元

$ALU$ 的构成。

$ALU$ 可以实现算术运算：加、减、乘、除等；逻辑运算：与、或、非、异或等；辅助功能：移位、求补等。

$A_i$ $B_i$ $A_i$ $B_i$ 输入。
$F_i$ 是输出信号，运算结果从这里输出。
$K_i$ $CU$ 发出的，控制信号主要用于解析指令是加法减法等。

$ALU$ 实例图

$K_i$ $M=1$ $S_3\sim S_0=1001$ $A\oplus B$

$ALU$ $4$ $16$ 种运算状态。

$4$ 位。

$ALU$ 至少需要有控制信号、输入信号和输出信号。

6.1 最基本的逻辑运算

常见的有：与、或、非。与或非三种逻辑运算对应的门电路如下：

$A$ $5V$ $1$ $B$ $1V$ $0$ $1V$ $0$ $5V$ $1$ 。

$A$ $5V$ $1V$ 低电平。

如果一个运算涉及到多个逻辑运算，那么执行顺序要看优先级。与运算可以看作乘法，而或运算可以看作加法。

$AB+CD$ $AB,CD$ $+$ 。同样的这样的运算也符合分配律和结合律。

上面意义在于，设计门电路本质上逻辑表达式是对电路的数学化描述，简化逻辑表达式，就是在简化优化电路，就是在省钱。

$AC+AD$ 。其门电路可以设计如下方式：

$与$ $AC$ $AD$ $或$ 门做最后一次运算，最后输出。

$AC+AD\xrightarrow{分配律}A(C+D)$ $A(C+D)$ 设计的门电路如下：

或 $C+D$ 与 $A(C+D)$ 。所以这样设计相当于优化了门电路。

6.2 复合逻辑运算

常见的复合逻辑运算有：与非(先进行与运算，再进行非运算)、或非(先进行或运算，再进行非运算)、异或

其表达式表示如下：

其门电路符号如下：

上面运算遵循反演律(德摩根律)：

\begin{matrix} \overset{―}{A + B} = \overset{―}{A} \cdot \overset{―}{B} \\ \overset{―}{A \cdot B} = \overset{―}{A} + \overset{―}{B} \end{matrix}

$A$ $B$ $1$ $A=0$ 且 $B=1$ $A=1$ 且 $B=0$ $1$

$\overline{A}·B+A·\overline{B}$ 。其电路图如下：

$A=0,B=1$ $A$ $0$ 非 $1$ $B$ 非 $0$ $0$ $\&$ $0,0$ $0$ $\&$ $1,1$ $1$ $1,0$ 或 $1$ 。

组后补充一个复合逻辑：同或。其就是异或运算取反。

逻辑运算实现偶校验位

$1001101$ 的偶校验位

$1\oplus0\oplus0\oplus1\oplus1\oplus0\oplus1=0$

$((1\oplus0)\oplus(1\oplus1))\oplus((1\oplus0)\oplus1)=0$

与之对应电路如下：

方法三：

从上面三种方法可以看出逻辑表达式是对电路的数学化描述。

逻辑运算实现一位全加器

可以使用异或运算实现全加器。

$A_i,B_i$ $i$ $C_{i-1}$ 来自低位的进位，当前正在运算位称为本位。

计算步骤：

$A_i$ $B_i$ $1$ $1$ $0$ $S_i=A_i\oplus B_i\oplus C_{i-1}$
$A_iB_i=1$ $A_iB_i$ $1$ $1$ $1$ $1$ $(A_i\oplus B_i)C_{i-1}=1$ 。

$A_iB_i+(A_i\oplus B_i)C_{i-1}=1$ 。对应门电路如下：

其简化图就是一位全加器：

上面门电路图可以理解为一个函数具体实现。而下面简化图可以理解为函数对外暴露的接口。

可以将多个一位全加器串联起来形成串行加法器：只有一个全加器，数据逐位串行送入加法器中进行运算。进位触发器用来寄存进位信号，以便参与下一次运算。

$n$ $n$ 次进行，每次只能产生一位和，并且串行逐位地送回寄存器。效率较低。

$n$ $n$ 位数的相加。

这样特点是只有低位的运算结束后，才能进行高位的运算。电信号传递需要大量时间。其效率取决于每一位进位产生速度。

6.3 并行加法器优化

上面介绍的串行进位的并行加法器，特点是其速度依赖于来自低位的进位。接下来要探究的是如何让每个进位产生的更快。

$C_i=A_iB_i+(A_i\oplus B_i)C_{i-1}$ $C_{i-1}$ $C_{i-1}=A_iB_i+(A_i\oplus B_i)C_{i-2}$

$C_{i-1}$ $C_0$ $C_0$ $i$ $C_i$ $1\sim i$ $C_0$ $C_0$ $C_i$ 。这就是其优化思路。

$A_iB_i=G_i$ $A_i\oplus B_i=P_i$ $C_i=G_i+P_iC_{i-1}$

$C_1=G_1+P_1C_0$

$C_2=G_2+P_2C_1=G_2+P_2G_1+P_2P_1C_0$

$C_i$ 位的进位信息。

$G_i$ $P_i$ $2$ $C_i$ $G_i,P_i$ $G_i$ $P_i$ $C_4$ $C_4$ $C_4$ 进位值。也就是说采用这种优化方式，每一位的进位信息几乎都是同时产生的。不需要像之前那样等待后一位进位信息往后传。

这种方式的加法器称为并行进位的并行加法器：各级进位信号同时形成，又称为先行进位、同时进位。

$C_4$ $C_4$ $4位+4位$ 的运算。在这个加法器内部，每个进位都是同时并行产生的。

7. 补码加减运算器

即从硬件的层面看，补码的加减运算是如何实现的。

7.1 补码加法器原理

加法器原理：

$n$ $4$ $4bit$ $A=1000,B=0111,cin=0$ $F=1111,cout=0$

计算机实现步骤：

首先数字通过两个输入进行输入。
$cin=0$ $A+B+cin=1000+0111+0=1111$
$1111$ $1111$ $cout=0$

$A=1000,B=0111,cin=1$ $F=0000,cout=1$

加法器实现步骤：

两个数字输入
$cin=1$ $1000+0111+1=0000$
$0000$ $0000$ $cout=1$

$cout$ $8bit$ 加法器相加，在把两个加法器串联即可。

对上面加法器进行改造，使其能进行补码的加减运算。补码手算方式参考原码计算方式

改造后的加法器结构如下：

$4bit$ $x=-8,y=7$ $x_{补}=1000$ $y_{补}=0111$

加法器实现步骤：

$x$ $y$ $sub$ $+$ 多路选择器(MUX) $y$ 的值。
$x,y$ $sub$ $0$ $x+y$ 操作。
$x+y=1111=01$

实现减法步骤：

$MUX$ $sub$ $1$
$y=0111$ $MUX$ $1000$ ，最后通过多路选择器进入加法器中
$x$ $sub$ $1$ $1000+1000+1=1\quad0001$
$4$ $1\quad0001$ $1$ $0001=1$ 。显然这个运算结果是错误的，发生位溢出现象。

同时这个加法器也可以实现无符号数的运算，因为无符号运算与补码运算一样。但是二者判断溢出方式不同，这涉及到标志位的产生。

7.2 标志位的生成

对上面的加法器的输出部分进行扩展：

$nbit$ $OF、SF、ZF、CF$

$OF$ $1$ $0$
含义：判断有符数的加减运算是否发生溢出。其只在有符号数运算时才有意义。
$OF=最高位产生的进位\oplus次高位产生的进位$
$8-7=1000+1001$ $1$ $0$ $1\oplus0=1$ ，所以发生溢出。
$SF$ ：符号标志位
$SF=0$ $SF=1$ 表示运算结果为负数。
$SF=最高位的本位之和$
$8-7=1000+1001$ $1+1$ $SF=0$ ，结果为正数
$ZF$ ：零标志位
$0$ $ZF=1$ $0$ $0$
$nbit$ $nbit$ $0$ $ZF=1$
$CF$ $/$ 借位标志
$/$ 无符号数 $CF=1$ 时，说明无符号数的加减运算发生了进位或借位，也即发生了溢出
$CF=最高位产生的进位\oplus sub$ $sub=1$ 表示减法，否则表示加法。
$3-4=0011+(1011+1)$ $0$ $sub=1$ $CF=0\oplus1=1$ ，即发生借位，这也就代表了，被减数比减数更小，所以才导致了进位。同时也意味着结果发生溢出。

$CF$ $OF$ 。

7.3 加减运算和溢出判断

$8$ $-128\sim127$ ，所以如果补码的加减运算结果值如果不在这个范围内，就会出现值溢出的现象。

$A=15\xrightarrow{8位补码}0,0001111$ $C=124\xrightarrow{8位补码}0,1111100$ $(A+C)_{补}=1,0001011$ $=-117$ $15+124=139$ $8$ 位补码所能表示的范围，所以出现值溢出现象，导致结果错误。

既然溢出的状况不可避免，计算机硬件必须要判断溢出问题。当进行补码加减运算时，都会转换为加法运算。所以我们只需要探讨加法运算即可。

$+$ $+$ $=$ $+$ $+$ $=$ 正。

例如下图：

$2+3$ $(010)+(011)=101$ $2+3=-3$ $2+3$ $5$ $2$ $3$ $-3$ $-4+(-1)$ $011=3$ 。

基于这个规律计算机判断溢出方法如下：

方法一：
$A$ $A_s$ $B$ $B_s$ $S_s$ ，则溢出逻辑表达式为：
$V = A_{s} B_{s} \overset{―}{S_{s}} + \overset{―}{A_{s}} \overset{―}{B_{s}} S_{s}$
$V=0$ $V=1$ 表示溢出。
$\overline{S_s}$ 表示符号位取反，相乘表示与运算，相加表示或运算。
$[A+C]_{补}=0,0001111+0,1111100=1,0001011$ $-117$
$V=0·0·\overline{1}+\overline{0}·\overline{0}·1$ $=0·0·0+1·1·1=1$ 即发生溢出。
$正+正=负$ $负+负=正$ $V$ 时，设计的较为复杂。原因在于当逻辑表达式设计出来后相当于其门电路也背设计出来。
方法二：
根据数据位进位情况和符号位进位情况判断溢出
$C_s=0$ $C_1=1$ 时，发生上溢
$C_s=1$ $C_1=0$ 时，发生下溢
$[A+C]_{补}=0,0001111+0,1111100=1,0001011$ $-117$
$C_1=1$ $C_s=0$ 产生上溢。
$C_s$ $C_1$ $\oplus$ 。溢出表达式判断为：
$V = C_{s} \oplus C_{1}$
$V=0$ $V=1$ 表示溢出。
方法三
$00$ $11$ 。
$[A+C]_{补}=00,0001111+00,1111100=01,0001011$ ，上溢出
$[B-C]_{补}=11,1101000+11,0000100=10,1101100$ ，下溢出
$01$ $0$ $1$ 位是运算得到的实际符号。如果没有溢出两个符号位一定是相同的。
$S_{s1},S_{s2}$ $V=S_{s1}\oplus S_{s2}$
$V=0$ $V=1$ 表示溢出。
$4$ 补码
$2$ 补码
$01,0001011$ $,$ $.$ $01.0001011$ $2^0,2^1,2^2\cdots$ $2^2=4$ $4$ $4$ $2$ 补码一样。
注意：虽然这里有两位的符号位，但实际存储时只存储一个符号位，运算时会复制一个符号位。并不会增加存储空间。

$同号+同号=异号$ ，此时一定发生溢出。

符号扩展
$8bit$ $16bit$ $8$ $0$ $8$ $0$ 。
$0,1011010\xrightarrow{扩展16位}$ $0,00000000\quad1011010$

8. 移位运算

8.1 算数移位

指小数点前后移动。含义：通过改变各个数码位和小数点的相对位置，从而改变各数码位的位权。可用移位运算实现乘法、除法。

$1$ $\times 10^1$ $1$ $÷10^1$

算数右移
$0$ $=0$ $÷2$ $\ne0$ ，则会丢失精度。
$-20$ 的原码及位权如下：
$1$ $÷2$ $-20÷2^3=-2$ $1$ 丢失所以失去精度。
算数左移
$0$ $=0$ $\times2$ $\ne 0$ ，则会出现严重误差。
$-20$ 的原码及位权如下：
$1$ $\times2^1$ $-20\times2^3=-32$ $7$ $0\sim127$ 这个区间，显然这个结果值溢出。所以出现严重误差。

同样，小数方法一样。

8.2 反码算数移位

反码的算数移位：正数的反码与原码相同，因此对正数反码的移位运算也和原码相同。

$0$ $0$ ，高位舍弃。

反码的算数移位：负数的反码数值位与原码相反，因此负数反码的移位运算规则如下：右移：高位补1，低位舍弃。左移：低位补1，高位舍弃。

8.3 补码算数移位

补码正数算数移位：正数的补码与原码相同，因此对正数补码的移位运算也和原码相同。

$=$ $+1$ $1$ $0$ 为止。

$1$ $1$ 的左边同反码。

负数补码的算数移位规则如下：

$1$ ，低位舍弃。
$0$ ，高位舍弃。

负数补码右移：

总结：

由于位数有限，因此有时候无法用算数移位精确地等效乘除法。

$-20\times7$

$-20\times(2^0+2^1+2^2)$ $-20$ $1$ $2$ 位。

8.4 逻辑移位

可以把逻辑移位看作是对"无符号数"的算数移位。

$0$ ，低位舍弃。

$0$ ，高位舍弃。

8.5 循环移位

$1$ 会移动到末位，进行循环补位。循环右移原理相同。

带进位位的循环左移：会有一位专门记录低位往高位进位信息。当循环左移一位时，进位信息会移动到原码最末尾。

循环移位主要用于把数据的低字节和高字节进行调换。

9. 原码与补码的运算

9.1 乘法运算

$0.985\times0.211$

$0.211=2\times10^{-1}+1\times10^{-2}+1\times10^{-3}$ $0.985=985\times10^{-3}$

$0.985\times0.211=(985\times1\times10^{-6})+(985\times1\times10^{-5})+(985\times2\times10^{-4})$

$0.1101\times0.1011$

$0.1011=1\times2^{-1}+0\times2^{-2}+1\times2^{-3}+1\times2^{-4}$

$0.1101=1101\times2^{-4}$

$0.1101\times0.1011=(1101\times1\times2^{-8})+(1101\times1\times2^{-7})+(1101\times0\times2^{-6})+(1101\times1\times2^{-5})$

$0$ $1$ $2^{-n}$ $n$ 位即可。

原码乘法运算

如果用计算机实现原码乘法，要考虑的问题很多，实现步骤大致如下：

ACC内清空，MQ内存放乘数，X存放被乘数
MQ最低位与被乘数参与运算：
$1$ $ACC$ $+$ 被乘数
$0$ $ACC$ $+0$
$1,2$ 步
一直右移到MQ中剩符号位，此时运算结束

$n$ 次

$n+1=5$ $[x]_{原}=1.1101$ $[y]_{原}=0.1011$ $x·y$

$x_s\oplus y_s$ $[|x|]_{原}=0.1101$ $[|y|]_{原}=0.1011$

$[|x|]_{原}·[|y|]_{原}$ 相乘步骤：

首先ACC内清空，MQ内存放乘数，X存放被乘数
$MQ$ $1$ $1$ $ACC+X$ $0$ $ACC+0$
$00000+01101=01101$ ，结果值放入ACC中
$0$ ，其低位称为MQ高位
$1$ $ACC+X$ $00110+01101=10011$ ，结果放入ACC中
ACC和MQ再次右移，下面红色部分可以称为"部分积"
$0$ $ACC+0$ 即可。所以此次ACC内结果不会变，接着右移
$1$ $ACC+X$ $00100+01101=10001$ 。结果放入ACC接着右移
$0$ $0$ 不用参与运算，因为这一位是原本符号位

$0.10001111$ ，手算过程如下：

$[x]_{原}=1.1101$ $[y]_{原}=0.1011$ $1\oplus0=1$ $1.10001111$

这种方法叫原码一位乘法。因为每次参与运算只有一位。接下来用手算方式解题：

$5$ $1$ $n=4$ $x=-0.1101, y= +0.1011$ $x·y$

由于补码乘法要用到双符号位，所以建议原码乘法也像上面题一样采用双符号位。

整数运算与上面小数运算类似，注意整数最后小数点位置是在末位前面的位置。

补码乘法运算

补码计算方法和原码十分相似。

原码补码计算对比：

原码	补码
$n$ 轮加法，移位。	$n$ 轮加法，移位，最后再多来一次加法。
$+0,+[\|x\|]_{原码}$	$+0,+[x]_{补},+[-x]_{补}$
每次移位是逻辑右移	每次移位是算数右移

补码每次加的数值要根据MQ中最低位、辅助位来确定：

$-$ $=1$ $(ACC)+[x]_{补}$
$-$ $=0$ $(ACC)+0$
$-$ $=-1$ $(ACC)+[-x]_{补}$

补码运算器与原码有差距：

因为MQ多一位辅助位，由于运算器内部部件位数相同，所以ACC和X都要扩展一位。

$0$ 。每次右移会使MQ的最低位顶替原本的辅助位。

用计算机实现步骤大致如下：

ACC内清空，MQ内存放乘数末位留一位当辅助位，X存放被乘数采用双符号位。
补码每次加的数值要根据MQ中最低位、辅助位来确定：
$-$ $=1$ $(ACC)+[x]_{补}$
$-$ $=0$ $(ACC)+0$
$-$ $=-1$ $(ACC)+[-x]_{补}$
ACC与MQ中的值同时进行补码算术右移：
$0$ $1$
$2$ $n$ 位拼接即可。所以说补码乘法符号位也会参与运算。

$5$ $1$ $n=4$ $x=-0.1101,y= +0.1011$ $x·y$

$[x]_补=11.0011$ $[-x]_补=00.1101$ $[y]_补=0.1011$

$[x·y]_{补}=11.01110001$ $x·y=-0.10001111$

$Y_5$ $Y_4$ $Y_s$ 是MQ符号位。

9.2 除法运算

$0.211÷0.985$ 运算如下：

$0.211=0.985*0.214+0.000210$ $x÷y=a\cdots b(余数)\rightarrow$ $x=ay+b$

其本质是每上一位商要尽可能接近余数，但不超过余数。

$0.1011÷0.1101$ $(0.1011\times2^4)÷(0.1101\times2^4)$

$4$ $0$ $5$ $5$ 位)

原码的除法

$5$ $1$ $n=4$ $x=0.1011$ $y=0.1101$ $\frac{x}{y}$

$=x_s\oplus y_s$ ，之后对数值位取绝对值进行除法计算

运算器实现大致步骤：

首先通用寄存器放入除数，ACC放入被除数，MQ清空用于存放商
$1$ $ACC-通用寄存器$ ，结果为余数放入ACC中。如果：
$1$ $1$ $1$ $0$ $ACC+通用寄存器$ ，运算结果值放入ACC中
$0$ $1$ 正确进入。
之后ACC和MQ整体逻辑左移，左移之后ACC中的值就是余数。之后重复上述两步骤即可

这种恢复余数方法称为：恢复余数法

计算机实现：

首先通用寄存器放入除数，ACC放入被除数，MQ清空用于存放商
$1$ ，之后再根据具体情况恢复余数
$1$ $ACC-通用寄存器$ $(ACC)+[-|y|]_{补}=01011+10011=11110$ ，结果放入ACC中
$1$ $ACC-除数=负数$ $1$ $1$ $0$ $ACC+除数$ $(ACC)+[|y|]_{补}=11110+01101=01011$
$ACC,MQ$ 逻辑左移
$5$ $4$ 位即可(还有一个符号位)。

手算做题方法如下：

$n$ $n+1$ 次，最后一次上商余数不左移。

优化恢复余数法策略：

$a$ $b$ $a+b$ $a+b$ $(a+b)\times2=2a+b$ $1$ $(a+b)\times2-b=2a+b$ $1$ $1$ $|除数|$ 即可。

基于这种思路的方法称为加减交替法，又称不恢复余数法。优化后的步骤如下：

$n+1/n+2$ $n$ 次(最后一次加减完不移位)。

$1$ $1$ $0$ $1$ ，则证明被除数比除数大，此时硬件电路会检测到这个问题，并且直接停止运算。

补码的除法

补码的除法与原码类似，同样是使用加减交替法。但不同在于：补码符号位要参与运算(不用绝对值)，并且被除数、余数、除数采用双符号位。

具体做法如下：

首先根据被除数和除数符号进行运算
同号，则被除数减去除数
异号，则被除数加上除数
根据第一步得到的余数之后再根据余数和除数符号进行运算
$1$ ，余数左移一位减去除数
$0$ ，余数左移一位加上除数
$n$ 次，即可

$1$ $2^{-n}$ 。

$5$ $x=+0.1000$ $y=-0.1011$ $\frac{x}{y}$

$[\frac{x}{y}]_{补}=1.0101$ $0.0111\times2^{-4}$

原码与补码除法对比：

9.3 C语言强制类型转换

C语言中定点正数都是用补码形式存储的。用关键字unsigned修饰的是无符号整数。

将有符号数转换为无符号数
```
xxxxxxxxxx
4
1
int main(){
2
    short x=-4321;
3
    unsigned short y=(unsigned short)x;
4
}
```
$x$ $1\quad110111100011111$ $x$ $y=1110111100011111$ $y=61251$
无符号数与有符号数转换：不改变数据内容，改变解释方式。
将长整型转换为短整型
```
xxxxxxxxxx
4
1
int main(){
2
    int a=165537,b=-34991;
3
    short c=(short)a,d=(short)b;
4
}
```
$int$ $4$ $short$ $2$ $a$ $0x000286a1$ $a$ $c=0x86a1$ $c=-31071$ 。
$b$ $0xffff7751$ $b$ $d=0x7751$ $d=30545$
将长整型转换为短整型：高位截断，保留低位。
短整型转换为长整型
```
xxxxxxxxxx
6
1
int main(){
2
    short x=-4321;
3
    int m=x;
4
    unsigned short n=(unsigned short)x;
5
    unsigned int p=n;
6
}
```
1. $x$ $1110 1111 0001 1111$ $int$ $m$ $1$ $m=1111 1111 1111 1111 1110 1111 0001 111 1$ $m=-4321$ 。
2. $x$ $n$ $n=11101111 0001 1111$ $n=61215$ 。
3. $n$ $int$ $p$ $p=00000000 0000 0000 11101111 0001 1111$ $61215$

10. 数据的存储与排列

多字节数据在内存中一定是占连续的几个字节。

10.1 大小端存储

$4$ $int$ $(01\quad23\quad45\quad67)_{八进制}$ $01$ $67$

$0000\quad0001\quad0010\quad0011\quad0100\quad0101\quad0110\quad0111$

在计算机中存储方式有两种：大端存储和小端存储

大端存储：便于人类阅读
将数据按地址由低到高存储
$0800H$ $0803H$ 是高地址
小端存储：便于机器存储
将数据按地址由高到低存储
$0800H$ $0803H$ $67$ $45$ 进行处理。所以小端存储便于数据处理。

10.2 边界对齐

现代计算机通常是按字节编址，即每个字节对应一个地址。

$32$ $1$ $32bit$ $=16bit$ $/$ $1$ 个字。

$/$ $1$ 个字，所以有的计算机会采取边界对齐方式，有的会用边界不对齐方式。

采用边界对齐方式存储，虽然空间上会有浪费，但是访问速度快。如要读取半字1，只需要一次读取就可以读取到。这是一种空间换时间的存储策略。
采用边界不对齐方式，虽然可以节省空间，将第一页没用完的空间充分利用，但会导致读取次数变多。如上图：对于边界不对齐方式要想读取半字1，需要分两次读取，最后还要进行拼接才能得到半字1的完整表示。

补充：

计算机系统位数	单位
16bit	$1$ $=2$ $=2$ $=16$ 位(bit)
32bit	$1$ $=2$ $=4$ $=32$ 位(bit)
64bit	$1$ $=2$ $=8$ $=64$ 位(bit)

无论操作系统的 位宽 是多少，1byte=8bite，半字为字的一半，双字(double word)为字(word)的2倍永远不变。

一个ASCII字母占用 1 byte，一个汉字占用 2 byte

11. 浮点数表示与运算

定点数可表示的数字范围有限，不能无限制地增加数据的长度，所以要用上浮点数。

$+302657264526\xrightarrow{科学计数法}+3.026\times10^{11}$ $10$ $+11\quad+3.026$ $+11$ $+3.026$ 称为尾数，尾数最前面一位是数符，后面是数值部分，一般来说数值部分越短表示的精度就越低。

11.1 浮点数表示

以上是十进制科学计数法描述，接下来看二进制浮点数的科学计数法：

阶码：常用补码或移码表示定点整数
尾数：常用原码或补码表示定点小数

$E$ $M$ $r$ $=r^{E}\times M$

$E$ $M$ $n$ 反映浮点数的精度。

$a=0,01;1.1001$ $b=0,10;0.01001$

$a$ $0,01$ $+1$ $1.1001$ $-0.0111$ $a$ $=2^1\times(-0.0111)=-0.111$

$a$ 对应内存中存储结构如下：

$b$ $0,10$ $+2$ $0.01001$ $+0.01001$ $b$ $=2^2\times(+0.01001)=+1.001$

$b$ 对应内存中存储结构如下：

$b$ $1$ 舍弃，精度降低。可以采用浮点数规格化方式提高精度。

11.2 浮点数尾数规格化

$1$ 。

$b=0,10;0.01001$ $0$ $0.01001\times2^1$ $0.1001$ $2^1$ $b$ $=2^1\times(+0.10010)=+1.0010$ 。其在内存中表示：

$1$ $1$ 。直到尾数最高位是有效值，这种方式称为左规。

$01$ $10$ $1$ ，这种方法称为右规。

$a=010;00.1100$ $b=010;00.1000$ $a+b$

$a=2^2\times00.1100$ $b=2^2\times00.1000$ $a+b=2^2\times00.1100+2^2\times00.1000=2^2\times01.0100$

$1$ $2^3\times00.1010$ 。这个尾数就是一个规格化尾数。其在内存中存储如下：

注：采用("双符号位")，当溢出发生时，可以挽救。更高的符号位是正确的符号位。

左规右规总结：

$1$ 。
$01$ $10$ $1$ 。

规格化浮点数特点：

$1$ 。
$0.11\cdots1$ $0.10\cdots0$ $\frac{1}{2}\le M\le(1-2^{-n})$ 。
$1.10\cdots0$ $1.11\cdots1$ $-(1-2^{-n})\le M\le-\frac{1}{2}$
$0.1\times\times\times$ $1.0\times\times\times$ 形式。
$0.11\cdots1$ $0.10\cdots0$ $\frac{1}{2}\le M\le(1-2^{-n})$
$1.01\cdots1$ $1.00\cdots0$ $-1\le M\le-(\frac{1}{2}+2^{-n})$

$4+8$ $0.110;1.1110100$ 。则如何规范化。

$1.1110100$ $1.0100000$ $-3$ $0.011$ $0.011;1.0100000$

$0$ 。如果出现正上溢或者负上溢，则计算机会中断程序。

11.3 浮点数标准IEEE 754

如果不能统一一个规格来表示浮点数阶码，尾数各占多少位，各自采用原码补码还是移码来表示，则计算机之间进行数据传输就会出现解析之间的问题。所以，IEEE754标准可以统一计算机规范。

$=$ $+$ $8$ $=128=10000000$ $2^{n-1}$ $n$ 指计算机位数。

$-127=-1111111$ $=-1111111+10000000=00000001$ 。

$128$ $127$ $2^{n-1}-1$ 。

改变偏置值后移码如下：

$1.M=.M$ ，尾数部分用原码表示。

$1$ 。下图是标准详细类型表示：

$-126\sim127$ $-128=11111111$ $-127=00000000$ 有其他用途。

短浮点数
$(-1)^s\times1.M\times2^{E-127}$
例1 $-0.75$ 转换为IEEE754的单精度浮点数格式表示
$1+8+23=32$ 位
$-0.75\xrightarrow{二进制}-0.11=(-1.1)_{2}\times2^{-1}$
$=1$ $.1000000\cdots$ $1$ $=-1$ $=127$ $=$ $+$ $1111111+(-1)_{二}=01111110$ $8$ 位)。
$-0.75\xrightarrow{单精度浮点数规格}1\quad01111110\quad10000000000000000000000$
例2 $(C0A00000)_{十六进制}$ 的真值是多少
$(C0A00000)\xrightarrow{转换为二进制}1\quad10000001\quad01000000000000000000000$
$=.0100\cdots$ $1$ $=(1.01)_{二进制}$ $=10000001$ $=129$ $=127$ $=$ $-$ $=10000001-1111111=(00000010)_{二进制}=(2)_{十进制}$
$=(-1.01)_{二进制}\times2^2=-1.25\times2^2=-5.0$
$0$ $-126$ $00000001$ $(1.0)_{2}\times2^{-126}$
$1$ $127$ $11111110$ $(1.111\cdots11)_2\times2^{127}$
长浮点数
$(-1)^s\times1.M\times2^{E-1023}$
$0$ $-1022$ $(1.0)_{2}\times2^{1-1023}$
$1$ $1023$ $(1.11\cdots11)_2\times2^{2046-1023}$

$1$ $0$ 的用途：

$(1.0)_{2}\times2^{-126}$ $0$ $1$ 两种状态。

$8$ $0\sim255$ $0\xrightarrow{二进制}全0$ $255\xrightarrow{二进制}全1$ $1\sim254$ 。

$0$ $0$ $0$ $1$ $0.M\times2^{-126}$ $-126$

$0$ $0$ $\pm0$

$1$ $0$ $\pm\infty$

$1$ $0$ $\frac{0}{0}$ $\infty-\infty$ $NaN$

11.4 浮点数运算

浮点数加减运算步骤：

对阶。策略是阶数更小的向阶数更大的对齐。
尾数加减
规格化
舍入
判断溢出

$9.85211\times10^{12}+9.96007\times10^{10}$

由于后面阶数不一样，所以要先对齐。通常策略是阶数更小的向阶数更大的对齐。原因是定点小数前只有一位方便计算机处理。
$9.85211\times10^{12}+0.0996007\times10^{12}$
$(9.85211+0.0996007)\times10^{12}=9.9517107\times10^{12}$
$9.9517107$ $0.0099517$ $99.517107$ 就需要右规。
$6$ $9.9517107\times10^{12}\xrightarrow{保留五位小数}9.95171\times10^{12}$ $0$ $1$ 等。
$9.85211\times10^{99}+9.96007\times10^{99}=19.81218\times10^{99}$ $6$ $1.98122\times10^{100}$ 阶码超过两位，发生溢出。
$3,4$ 两步规范。

接着看二进制浮点数加减法。

$X=-\frac{5}{256}$ $Y=+\frac{59}{1024}$ $X-Y$ $2$ $3$ $2$ $9$ 位。

解题步骤：

首先将十进制数转换为二进制。
$5\xrightarrow{二进制}101$ $\frac{1}{255}\xrightarrow{二进制}2^{-8}$ $X=-101\times2^{-8}=-0.101\times10^{-5}=-0.101\times10^{{-101}_{2}}$
$59\xrightarrow{二进制}111011$ $\frac{1}{1024}=2^{-10}$ $Y=+111011\times2^{-10}=+0.111011\times2^{-4}=0.111011\times2^{{-100}_{2}}$
接着把尾数和阶码部分转换为补码
$-0.101\times10^{{-101}_{2}}$ ${-101}_{2}\xrightarrow{补码}1011$ $11,011$ $-0.101\xrightarrow{1.011}$ $9$ $11.011000000$ $X=11011,11.011000000$ $Y=11100,00.111011000$
$1$
$11$ 即负数，证明被减数要比减数阶数小。
$X_{阶码}+[-Y]_{阶码}=11011+00100=11111$ $-1$ $X$ $1$
$X:11011,11.011000000\xrightarrow{向右移动一位}11100,11.101100000$
$Y$ $+1$ $-Y\xrightarrow{数值位取反末尾+1}11100,11.000101000$
$X+(-Y)=11.101100000+11.000101000=10.110001000$
$11.011000100$ $+1$ $11100+1=11101$
$11101,11.011000100$
$0$ ，所以这里不用考虑舍入问题。
$3$ $11101,11.011000100$ $2^{-3}\times(-0.1001111)_{2}$

上面例子没有舍入，下面是需要舍入方法：

$0$ $1$ $0$ $1$ $1$ 。这样做可能会使尾数又溢出，此时需再做一次右规。

$1$ $1$ $0$ $1$ "。这种方法同样有使尾数变大和变小的两种可能。

$11100,10.110001011$ $10$ $11101,11.011000101\quad1$ $1$ $0$ $1$ 数值末位 $+1$ $11101,11.011000101+1=11101,11.011000110$ $1$ 法类似。

$0$ $(24bit\xrightarrow{放入}32bit)$ $(32bit\xrightarrow{放入}24bit)$ 再拼回浮点数。

11.5 浮点数强制类型转换

系统位数对应的变量类型如下：

$char\rightarrow int\rightarrow long$ $1$ $+11$ $+52$ $1=53$ 位。

$32$ $long\rightarrow double$ $long$ $32$ $double$ $53$ $32$ $long$ $double$ $64$ $long$ $64$ $doble$ $53$ 位。此时就会有精度的损失。

$float$ $1+23=24$ $double$ $1+52=53$ $float\rightarrow double$ 不会丢失精度。

$int\rightarrow float$ $32$ $int$ $1$ $+31$ $float$ $1$ $+8$ $+23$ $+1$ $24$ $int\rightarrow float$ $float$ $8$ $int$ $float\rightarrow int$ $float$ $int$ $float$ $int$ 更大，所以会有溢出可能性。

三. 存储系统

存储器层次结构

$ACC,MQ$ 等。这些寄存器会比Cache缓存都快的多，所以CPU进行运算时，会把操作数放入寄存器中。

存储器层次结构图如下：

$cache$ $cache$ 缓存中。

$+$ 操作系统实现的，操作系统根据页面置换算法可以决定把哪些数据从主存置换到外存，这一层面需要系统程序员关系。主存和Cache之间的数据交换通常由硬件自动完成，这一部分由硬件工程师完成。

$——$ 辅存：实现虚拟存储系统，解决了主存容量不够的问题

$——$ 主存：解决了主存与CPU速度不匹配的问题

存储器分类如下：

同时，存储器也可以按照存储介质分类：

半导体存储器：以半导体器件存储信息。常用在主存和Cache上。
磁表面存储器：以磁性材料存储信息。常用在磁盘和磁带上。
光存储器：以光介质存储信息。常见的有光盘。

也可以按存取方式分类：

随机存储存储器(RAM)：读写任何一个存储单元所需时间都相同，与存储单元所在的物理位置无关。如：内存条。
顺序存取存储器(SAM)：读写一个存储单元所需时间取决于存储单元所在的物理位置。如：磁带等。
直接存取存储器(DAM)：既有随机存取特点，也有顺序存取特点。先直接选取信息所在位置，然后按顺序方式存取。如：机械硬盘。

后两种存储器由于读写某个存储单元所需时间与存储单元的物理位置有关，所以也可以一起称为串行访问存储器。

还有一种特殊存储器：相联存储器：一种可以按内容访问的存储器(CAM)，按照内容检索到存储位置进行读写。快表就是一种相联存储器。即可以直接表明要查找的内容，根据内容找到数据存储位置。

也可以按照信息的可更改性进行分类：

$/$ W M)：既可以读也可以写。如：磁盘、内存、Cache
只读存储器(ROM)：只能读，不能写。如：实体音乐专辑采用CD-ROM、实体电影采用蓝光光碟、BIOS通常写在ROM中集成在主板上。事实上很多ROM也可以进行写数据，只不过比较麻烦。

还可以按照信息可保存性分类：

断电后，存储信息消失的存储器：易失性存储器。如：主存、Cache。
断电后，存储信息依然保持存储器：非易失性存储器。如：磁盘、光盘。
信息读出后，原存储信息被破坏：破坏性读出。如：DRAM芯片，在读出数据后要进行重写。
信息读出后，原存储信息不被破坏：非破坏性读出。如：SRAM芯片、磁盘、光盘。

存储器性能指标：

$\times$ $1M\times8$ 位。MDR位数反映存储字长。
$=$ $/$ 总容量
$=$ $/$ 存储周期。数据的宽度即存储字长。

存取时间：存储时间是指从启动一次存储器操作到完成该操作所经历的时间，分为读出时间和写入时间。

$T_m=$ $T_a+$ 回复时间

$/$ $/$ $/$ $/$ $/$ s)

1. 主存储器基本组成

一个存储体可以分为：存储体、MAR、MDR三大部分。其中MAR是地址寄存器，MDR是数据寄存器。这三个原件会在时序控制逻辑指挥下进行配合工作。

1.1 存储芯片基本原理

$0$ $1$ 。

$5V$ $5V$ 高电压会达到MOS管阈值，接着MOS管就是导电。而如果电压没有达到阈值，那这个MOS管元件就是一个绝缘体。这种在电压达到阈值后是导体，如果电压不够或没有电压情况下又是绝缘体的材料被称为半导体材料。

$0V$ $5V$ $5V$ $0V$ $1V$ $0$ $1$ 。

$1$ $1$ $5V$ $1$ $1$ $0$ $0$ 。

$5V$ $5V$ $5V$ $0V$ $1$ 。最后再将MOS管断开即可完成存储。

如果将多个存储元进行科学合理的连接，那么就可以一次性读出或写入多个二进制数据。存储单元构成如下：

$5V$ $0$ $1$ 。

而多个存储单元就构成了存储体，也称存储矩阵。存储体结构如下：

$8$ $8bit$ $=8bit$ 。

实际情况中要使用译码器，来解决如何根据地址决定要读或写的存储字位置。如下：

$n$ $n$ $2^n$ 个存储单元，所以译码器会根据地址寄存器MAR中给出的这几位地址，将其转变成某一条选通线的高电压信号。

$000$ $0$ $0$ 根字选线给它一个高电平的输出，之后再根据上面存储单元读取数据原理，就可以读取第一行的二进制信息。

$2^3$ $8$ $=$ 存储字长。

$=$ $\times$ $=2^3\times8bit=2^3\times1Byte=8B$ $2^3$ 表示MAR给定的只有三个地址。

继续完善这个存储芯片构成，还需要增加一个控制电路，用于控制译码器、MAR和MDR。

如CPU通过地址总线把地址送入MAR中，但是由于使用的是电信号来传输二进制数据，而电信号难免有不稳定的时候。因此当MAR中电信号稳定之前这个地址信息是不能送到译码器中的。所以这就是控制电路作用，只有MAR稳定后才会打开译码器开关让译码器翻译这个地址。同样当数据输出时，输出电信号稳定后控制电路才会认为此时输出是正确无误的，所以控制电路也需要控制MDR在什么时候给数据总线送出数据。

另一方面存储芯片还需要对外提供：

$\overline{CS}或\overline{CE}$ 表示)。这种头上画线表示该信号低电平有效。
读控制线和写控制线。
$\overline{WE}$ $\overline{OE}$ 允许读
$\overline{WE}$ 低电平表示写，高电平表示读。

至此存储芯片完整构造原理已经介绍完：

存储芯片逻辑图：

存储矩阵就是一个个的存储元。译码驱动电路分为：译码器和驱动器。译码器前面已经介绍，驱动器作用就是保证译码器输送到字选线的电信高稳定。读写电路包括自选先、数据线和控制电路。另外一个存储芯片通常还需要地址线来接受CPU通过地址总线传递的地址信息。还需要通过数据线进行数据的传输。除此之外还需要片选线电信号来确定这一块芯片此时是否可用。最后还需要读写控制线，读写控制线可能不止一条。

详细说一下片选线，给定一个内存条：

$\overline{CS}$ 低电平信号给要读取的芯片。而其他芯片都给一个高电平信号。这样就能保证此时读取的就是指定芯片的数据。

存储芯片逻辑图中每根线都会对应硬件的一个金属引脚。有的题目会让判断金属引脚最少数目。这种题其实就是判断地址线和数据线的总根数，再加上一定需要的一根片选线和至少一根的读写控制线的数目就是金属引脚的最少数目。另外还会有供电引脚、接地引脚。

$MAR$ $MDR$ 数。

$n$ $2^n$ $n$ 条。

$8K\times8$ $8K=2^{13}$ $8bit$ $2^{13}\times8bit$

1.2 寻址方式实现

$8bit$ $1k$ $256$ $256$ $1k$ $10$ $2^{10}=1k$ $0\sim1023$ ：

$1$ $001\xrightarrow{算术左移两位}100$ $100$ $4$ ，这样我们就得到这个字的起始字节的地址。

其他寻址方式原理类似。

2. SRAM和DRAM

SRAM即静态RAM；DRAM即动态RAM。

DRAM主要用于主存，SRAM用于Cache。重点在于SRAM和DRAM的对比。

上一节中介绍的存储器基本原理是DRAM芯片。两个芯片核心区别在于：存储元不一样。

DRAM芯片：使用栅极电容存储信息。SRAM芯片使用双稳态触发器存储信息。

2.1 SRAM和DRAM区别

DRAM存储元(栅极电容)：

SRAM存储元(双稳态触发器)：

$M_1\sim M_6$ )表示。这中存储元可以呈现出两种稳定的状态：

$A$ $B$ $1$
$A$ $B$ $0$

$0$ $1$ 。

$0$ $BL$ $BLX$ $A$ $B$ $0$ 。

两中存储元区别：

栅极电容	双稳态触发器
电容放电信息被破坏，是破坏性读出，读出后应有重写操作，读写速度更慢	读出数据，触发器状态保持稳定，是非破坏性读出，读写速度更快
每个存储元制造成本更低，集成度高，功耗低	每个存储元制造成本更高，集成度低，功耗大

更详细对比：

上面提到了刷新的概念：

$2ms$ $2ms$ $2ms$ 之内必须刷新一次(给电容充电)。
而双稳态触发器只要不断电，触发器的状态就不会改变。

2.2 DRAM的刷新

$2ms$ ，且以行为单位，每次刷新一行存储单元。

$20$ $2^{20}=1M$ $1M$ 根线(一百万根)不太可能实现。

$n$ $\frac{n}{2}$ $\frac{20}{2}=10$ $2^{10}=1024=1k$ 即可。

$00000000$ $0000$ $0000$ $0$ $0$ 列存储单元内信息。

$8$ $2^8=256$ $2^4$ $2^4$ 根。

$1$ $/$ 写周期。

$128\times128$ $/$ $0.5$ $2ms$ $2ms/0.5us=4000$ 个周期。则刷新方式如下：

$1us$ $0.5us$ $0.5us$ 时间用于刷新某行。这种方式称为分散刷新
$2ms$ $2ms/1us=2000$ 次刷新操作。
$2ms$ $0.5us$ ，有一段时间专门用于刷新，这段无法访问存储器的刷新时间，称为访问死区。这种方式称为集中刷新
$2ms$ $1$ $2ms$ $128$ $2ms/128=15.6us$ $15.6us$ $0.5us$ 的死时间无法访问。这种方式称为异步刷新。

在实际操作中，可以利用CPU不需要访问存储器这段时间进行刷新。即可在译码阶段进行刷新。这个刷新由存储器独立完成，不需要CPU控制。

2.3 DRAM地址线复用技术

$n$ $\frac{n}{2}$ 条地址线就可以。先将行地址送达行地址缓冲器，再将列地址送入列地址缓冲器，两个缓冲器再送给两个译码器。

$n$ $\frac{n}{2}$ 个地址线即可。

所以在题中如果问DRAM引脚数量要考到地址复用技术导致引脚数量减半这一因素。

现在DRAM芯片已经过时，现在主存通常是采用SDRAM芯片。如：主存DDR3和DDR4。

3. ROM

ROM芯片：非易失性，断电后数据不会丢失

几种ROM芯片：

MROM：掩模式只读存储器
厂家按照客户需求，在芯片生产过程中直接写入信息，之后任何人不可重写(只能读出)可靠性高、灵活性差、生产周期长、只适合批量定制。
PROM：可编程只读存储器
用户可用专门的PROM写入器写入信息，写一次之后就不能更改。
RPROM：可擦除可编程只读存储器
允许用户写入信息，之后用某种方式擦除数据，可进行多次重写
$8\sim20$ 分钟后可擦除所有信息
EEPROM：可用电擦除方式，擦除特定的字。
Flash Memory(闪速存储器)：在EEPROM基础上发展而来，断电后也能保存信息，且可进行多次快速擦除重写。如：U盘，SD卡等
注意：由于闪存需要先擦除再写入，因此闪存的"写"速度比"读"速度更慢。
每个存储元只需要单个MOS管，所以位密度比RAM高。也就是ROM内存要比RAM大。
$+$ 存储单元(Flash芯片)构成，与闪速存储器的核心区别在于控制单元不一样，但存储介质都类似，可进行多次快速擦除重写。SSD速度快、功耗低、价格高。目前个人电脑上常用SSD取代传统的机械硬盘。
拓展：手机辅存也使用Flash芯片，但相比SSD使用的芯片集成度更高、功耗低、价格贵。

之前的学习可以知道主存中存放重要指令。CPU根据这些指令完成对应操作。由于主存是RAM芯片，这种芯片会在断电后数据丢失。当再次开机时会将辅存中指令数据调用到主存中。操作系统装在辅存中，由于开机时主存中没有指令所以CPU必须向主板上面的ROM芯片读取开机所需要执行的指令。这个主板上ROM芯片就是BIOS芯片，其内部存储了"自举装入程序"，负责引导装入操作系统(开机)。

$+$ ROM(BIOS)组成。且二者统一编址。

$1kb$ $0\sim1023$ $1024$ 开始往后编号。

总结：

很多ROM芯片虽然名字是“Read-Only"，但很多ROM也可以进行"写"操作。

闪存的写速度一般比读速度更慢，因为写入前要先擦除。

RAM芯片是易失性的，ROM芯片是非易失性的。很多ROM也具有"随机存取"的特性。

3. 主存优化

$T=$ $r+$ 恢复时间

$r$ $T$ $T=4r$ )。而SRAM的恢复时间较短。由于存取周期长，从而引发多核CPU访问内存难得问题。

3.1 双端口RAM

作用：优化多核CPU访问一根内存条的速度。

这里CPU两个内核可以通过内存RAM的两个端口进行访问。如果要支持双端口RAM必须要有两组完全独立的数据线、地址线、控制线。CPU、RAM中也要有更复杂的控制电路(主板)。

$4$ 种情况：

两个端口同时对不同的地址单元存取数据。
两个端口同时对同一地址单元读出数据。
两个端口同时对同一地址单元写入数据。这种情况是不被支持的，会出现写入错误情况。
两个端口同时对同一地址单元，一个写入数据，另一个读出数据。这种情况不被支持，因为会出现读出错误。

$0$ ，由判断逻辑决定暂时关闭一个端口(即被延时)，未被关闭的端口正常访问，被关闭的端口延长一个很短的时间段后再访问。

$——$ 写者"问题。

3.2 多体并行存储器

内存每次读写都要恢复操作，当CPU要想连续读取时必须等待恢复，这个问题解决可以用到多体并行存储器。

$M_0\sim M_3$ 可以理解为四根规格一样的内存条。这种方案有两种编址方式：高位交叉编址和低位交叉编制。

高位交叉编址
$2^2=4$ 正好可以表示四种内存条。
$M$ $8$ $体号+体内地址$ 构成。体号是当前存储体的地址，体内地址是每个存储体编号。
$M_0=0\sim8$ $M_1=9\sim18\cdots$ 。
$T$ $r$ $T=4r$ $0000,00001,00010,00011,00100$ 这五个地址。
$0000,00001,00010,00011,00100$ $5T$ $r$ $3r$ $5T$ 。
低位交叉编址
与高位交叉编址相反，即采用低位区分存储体。
$M_0$ $0$ $M_1$ $1$ $M_2$ $2\cdots$
$0000,00001,00010,00011,00100$ $T+4r\approx2T$ 。
$T+r=5r$ $3r$ $T+4r=2T$ 。

$n$ $T+(n-1)r$ 。实际上数据在内存中存储就是连续的，所以低位交叉编址方式应用更广泛，而高位交叉编址方式相当于单纯的扩容，速度上提升不大。

低位交叉编址方式采用流水线的方式并行存取(宏观上并行，微观上串行)：

$m$ $m$ $T$ $/$ $r$ $m\ge \frac{T}{r}$ $m=\frac{T}{r}$ 。

3.3 单体多字存储器

相当于将多体多体并行存储器中的存储体进行合并。整个存储器只用一套读写电路、地址寄存器和数据寄存器。

$m$ $m$ $m$ 个字，不能单独取其中某个字。所以要读取的指令和数据在内存必须连续存放。即如果指令和数据不在同样一行存储，就意味着要读取两行数据，这两行数据中有部分无用信息。所以灵活性差。

$r$ 。都可以很大程度上提升主存读写速度。

4. 主存储器与CPU连接

先回忆一下单块存储芯片：

$8$ $64$ $=$ 存储字长。并且现代计算机中MAR和MDR都在CPU中，而存储芯片只是一个普通的寄存器。现代计算机主存结构如下：

如果想扩展主存的字数，需要字扩展；如果存储芯片字长比数据总线宽度要小，要用到位扩展。

4.1 位扩展

为了描述方便可以给存储芯片输入信号和输出信号进行命名：

$A_0\sim A_7$ $D_0\sim D_7$ $\overline{CS}$ $\overline{CE}$ $\overline{WE}$ $\overline{WR}$ 有的地方会把两根读写线分开表示。

$8k\times1$ 位的存储芯片：

$8k=2^13$ $13$ 根地址总线，连接上就完成了地址线的连接。

$WE$ 表示如果是高电平CPU就会往里写数据，如果是低电平就会读数据。

$1$ 位，所以一次只能通过数据总线来传送一位数据。

$CS$ ，由于只有一块芯片所以直接输入一个高电平信号，高电平代表开启。

$1$ $8k\times1$ 位。

$2$ $6$ 个存储芯片。

$8bit$ 。这种扩展方式称为位扩展。

4.2 字扩展

$8k\times8$ 位的存储器

$8$ $13$ $16$ $3$ $2^{16}$ $16$ $8k\times8$ 存储器，连接的方法有两种：线选法和译码片选法

线选法
$CS$ $A_{13}$ $A_{14}$ $CS$ $A_{13}$ $1$ $A_{14}$ $0$ ，则表明左边存储芯片可以进行读写，右边则不会工作。
$A_{13},A_{14}$ 只能是不相同 $11$ $11$ $00$ 开头的地址不可用。
译码片选法
接着优化上面的线选法
$A_{13}$ $A_{13}$ $1$ $0$ $1\times\times\times$ $0\times\times\times$ $1-2$ $2^1$ $n$ $2^n$ 种不同的状态。
$3-8$ 译码器：
$3$ $8$ $0\sim8$ 。之前接触过更复杂的译码器，所以可以顺着这个思路继续优化。
$2-4$ $CS$ $\overline{CS}$ $01$ ，第二块寄存器会被选中进行读写操作，其他都不会工作。
$A_{15}和A_{13}$ $A_{14}$ $1$ $0$ 都不会影响。
$A_{14}$ $0$ $8k$ $A_{14}$ $1$ $8k$ $8k$ $16k$ 个地址，所以这种情况只会在考试出现，实际情况不可能出现。
$A_{13},A_{14},A_{15}$ $3-8$ $8k\times8$ 位的存储芯片即可。

字扩展的线选法和译码片选法对比：

实际情况应用最多的是译码片选法。

同时可以将二者结合产生新的方法：字位同时扩展法。

$8$ $4$ 位。

$16k$ $2^{14}$ $14$ $A_0\sim A_{13}$ $A_{14},A_{15}$ $2-4$ $64k\times8$ $0$ $1$ 不间断存储。

4.3 几种常见译码器

最常见的是高电平有效的译码器：
$CS$ 使用。
低电平有效的译码器
$\overline{CS}$ 使用。
有使能端的译码器
$CS$ $\overline{CS}$ 。
$74ls138$ 型号的译码器)
$+$ 两个低电平译码器才能工作。
$000$ $1$ $\overline{CS}$ $1$ 就不会工作。
$\overline{MREQ}$ (主存储器请求信号)，当CPU想要正式访问主存时，这个信号会发出低电平，译码器使能端接受到这个低电平就会开始工作。
$\overline{MREQ}$ 发出主存请求信号让译码器工作。这样就能保证当一块存储芯片选中时，这块芯片所接受的地址地址信息是稳定的。

5. 磁盘存储器

计算机的外存储器又称为辅助存储器，目前主要使用磁表面存储器。所谓"磁表面存储"，是指把某些磁性材料薄薄地涂在金属铝或塑料表面上作为载磁体来存储信息。磁盘存储器、磁带存储器和磁鼓存储器均属于磁表面存储器。

$1bit$ 。并且读写这两种状态不能同时进行。

磁表面存储器的优点:

存储容量大，位价格低
记录介质可以重复使用
记录信息可以长期保存而不丢失，甚至可以脱机存档
非破坏性读出，读出时不需要再生。

磁表面存储器的缺点:

存取速度慢
机械结构复杂
对工作环境要求较高(磁性材质易受强磁场的干扰)。

外存储器既可以作为输入设备，也可以作为输出设备。(既可以存数据，也可以读数据)

5.1 磁盘设备的组成

磁盘分为两部分：正面是左图的机器部分。背面是右图的电路部分。具体细分如下：

存储区域：
一块硬盘含有若干个记录面，每个记录面划分为若干条磁道，而每条磁道又划分为若干个扇区，扇区(也称块)是磁盘读写的最小单位，也就是说磁盘按块存取。
为了读取每个盘面(记录面)的数据，因此每个盘面都有读写磁头
- $/$ 写入盘片上记录面的信息，一个记录面对应一个磁头。
此面涂抹磁性材料方式是一圈一圈涂的每一圈的磁性材料称为磁道。而每个盘片都是同样被划分多个磁道，对于不同盘面上相对位置相同的磁道称为一个柱面。
- 柱面数：表示硬盘每一面盘片上有多少条磁道。在一个盘组中，不同记录面的相同编号(位置)的诸磁道构成一个圆柱面。
同时还会给每个盘面划分多个扇区。计算机每次对磁盘的读写操作都是以扇区位单位的
- 扇区数：表示每一条磁道上有多少个扇区。
硬盘存储器
为了能让磁盘能动起来，一个磁盘中需要有机械部件。
这些机械部件有：磁盘驱动器、磁盘控制器和盘片组成。
磁盘驱动器：核心部件是磁头组件和盘片组件，温彻斯特盘是-种可移动头固定盘片的硬盘存储器
磁盘控制器：是硬盘存储器和主机的接口，主流的标准有IDE、SCSI、 SATA等。

值得一提的是在一个磁盘的盘面上，可以在正面和反面都涂抹上一圈一圈的磁性材料。最上面光盘和最下面光盘一侧没有磁头，剩下光盘都有两个磁头在其盘片的正面和背面。磁盘横切面图：

5.2 磁盘的性能指标

磁盘性能指标通常看以下几点：

磁盘的容量：一个磁盘所能存储的字节总数称为磁盘容量。磁盘容量有非格式化容量和格式化容量之分。
非格式化容量是指磁记录表面可以利用的磁化单元总数。即磁盘在物理上来看总共可以存储的二进制比特位上限。
格式化容量是指按照某种特定的记录格式所能存储信息的总量。即磁盘有的扇区可能会损坏，为了避免有的扇区损坏导致整个磁盘无法使用，因此很多厂商生产的磁盘需要格式化留下某些备用的扇区作为顶替使用。所以实际用量会减少。
所以对于一块磁盘来说格式化的容量要比非格式化的容量要小。
记录密度：记录密度是指盘片单位面积上记录的二进制的信息量，通常以道密度、位密度和面密度表示。
$60道/cm$ $60$ 个磁道。
$600bit/cm$ $600bit$ 的信息。
注意：磁盘所有磁道记录的信息量一定是相等的，并不是圆越大信息越多，故每个磁道的位密度都不同。即越内测的磁道位密度越大。因此内测磁道会影响到磁盘的总体容量。
面密度是位密度和道密度的乘积。
平均存取时间：
$\begin{aligned} 平均存取时间 & = 寻道时间 (磁头移动道目的的磁道) + \\ 旋转延迟时间 (磁头定位到所在扇区) + \\ 传输时间 (传输数据所花费的时间) \end{aligned}$
磁盘读取过程如下：
首先磁盘要先进行寻道(找到所读位置的磁道)，通常来说寻道花销时间较长。接着会旋转盘片直到磁头靠近所读扇区的起始位置。最后盘片接着旋转，使得磁头划过所读扇形弧道长度。
通常来说寻道时间题目会给个平均时间，旋转延迟时间如果题目没给，一般取盘片转半圈的时间。最后扇区时间需要根据题中所给的磁盘转速算出。有的题目还需要加上磁盘控制器延迟时间(CPU传输读取指令的时间)。
数据传输率：磁盘存储器在单位时间内向主机传送数据的字节数，称为数据传输率。
$r$ $/$ $N$ $D_r=rN$ 。

5.3 磁盘工作原理

上面介绍过磁盘读取过程原理。主机为了指明要读取的扇区位置，需要给磁盘中的各个扇区编号，即地址。

磁盘地址一般如下图所示：

驱动器号：一台电脑又可能有多个硬盘，所以要指明哪个驱动器。
柱面号：根据柱面号，磁头臂可以移动到哪个位置。
盘面号：可以根据盘面号激活对应的磁头。
扇区号：激活对应磁头之后，盘面旋转在指明的扇区号停下。

$4$ $256$ $16$ $16$ 个扇区，则每个扇区地址 $18$ 位二进制代码。

磁盘工作过程：硬盘的主要操作是寻址、读盘、写盘。每个操作都对应一个控制字，硬盘工作时，第一步是取控制字，第二步是执行控制字。硬盘属于机械式部件，其读写操作是串行的，每次只能读写一个比特位，不可能在同一时刻既读又写，也不可能在同一时刻读两组数据或写两组数据。因此需要加入一个并串电路，因为CPU发送信号是并行的，而磁盘一次只能接受一比特是串行的。

5.4 磁盘阵列

RAID（Redundant Array of Inexpensive Disks 廉价冗余磁盘阵列）是将多个独立的物理磁盘组成一个独立的逻辑盘，数据在多个物理盘上分割交叉存储、并行访问，具有更好的存储性能、可靠性和安全性。也就是可以用某些手段将多个磁盘组成磁盘阵列，再结合相应的算法和机制可以提高磁盘的读写速度，同时也能提升存储性能、可靠性和安全性。

$RAID1\sim RAID5$ 的几种方案中，无论何时有磁盘损坏，都可以随时拔出受损的磁盘再插入好的磁盘，而数据不会损坏。

$RAID0$ ：无冗余和无校验的磁盘阵列。没有容错能力。
逻辑上相邻的两个扇区在物理上存到两个磁盘，类比之前的低位交叉编址的多体存储器。
$A_1\sim A_8$ $A_1$ $A_2$ 数据。所以该方案是无冗余数据，但没有校验。校验：磁盘会有扇区损坏情况，如果一个扇区损坏那么在这个扇区所有数据都会消失，也有可能读取扇区没有损坏，但由于其他干扰导致读取数据错误，这样问题都不能进行解决。所以该方案无校验。
$RAID1$ ：镜像磁盘阵列。有容错能力，但容量减少一半。
将统一数据存储在多个磁盘上。
$A_1,A_3\cdots$ $A_2,A_4\cdots$ ，这样也能提高读写速率。而这种方案也更靠谱，如果某些扇区损坏至少可以在另一个镜像磁盘中读取数据。不会全部消失。另外由于其他力量干扰导致读出数据产生跳变，可以对比两个磁盘信息找出错误。所以这种方案会有冗余信息产生，但也有校验的功能。磁盘利用率不高。
$RAID2$ $bit$ $4bit$ $+3bt$ 海明校验位，可纠正一位错。
$A_1\sim A_4$ $Disk4\sim Disk6$ $4$ $+3$ 位的海明校验码，就可以有发现一位错误的能力。
$RAID3$ ：位交叉奇偶校验的磁盘阵列。
$RAID4$ ：块交叉奇偶校验的磁盘阵列。
$RAID5$ ：无独立校验的奇偶校验磁盘阵列。

上面六种方案越往后可靠性越高，成本也越低。

6. 固态硬盘SSD

固态硬盘存储技术是基于闪存技术(Flash Memory)，属于电可擦除ROM，即EEPROM。

SSD组成有两部分：

闪存翻译层：负责翻译逻辑块号，找到对应页(Page)。
$16$ KB)，每个块包含多个页。
$I/O$ $/$ 磁盘扇区。

SSD读写性能：是以页为单位进行读写的。以块为单位进行擦除，擦干净的块，其中的每页都能写一次，被读无限次。且支持随机访问，系统给定一个逻辑地址，闪存翻译层可以通过电路迅速定位到对应的物理地址。

如果要写的页有数据，则不能写入，需要将有数据的块内其他页全部复制到一个新的(擦除过的)块中，再在新的块中写入想要写入的数据，最后将原来的块内所有页擦除。此时地址会放生改变，但闪存翻译层会修正写入块的地址。这就导致了SSD读的速度比写的速度快很多。

固态硬盘相较于机械硬盘特点：

SSD读写速度快，随机访问性能高，用电路控制访问位置；机械硬盘通过移动磁臂旋转磁盘控制访问位置，有寻道时间和旋转延迟
SSD安静无噪音、耐摔抗震、能耗低、造价更贵
SSD的一个"块"被擦除次数过多(重复写同一个块) 可能会坏掉，而机械硬盘的扇区不会因为写的次数太多而坏掉

由于上面的SSD一个块擦除次数过多可能会坏掉，所以现代SSD都会使用磨损均衡技术。

磨损均衡技术思想：将"擦除"平均分布在各个块上，以提升使用寿命。原理还是闪存翻译层有逻辑映射的功能，所以其真实物理地址会变。这种磨损技术分为两种：

动态磨损均衡：写入数据时，优先选择累计擦除次数少的新闪存块。
静态磨损均衡：SSD监测并自动进行数据分配、迁移，让老旧的闪存块承担以读为主的储存任务，让较新的闪存块承担更多的写任务。如：假设电脑中存储一部电影，对于电影来说读的次数更多基本上不会进行修改。所以SSD会监测到，并将电影放入擦除次数多的块中。

SSD总结：

$2^{40}B=1TB$ $2^{10}=1K$ $2^{37}B=128GB$ 数据。在最理想的情况下，这个固态硬盘可以用多久?

$\frac{1TB}{128GB}=8$ $8$ $1K$ $8K$ $23$ 年后，该固态硬盘会坏。

7. Cache缓存

之前运用双端口RAM、多模块存储器提高存储器的工作速度，但优化后主存与CPU速度差距依然很大，所以可以增加一个Cache层缓和CPU与主存之间的速度矛盾。

7.1 Cache基本原理与概念

Cache工作原理

假设启动一个微信并使用视频聊天功能，首先会将视频聊天的代码放入Cache中，CPU可以直接从缓存中读取。而Cache读写速度非常快可以更好配合CPU工作。

$12MB$ 。

Cache的局部性：

空间局部性：在最近的未来要用到的信息(指令和数据)，很可能与现在正在使用的信息在存储空间上是邻近的
时间局部性：在最近的未来要用到的信息，很可能是现在正在使用的信息。常见的是循环结构。

看一段代码：


xxxxxxxxxx
7
1
int sumarrayrows (int a[M][N]){
2
    int i,j,sum = 0;
3
    for(i=0;i<<M;i++)
4
        for(j=0;j<N;j++)
5
            sum += a[i][j];
6
    return sum;
7
}

上图是代码翻译成指令后，与数据一起存放在主存中。这个程序会一行一行访问数组中的元素：

$a[0][0]$ 后，在接下来的一段时间内与它相邻的其他元素也有可能被访问到。

根据时间局部性，由于循环内部执行了sum加法后，在这一段时间内这个加法指令还会被使用到。另外由于循环结构代码内的sum,i,j这些变量在短时间内也会被循环访问。

基于这些局部性原理，可以把CPU目前访问的地址"周围"的部分数据放到Cache中。再看下面一段程序：


xxxxxxxxxx
7
1
int sumarrayrows (int a[M][N]){
2
    int i,j,sum = 0;
3
    for(j=0;i<N;j++)
4
        for(i=0;i<M;i++)
5
            sum += a[i][j];
6
    return sum;
7
}

上面一段程序将会按照列来访问数组，显然这种按列优先的方式访问二维数组，其空间局部性会更差。所以这段代码在执行时间上要慢于第一段代码。

性能分析

$t_C$ $t_m$ $H$ $M=1-H$ 。CPU读取可以分为两个策略：

先读Cache再读主存
$t$ 为：
$t = H t_{c} + (1 - H) (t_{c} + t_{m})$
$H$ $t_c$ $Ht_c$ $t_c$ $t_m$ $(1-H)$ $(1-H)(t_c+t_m)$ $Ht_c+(1-H)(t_c+t_m)$ 。
注意这个过程是CPU先去Cache种找，找不到再去主存中找。
Cache和主存同时访问。
$t$ 为：
$t = H t_{c} + (1 - H) t_{m}$
可以看出这种访问效率会更高。

$5$ $95%$ ，则采用Cache后，存储器性能能提高多少？(设Cache和主存同时被访问，若Cache命中则主存中断访问)。

$t$ $5t$ $t$ $5t$ $0.95\times t+0.05\times5t=1.2t$ $\frac{5t}{1.2t}\approx4.17$ 倍。

$t$ $t+5t$ $T_a=0.95\times t+0.05\times6t= 1.25t$ $\frac{5t}{1.25t}=4$ 倍。

有待解决的问题

基于局部性原理，不难想到，可以把CPU目前访问的地址"周围"的部分数据放到Cache中。关于这个"周围"可以用以下方法确定：

$1KB$ 为一块。主存与Cache之间以"块"为单位进行数据交换。

$a[0][0]$ $a[0][0]$ $a[2][2]$ 这样一块存储中的数据放入Cache中。而为了方便存储，Cache内部也会被分为大小相等的块。

$4MB$ $1KB$ $\frac{2^{22}}{2^{10}}=2^{12}=4096$ $22$ $12$ $10$ 位表示。

$/$ $/$ 页框"。而Cache中的"块"也称为"行"

同时每次被访问的主存块，一定会被立即复制进Cache中。从而还有以下几个问题要解决：

如何区分Cache与主存的数据块对应关系?
解决办法：Cache和主存的映射方式
Cache很小，主存很大。如果Cache满了怎么办? 解决方法：使用替换算法
CPU修改了Cache中的数据副本，如何确保主存中数据母本的一致性?
解决方法：Cache写策略

7.2 Cache主存映射方式

映射方式可以解决Cache与主存的数据块对应关系这一问题。

映射方式有三种：全相联映射、直接映射、组相联映射。

全相联映射
主存块可以放在Cache的任意位置。
直接映射
$=$ $\%$ $1$ $1\%8=1$ $1$ 号位置。
组相联映射
$=$ $\%$ $1$ $1\%4=1$ $1$ 组的任意位置。

$+$ 一个有效位方式解决。

$0$ $1$ $0$ $1$ $0$ $0$ 号地址的信息，所以要用到第二个标记有效位来确认这个指向主存地址信息是否可用。

$7$ $1$ $7$ $0$ 号块的信息。下面会介绍每种映射方式细节。

全相联映射

$256MB$ $8$ $64B$

$64B$ $64B$ $256MB$ $2^{28}$ $28$ $256MB$ $64=2^{6}$ $\frac{2^{28}}{2^{6}}=2^{22}$ $2^{22}$ $22$ $6$ 位当块内地址。

存放原理：

$0$ $0$ $3$ $3$ $22$ $0$ $0$ $1$ ，表示这个标记地址有效。

访问原理：

$1\cdots1101\quad001110$ $22$ $=1$ $001110$ $=0$ ，则正常访问主存。

优点：Cache存储空间利用充分，命中率高。

缺点：查找"标记"最慢，有可能需要对比所有行的标记。

直接映射

$256MB$ $8$ $64B$

$=$ $\%$ Cache总块数

$0$ $0\%8=0$ $0$ $8$ $8\%8=0$ $0$ 号块已经有数据，那么之前的数据会被覆盖掉。

$8$ 号主存不能使用。这种方法灵活性差，空间利用率也不充分。

$22$ $\%2^3$ $22$ $0\cdots01000$ $19$ 位就可用。

$=2^n$ $n$ 位直接反映它在Cache中的位置。所以将主存块号的其余位作为标记位即可。即不用对主存块号取余，只需要知道主存块号后三位就能知道对应的组号。同样这种方法可用直接优化主存块号位数：

CPU访问方法：

$0\cdots01000\quad001110$ $3$ $000$ $19$ $=1$ $001110$ $=0$ ，则正常访问主存。

优点：对于任意一个地址，只需对比一个"标记"，速度最快。

缺点：Cache 存储空间利用不充分，命中率低。

组相联映射

$256MB$ $8$ $64B$

$=$ $\%$ 分组数

$2$ $2$ 块为一组，分四组。

$1$ $=1\%4=1$ $2^2$ $4$ $20$ 位即可。即不用对主存块号取余，只需要知道主存块号后两位就能知道对应的组号。

同样可用块号和块内地址细分：

CPU访问方法：

$1\cdots1101\quad001110$ $2$ $01$ $1$ $20$ $=1$ $001110$ $=0$ ，则正常访问主存。

$n$ $n$ 个Cache块为一组。

7.3 Cache替换算法

Cache替换算法可用解决Cache很小，主存很大。如果Cache满了之后出现一系列问题。

结合上一节学的三种映射方式，分析Cache替换规则：

全相联映射
只有整个Cache完全满了才需要替换，需要在全局远择替换哪一块
直接映射
如果对应位置非空，则毫无选择地直接替换
组相联映射
分组内满了才需要替换需要在分组内选择替换哪一块

由于直接映射会直接替换不用进行选择，所以替换算法只会用到全相联映射和组相联映射这两种方式中。

随机替换算法

随机替换算法(RAND, Random)：若Cache已满，则随机选择一块替换。

$4$ $\{1,2,3,4,1,2,5, 1,2,3, 4, 5\}$ 。访问以及替换方式如下：

由于每访问一次主存都需要将该主存块调入Cache中。当访问前四个主存数据时，刚好可以全部存入Cache中。
$1$ $1$ $2$ 号主存块也是一样，同样缓存可以命中。
$5$ $2$ 号Cache块。
$1,2$ 号主存块的访问都可以命中Cache缓存
$3$ $3$ 号Cache块。
$4$ $1$ 号Cache块。
$5$ 号主存块，该主存块在Cache缓存命中，所以直接访问

可以看出随机替换算法实现简单，但完全没考虑局部性原理，命中率低，实际效果很不稳定。

先进先出替换算法

先进先出算法（FIFO, First In First Out）：若Cache已满，则替换最先被调入Cache的块。

$4$ $\{1,2,3,4,1,2,5, 1,2,3, 4, 5\}$ 。访问以及替换方式如下：

由于每访问一次主存都需要将该主存块调入Cache中。当访问前四个主存数据时，刚好可以全部存入Cache中。
$1$ $1$ $2$ 号主存块也是一样，同样缓存可以命中。
$5$ $0$ 号Cache存储块，所以替换该存储块。
$1$ $1$ 号Cache存储块，所以替换该存储块。
$2$ $2$ 号Cache存储块，所以替换该存储块。
$3,4,5$ $3,0,1$ 号Cache存储块。

$0,1,2,3$ $0,1,2,3$ 号Cache存储块。该依然没考虑局部性原理，最先被调入Cache的块也有可能是被频繁访问的。

并且这种算法还会出现抖动现象：频繁的换入换出现象(刚被替换的块很快又被调入)

近期最少使用算法

近期最少使用算法(LRU, Least Recently Used )：为每一个Cache块设置一个"计数器"，用于记录每个Cache块已经有多久没被访问了。当Cache满后替换"计数器"最大的。

采用这种算法需要增加一个计数器，记录一个Cache块多久没有被访问。计数规则如下：

$1$ ，其余不变。
$0$ $1$ 。
$0$ $1$ 。

$1$ $4$ 。不用考虑两个计数器相等情况。

$4$ $\{1,2,3,4,1,2,5, 1,2,3, 4, 5\}$ 。访问以及替换方式如下：

$1$ $0$ $0$ 号Cache块。
$2$ $+1$ $0$ $+1$ 。
$3$ $+1$ $0,1$ $+1$ 。
$4$ $+1$ $0,1,2$ $+1$ 。
$1$ $1$ $1,2,3$ $+1$ 。
$2$ $1$ $0,2,3$ $+1$ 。
$5$ $2$ $0$ $1$
$1$ $2$ $1$ $1,2$ $+1$ $3$ $3$ $3$ $+1$ 意义不大。
$2$ $2$ $1$ $0,2$ $+1$ 。
$3$ $3$ $0$ $1$
$4$ $2$ $0$ $1$
$5$ $0$ $0$ $1$

$=2^n$ $n$ $2^2$ $2$ 位就可以记录计数器信息。

$>$ Cache行的数量 $\{1,2,3,4,5,1,2,3,4,5,1,2..\}$ $5>$ $4$ 。

最不经常使用算法

最不经常使用算法(LFU, Least Frequently Used )：为每一个Cache块设置一个"计数器"，用于记录每个Cache块被访问过几次。当Cache满后替换"计数器"最小的。

计数器规则是：

$=0$ $+1$ 。需要替换时，选择计数器最小的一个Cache块替换。如果计数器最小Cache有多个，就可以按照行号递增或FIFO策略进行选择。

$4$ $\{1,2,3,4,1,2,5, 1,2,3, 4, 5\}$ 。访问以及替换方式如下：

$0$ 。
$1,2$ $0,1$ $+1$ 。
$5$ $2,3$ $2$ 号Cache块进行替换。
$1,2$ $0,1$ $+1$ 。
$3$ $2,3$ $2$ 号Cache块进行替换。
$4$ $3$ $+1$ 。
$5$ $2$ 号Cache块进行替换。

由于该算法需要用到计数器，并且计数器位数有可能很大。

LFU算法：曾经被经常访问到的主存块在未来不一定会用到(如：微信视频聊天相关的块，使用时计数器会一直增加，但不使用的时候由于计数器值已经很大，这些数据不会在接下来的一段时间内被缓存替换掉)，并没有很好地遵循局部性原理，因此实际运行效果不如LRU。

7.4 Cache写策略

Cache写策略可以解决CPU修改了Cache中的数据副本，并如何确保主存中数据母本的一致性问题。

写命中

缓存命中情况下CPU对某个命中地址进行写操作。这种情况有两种解决方法。

写回法
写回法(write-back)：当CPU对Cache写命中时，只修改Cache中的内容，而不立即写入主存，只有当此块被替换时才写回主存。
此方法需要增加一个脏位标志，用于判断该Cache缓存块是否被修改过。
该方法可以使CPU的访存次数减少，从而节省写操作所需的时间。但是存在数据不一致的隐患。
全写法
又称写直通法，当CPU对Cache写命中时，必须把数据同时写入Cache和主存，一般使用写缓冲(write buffer)。
这个写缓冲是使用SRAM实现的先进先出的队列。当CPU写操作缓存命中时，会修改缓存中的数据，同时会把要写入的数据放入写缓冲区。之后CPU就可以进行其他操作。在CPU进行其他操作时，写缓冲区在专门的控制电路控制下逐一将数据写回主存。
使用写缓冲，CPU写的速度很快，若写操作不频繁，则效果很好。若写操作很频繁，可能会因为写缓冲饱和(写缓冲大小有限制)而发生阻塞。

写不命中

当CPU进行写操作对Cache缓存没有命中情况下，采用两种方式：

写分配法：把主存中的块调入Cache，在Cache中修改。通常搭配写回法使用。
CPU进行写操作，没有缓存命中情况下，会先将主存中的数据调入Cache缓存中，在对该缓存进行写操作。之后搭配写回法完成对主存写操作。
非写分配法：当CPU对Cache写不命中时只写入主存，不调入Cache。搭配全写法使用。
采用这种方法就意味着，CPU只有读操作未命中时才调入Cache。

多级Cache

现代计算机常采用多级Cache方式。

上面两个Cache(L1，L2)离CPU越近的速度越快，容量越小；离CPU越远的速度越慢，容量越大。

$+$ 非写分配法。

$+$ 写分配法。

8. 页式存储器

主存和Cache之间是以块为单位进行读写的。

$1KB$ $4KB$ $4$ $1KB$ )相同。

将该程序分为四个页面，并给每个页面进行编号：

将程序分页后就可以将程序离散的放在主存的任意位置。储存利用率会得到提高。

所以，所谓页式存储系统就是一个程序(进程)在逻辑上被分为若干个大小相等的"页面"，"页面"大小要与主存"块"的大小相同。每个页面可以离散地放入不同的主存块中。

注意：程序分为页面是逻辑层面划分。而主存和Cache分块更多是物理层面划分。

8.1 页表

引入两个重要概念：

逻辑地址(虚地址)：程序员视角看到的地址。

物理地址(实地址)：实际在主存中的地址。

CPU执行的机器指令中，使用的是"逻辑地址"，因此需要通"页表"将逻辑地址转为物理地址。页表的作用是记录了每个逻辑页面存放在哪个主存块中。

每个程序都会被离散存放在主存中的某个位置：

$4KB=2^{12}B$ $000000000000\sim111111111111$ $x:001000000011$ $y:110000001010$ $x$ $ACC$ $000001\quad001000000011$ $000001$ $x$ 对应的逻辑地址。

$x$ 对应的逻辑地址应该在哪一个页面：

$1KB=2^{10}B$ $12bit$ 的逻辑地址来说，可以用后十位表示页内地址，前两位表示在哪个页面中存储(上图只有四个页面)。
$x:001000000011$ $00$ $0$ $0$ $2$ $x$ $0$ $+$ $x$ 的页内地址 $x$ $000000000010\quad1000000011$

如果采用这种页式存储方式，作为程序员只能给出变量的逻辑地址，而操作系统会负责将这个逻辑地址映射为与之对应的物理地址。其核心就是要记录逻辑页号到主存块号的关系。基于这种关系，操作系统会建立一张"页表"。这个页表是一张数据结构。

$x:001000000011$ $00$ $0$ $0$ $2$ $+x$ $x$ 的物理地址。

页表中相关的数据是存放在主存中的。所以，CPU在进行地址转换的时候需要查询页表，就意味着CPU需要进行一次访存操作。另外上面页表中的每行成为"页表项"。

$x:001000000011$ 变换详细过程如下：

$逻辑页号+页内地址$ 两个部分。

首先CPU会将逻辑地址拆分为页号和页内地址两个部分。
$1058$ $1058$ $4B$ $1062$ 。
$x$ $0$ $0$ $2$ 的位置。
之后CPU会将这个主存块号和页内地址进行拼接，拼接之后的地址就是物理地址。
最后根据这个物理地址访问主存。根据之前所学的知识可以知道当要访问主存某一个物理地址时，无论是读写哪个操作CPU都会优先去Cache中查找能否命中所要访问的数据。如果Cache命中能找到则直接读取或写入数据。如果Cache缓存未命中CPU就到主存中找。

8.2 快表

$0$ $0$ $0$ 号页表对应页表项放入一个更高速的存储器中，这样就可以加快地址变换的速度。基于这种思想可以引入一个类似于Cache硬件：快表(TLB)。

引入快表之后原来主存中存放的信息就可以称为慢表。引入快表之后CPU访问过程如下：

首先仍会将逻辑地址拆分。之后会现在快表中尝试找这个页号对应的主存块号。由于开始时候快表是空的，所以没有命中，CPU会查询慢表。
$0$ 号页对应的页表项放入块表。
如果之后访问快表可以命中，则CPU会直接进行地址拼接得到物理地址。

注意不要把Cache和快表混淆。Cache中存储的是主存中某一块数据。快表中存储的是慢表中某一个页表项。引入快表就是为了让逻辑地址转换为物理地址更快。所以快表是在地址变换过程起到变快作用，而Cache是在地址访问时候起到加速作用。

之所以CPU访问快表更快是因为快表使用SRAM，而慢表使用DRAM。并且快表是一种相联存储器，即可以按内容进行访问。而快表会遇到与Cache相同的问题，可以参照Cache解决办法。

9. 虚拟存储器

$L_1,L_2$ 等多级Cache。而虚拟存储系统也是这样的多级结构。

一个应用程序只需要将部分内容调入内存，就能正常运行。其余部分等用到该功能时才会调入主存。这就是虚拟存储器。虚拟存储器本质将辅存数据调入内存，与之前内存中数据调入Cache类似。

9.1 页式虚拟存储器

与之前一样将程序分页，对于这个程序，会先将用得到的数据调入主存就能正常使用。

上图中对页表进行改造：

有效位
$1$ $0$ $0,1$ $2,3$ $2$ 号页数据，需要将辅存中的数据调入主存。
外存块号
$2$ $c$ $c$ 位置的数据调入主存。
访问位
$FIFO,LRU$ 这种策略。
所以访问位可以记录当前页面被访问多少次。如果采用LFU策略，当主存满的时，可以根据访问位最少的值进行替换。
脏位
$1$ ，当这个块被替换时候，需要将这一块内容写回辅存。

可以看出主存与辅存之间的页面管理策略与主存与Cache的很多管理都类似。

页式虚拟存储器结构图：

逻辑页号也有虚页号，CPU会根据指令中的虚页号查找页表中对应的表项，再根据页表项进行对应位置的读写操作。

9.2 其他虚拟存储器

段式虚拟存储器
段式虚拟存储器：是按照程序的功能模块拆分
$4KB$ $0$ $1$ $2$ 段是变量。操作系统会以段为单位决定要把哪一段调入主存。
这种拆分方式是按照程序的功能模块拆分，所以每一段的大小可能不一样。
由于每一段大小不一样，所以段表要增加段长这一项。另外主存也不会进行分块。每一段都会随机存储到主存任意一个位置。因此我们需要记录每一段在内存中的段首地址。
段页式虚拟存储器
把程序按逻辑结构分段，每段再划分为固定大小的页。同时主存空间也划分为大小相等的页。
程序对主存的调入、调出仍以页为基本传送单位。
每个程序对应一个段表，每段对应一个页表。
$+$ $+$ 页内地址

本节具体内容会在操作系统中学习，是重点。

一. 计算机习题概述

1.计算机硬件的基本组成

1.1 冯诺依曼结构

1.2 现代计算机结构

2.各个硬件功能概况

2.1 主存储器

2.2 运算器

2.3 控制器

2.4 计算机层次结构

3. 计算机的性能指标

3.1 存储器的性能指标

3.2 CPU的性能指标

3.3 系统整体性能指标

3.4 总结

二. 数据的表示与运算

1. 进位计数制

1.1 rr进制转化为十进制

1.2 二进制转化为八进制和十六进制

1.3 十进制转化任意进制

1.4 真值和机器数

2. BCD码

2.1 8421码

2.2 其他码

3. 无符号整数的表示和运算

4. 带符号整数在计算机中应用

4.1 原码表示法

4.2 原码计算方式

4.3 移码

4.4 原码、补码、反码和无符号整数特性

4.5 定点小数表示和运算

4.6 奇偶校验码

5. 字符与字符串

6. 算术逻辑单元

6.1 最基本的逻辑运算

6.2 复合逻辑运算

逻辑运算实现偶校验位

逻辑运算实现一位全加器

6.3 并行加法器优化

7. 补码加减运算器

7.1 补码加法器原理

7.2 标志位的生成

7.3 加减运算和溢出判断

8. 移位运算

8.1 算数移位

8.2 反码算数移位

8.3 补码算数移位

8.4 逻辑移位

8.5 循环移位

9. 原码与补码的运算

9.1 乘法运算

原码乘法运算

补码乘法运算

9.2 除法运算

原码的除法

补码的除法

9.3 C语言强制类型转换

10. 数据的存储与排列

10.1 大小端存储

10.2 边界对齐

11. 浮点数表示与运算

11.1 浮点数表示

11.2 浮点数尾数规格化

11.3 浮点数标准IEEE 754

11.4 浮点数运算

11.5 浮点数强制类型转换

三. 存储系统

1. 主存储器基本组成

1.1 存储芯片基本原理

1.2 寻址方式实现

2. SRAM和DRAM

2.1 SRAM和DRAM区别

2.2 DRAM的刷新

2.3 DRAM地址线复用技术

3. ROM

3. 主存优化

3.1 双端口RAM

3.2 多体并行存储器

3.3 单体多字存储器

4. 主存储器与CPU连接

4.1 位扩展

$r$ 进制转化为十进制