X86汇编学习札记-0001-预备知识
写在开始之前
内容基本上都总结于《汇编语言:基于X86处理器》,因为本人最近在学习这本书,所以顺便将自己学到的摘抄下来做个札记
(也会有少部分内容来自其他大佬的博客啥的,不过都是本蒟蒻自己总结出来的版本)
(不定期会更新一些小内容,最新更新日期:2020.5.6)
虚拟机模型
绪论
我们都知道,计算机可以直接执行由其原生机器的机器语言所编写的程序,这种语言当中的每一条指令都可以使用相对少量的电子电路来执行,为了方便我们下文就称作L0吧
由于L0都是使用纯数字的机器码进行编写的缘故,使用L0就变得极其困难,早期的计算机科学家们便想到开发一种更为简洁的语言L1以编写程序
但是机器依然是“在L0上跑的”,我们使用L1编写的程序最终依然要转为L0,那么我们有两种方法:
一、解释(Interpretation)
在运行L1程序时,每一条L1指令都由一个专门的L0编写的程序进行译码和执行,此时L1程序是可以立即启动的,但是需要在执行之前对每一条L1指令进行译码
二、翻译(Translation)
由一个专门设计的程序将编写好的L1程序转换为L0程序,之后这个新程序便可以直接运行
翻译其实就是编译->构建的一个过程
由此也分出了两种类型的编程语言:脚本语言与静态语言,对应解释与翻译
基本概念
对于上面的说法,我们可以将每一层都想象成有一台虚拟机(virtual machine)在运作着,这台虚拟机可以由硬件构成也可以由软件构成
比如说对于上面的L0-L1模型,我们可以认为有着一台虚拟机VM1,可以执行L1语言编写的指令,相对的其底层也存在着一个VM0:
| Virtual Machine 1 |
|---|
| Virtual Machine 0 |
我们可以为VM1编写L1语言程序,若是VM1能够作为真实计算机予以实现,程序便可以直接运行,否则就解释/翻译成L0语言程序在VM0上执行
要使解释/翻译耗时不会太长,VM0与VM1的差距便不应太大,若是依此开发的L1用起来依然十分麻烦,我们可以在VM1上再设计一层虚拟机VM2…直到VMn时我们便能使用足够方便、功能足够强大的语言Ln编写程序
例如用JAVA写的程序便是跑在虚拟机JVM上的,而JVM已经能在很多计算机上实现了
豆知识:《汇编语言:基于X86处理器里》的虚拟机的英文是virtual machine machine,即虚拟??(大误)
现实状况
运行在计算机最底层的便是我们常说的数字逻辑硬件了,即计算机当中真实存在着的物质的集合
其上一层便是指令集架构(Instruction Set Architecture),这也是我们所能进行编程的第一个层次,虽然使用的是只有二进制数值的机器语言
汇编语言又在更上一层,使用短助记符,可以看作是将机器语言“直接翻译成可读文本”,这种语言十分易于通过ISA层里提供的翻译层转换到ISA层
高级语言则毫无疑问在汇编语言的更上一层,通常以一对多的原则将一条指令翻译成多条汇编语言指令
如:
int x = ( y + 4 ) * 3;
这样一条简单的语句转换为汇编语言后是下面这样的:
mov eax,y
add eax,4
mov ebx,3
imul ebx
mox x,eax
层次结构如下:
| 高级语言 |
|---|
| 汇编语言 |
| 指令集架构 |
| 数字逻辑硬件 |
补码
我们都知道在计算机当中所有的数据都是以二进制的形式储存的,对于有符号整型而言通常其最高有效位(Max Significant Bit, 即MSB, 相对应的是Least Significant Bit)用以表示符号位,0为正数,1为负数
正数我们都知道很好表示,直接以二进制形式储存便可,那么负数呢?
通常在计算机中负数使用补码表示,即其正数的加法逆元(即常说的相反数)
将一个二进制数按位取反后再加上一,便得到了他的补码
有了补码表示法,处理器便不需要两套独立的电路来处理四则运算(其实本质上只有一则)
例如一个8位二进制数0000 0001(2),即十进制数1(10)
它的相反数为-1(10)
我们将0000 0001(2)按位取反,得到1111 1110(2)
再加上1,便成了1111 1111(2)
这便是补码表示的-1(10)
虽然说数据储存方式一共有三种,但是现代计算机当中数据基本以补码方式进行储存
32位X86处理器架构&计算机组件
基本架构
一台微型计算机的基本架构通常如下图:

一、CPU(Central Processing Unit)
CPU即中央处理单元,是计算机进行算术与逻辑运算的核心部件
CPU内包含的内容如下:

1、寄存器(Register)
寄存器直接位于CPU的内部,是一种高速存储位置,其访问速度远远高于任何传统存储器(包括cache),可以类比为“最高速的内存”。因此当一个程序为了速度需要进行优化时,常常选择把某些数据储存在寄存器当中(如:循环的计数)。
寄存器由于其位置的特殊性,数量稀少,某种程度而言是计算机内的“稀缺资源”
PS:C语言当中有一个关键字叫register,用以申请将变量储存在寄存器当中,不过一般都是失败…
(1)基本程序执行寄存器(Basic Program Execution Registers)
32位x86处理器当中的基本程序执行寄存器包括:8个通用寄存器,6个段寄存器,1个处理器状态标志寄存器(EFLAGS),1个指令指针寄存器(EIP)
I.通用寄存器
通用寄存器主要用于算术运算与数据传输,在8086处理器中一共有四个32位的通用寄存器,其可供访问的16位组成部分为:4个数据寄存器、2个指针寄存器与2个变址寄存器
为什么我们又说16位又说32位呢,因为实际上一个32位的寄存器可以看作由两个16的寄存器构成的,同样的一个16位的寄存器也可以看作是由两个8位寄存器构成的,例如我们在访问32位寄存器EAX时,可以通过名称AX访问其低16位,也可以通过AH&AL访问AX的高&低16位

下表给出四个32位的数据寄存器寄存器的构成:
指针寄存器与变址寄存器只能使用32位或16位名称进行访问,如下表:
以下给出八个常用的16位“寄存器”的相关数据:
1).数据寄存器:AX、BX、CX、DX
AX(accumulator):
AX寄存器即为累加寄存器,常用于数据的运算,也是我们在使用汇编语言当中所调用的最为频繁的寄存器
作为16位寄存器,毫无疑问,它可以储存16位的数据,但是实际上AX是由两个8位的寄存器:AH&AL组成的,因而它也可以储存两个8位的数据。其中:AH为高8位寄存器,AL为低8位寄存器
AX寄存器也是所有I/O指令与外界设备进行数据传输的通道
乘除指令默认使用EAX,因此它常被称为扩展累加(extended accumulator)寄存器
BX(base):
BX寄存器即基址寄存器,常被用于地址索引,其中所储存的数据一般被作为偏移地址(Offset Address)来使用,用于寻址
什么是偏移地址?偏移地址又被称为偏移量,顾名思义就是相对于一个“主地址”的偏移位置,这个“主地址”我们称之为段首地址(段地址)
什么是段地址?计算机在对内存进行访问之前,要先对内存进行分段(Memory segmentation,一种内存管理技术,将内存电脑的主内存分为多个段),而段地址是针对内存的分段而言的。每一段的段首地址被定义为段地址。段地址的存在是由系统的分段存储决定的,通过段地址和偏移地址就能对数据进行寻访
段地址常被储存在段寄存器当中,我们将在下文对其进行讲解
有了段地址和偏移地址,我们便可以计算出内存实际的物理地址:
当系统需要产生一个20位地址的时候,一个段寄存器会自动被选择。且自动左移4位再与一个16位地址偏移量相加产生所需的20位地址
(来自:张怀莲.《IBM PC(INTEL 8086/8088)宏汇编语言程序设计》)
在以前,电脑的寄存器都是十六位的,寻址空间是二十位的(内存1MB),所以单用一个寄存器无法寻址到所有地址,因此用两个寄存器或一个寄存器加一个立即数,用cs,ds,ss,es等以s结尾的寄存器作为段寄存器,用一个寄存器或立即数做偏移量,因为两个十六位寄存器加起来是三十二位,比数据总线位数宽,所以分段寻址采用了如下的寻址方式:段寄存器×10H(十六进制)+偏移量,这样所计算出来的就是一个二十位的数据,就可以寻址到所有地址,其中段寄存器×10H(十六进制)所得到的地址就是段的基址,所以基址都是以00(十六进制)结尾的。而现在的寄存器都是64位的,寻址可达192G,而通常电脑内存是没有大于192G的,所以就不用分段,用一个寄存器就可以寻址全部地址了。所以现在电脑的段寄存器都用来有其他的用途
(百度百科:基址)
其实也可以类比C语言当中的指针运算:
比如说:
int *temp=(int*)malloc(10*sizeof(int));
我们利用这个语句分配了十个大小为一个int(通常是2字节)的连续的内存空间,并将第一块内存空间的地址储存在指针temp当中
那么当我们想要使用所分配的内存空间当中的第三块内存时该怎么办呢
我们可以使用:
temp+2
表示第三块内存的地址
那么实际上这个temp就是“段首地址”,2就是“偏移量”
(PS:C语言当中数组的变量名称本质上也是指向数组内存空间首地址的指针,那么int a[10]之后再a+2其实也是一样的效果)
同样的,作为通用数据寄存器,BX理论上同样可以储存常规的数据
与AX相同,我们使用BH可以访问BX的高8位,BL访问其低8位
CX(count):
CX寄存器即计数寄存器,顾名思义,这个寄存器在CPU当中起到的是一个计数器的功能,例如对汇编语言中的LOOP循环指令进行计数、在移位指令与串处理指令中用作隐含的计数器等
CPU默认使用ECX作为循环计数器
DX(data):
DX寄存器即数据寄存器,常用于进行数据的传递
一般在作双字长运算时把DX和AX组合在一起存放一个双字长数,DX用来存放高位数
对于某些I/O操作,DX还可用来存放I/O的端口地址
作为通用数据寄存器,AX、BX、CX、DX其实都可以用作数据的运算:存放操作数、运算结果、运算中间结果
2).指针寄存器:SP、BP、FP
SP(stack pointer):
SP即堆栈指针寄存器,在堆栈操作(PUSH&POP)中使用,PUSH&POP从SP当中得到相应的偏移量
堆栈指针始终指向栈顶元素
EXTRA:为什么说ESP始终指向栈顶?
在我们运行程序时往往会为变量分配栈空间,此时ESP被设置为指向当前的栈顶
同时,我们都知道(?),在汇编语言当中对栈有两种操作的指令:push和pop
说明push和pop是一对反义词
在执行push指令将一个元素压入栈中后,ESP的值便会自动的减少,相对的,使用POP指令弹出栈中元素时ESP的值也会随着自动增加
所以像有的憨批在PUSH&POP以后手动SUB&ADDESP的值最后导致程序崩溃的事情我们可不能学
由于ESP常用于寻址堆栈数据,因而极少被用于一般算术运算和数据传输,通常被称作扩展堆栈指针(extended stack pointer)寄存器
SP与SS段寄存器相互搭配可以得到栈顶元素的地址,在后文会讲到
BP(base pointer):
BP即基址指针寄存器,用于存放堆栈时的基址,由于SP(ESP)随时会发生改变,因而BP被用于对堆栈进行访问
比如说我在AMD64机子上写了这样的一段代码:
int main(void)
{
int a=1,b=2,c=3;
char ch[4]="BIG";
......
然后我们使用IDA进行反汇编,看看它所生成的汇编代码
这段汇编代码做了什么?想必不用我多说了⑧
我们可以使用gdb调试器来动态查看这个过程
可以看到,rbp当中储存的值与rsp当中储存的值是完全不同的
由于rsp需要被动态使用,计算机选择使用rbp来代替rsp对栈进行访问,为了保证执行结束之后rbp的值不会发生改变,rbp的值首先被压入栈中(rbp为AMD64下的基址指针寄存器,同bp)
(其他内容) 我是一个栈 RBP原本储存的值 <-RSP
随后RSP当中所储存的地址被赋给了RBP,此时RBP与RSP指向同一个位置
(其他内容) 我是一个栈 RBP原本储存的值 <-RSP<-RBP 在下图中我们可以看到,rbp当中的值变成了和rps当中一样的值
rbp已经变成了rsp的形状
由于我们定义了三个整型变量,占3*4个字节,又定义了一个字符数组,占4*1个字节,总共是16个字节
于是我们需要在栈当中开辟16个字节的空间,再加上一些【预留的空间】,RSP总计向低地址移动48个字节的位置(30h中的H后缀表示这是一个十六进制数)
在结束赋值之后,rsp又指回原地址,并将栈中储存着的rbp原值弹出
可以看到,rbp中储存的值又变回了原来的值
此时指向0x7ffff7ae3bbb的便又只剩下了rsp
对于编译器而言,EBP承担了对堆栈基址访问的重任,高级语言通过EBP来引用堆栈中的函数参数与局部变量
EBP通常不用于一般算术运算与数据传输,通常也被称为扩展帧指针(extended frame pointer)寄存器
扩展阅读:FP(frame pointer):
栈帧指针寄存器
为了访问函数局部变量,必须能定位每个变量。局部变量相对于堆栈指针ESP的位置在进入函数时就已确定,理论上变量可用ESP加偏移量来引用,但ESP会在函数执行期随变量的压栈和出栈而变动。尽管某些情况下编译器能跟踪栈中的变量操作以修正偏移量,但要引入可观的管理开销。而且在有些机器上(如Intel处理器),用ESP加偏移量来访问一个变量需要多条指令才能实现。
因此,许多编译器使用帧指针寄存器FP(Frame Pointer)记录栈帧基地址。局部变量和函数参数都可通过帧指针引用,因为它们到FP的距离不会受到压栈和出栈操作的影响。有些资料将帧指针称作局部基指针(LB-local base pointer)。
在Intel CPU中,寄存器BP(EBP)用作帧指针。在Motorola CPU中,除A7(堆栈指针SP)外的任何地址寄存器都可用作FP。当堆栈向下(低地址)增长时,以FP地址为基准,函数参数的偏移量是正值,而局部变量的偏移量是负值。
C语言函数调用栈(一)
后面慢慢讲FP,先在这里占个位置…(咕咕咕)
3).变址寄存器:SI、DI
变址寄存器主要用于存放存储单元在段内的偏移量,用它们可实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便
ESI和EDI也被用于高速存储器的指令传输,有时也被称为扩展源变址(extended source index)寄存器和扩展目的变址(extended destination index)寄存器
SI(source index):
SI即源变址寄存器,用于存放相对于DS段(后文说明,下同)的源变址指针
什么是源变址指针?这个涉及到计算机寻址方式之一的相对基址变址寻址,就不在本篇的讨论范围内了…
DI(destination index)
DI即目的变址寄存器,用于存放相对于ES段的目的变址指针
II.段寄存器
段寄存器,顾名思义,就是用来储存段地址的
段寄存器是因为对内存的分段管理而设置的,计算机将内存进行分段以供给不同的程序进行使用
在实地址模式当中,16位的寄存器表示的是预先分配的内存区域的基址,这个内存区域便被称之为【段】
在保护模式当中,段寄存器中存放的是段描述符表(GDT+LDT)指针
一部分段当中存放的是程序指令,其他段则用于存放变量(数据),还有一个堆栈段存放局部函数变量与函数参数
16位的8086CPU有四个16位段寄存器,所以,其程序可同时访问四个不同含义的段:
1)CS(code segment):
CS即代码段寄存器,存放当前正在运行的程序代码所在段的段基址,表示当前使用的指令代码可以从该段寄存器指定的存储器段中取得,相应的偏移量则由IP(指令指针寄存器)提供
任意时刻,8086CPU都会将CS:IP指向的指令作为下一条需要取出执行的指令,即不断地从CS:IP中取出要执行的指令,在执行可执行文件的过程当中,IP不断进行改变,CS基本不变
2)SS(stack segment):
SS即堆栈段寄存器,用于存放当前堆栈的底部地址,即存放堆栈段的段基址
堆栈的段基址存放在SS当中,而堆栈的偏移地址存放在SP当中,即SS:SP指向的便是栈顶元素的地址
3)DS(data segment):
DS即数据段寄存器,存放当前程序使用的数据所存放段的最低地址,即存放数据段的段基址
注意:X86CPU并不会保证我们的操作是否会越界
4)ES(extra segment):
ES即附加段寄存器,存放当前程序使用附加数据段的段基址,该段是串操作指令中目的串所在的段
DS和ES其实没有太大的区别

III.指令指针寄存器IP(Instruction Pointer)
IP即指令指针寄存器,用来存放指令指针相对于基址(存放在CS当中)的偏移量,一般情况下每当CPU从CS:IP当中读取一条指令后,IP便会自动加一,使CS:IP指向存放下一条指令的内存地址
还是拿这张图来做例子,当我要开始执行main函数当中的内容时,RIP被指向0x555555555125,即main函数的地址
IP实际上是指令机器码存放内存单元的地址指针,IP的内容可以被转移类指令(如JMP)强迫改写,以改变程序执行的顺序
IP无法被直接访问,但是可以通过一些指令(如jmp)进行间接的改写
同样的,指令指针寄存器其实是EIP,我们使用IP表示其低16位
EXTRA:计算机如何执行一条指令?
可以简单地用下面的伪代码来表示:
while(true)
{
buffer=cs+ip;
ip+=instruction.length;
execute(buffer);
}
IV.EFLAGS 寄存器
EFLAGS寄存器(又称Flags)即标志位寄存器,当中包含了独特的二进制位,用于控制CPU的操作,或者是表示CPU操作的结果
标志位寄存器当中的数据是按位使用的,而并非如同其他寄存器一样按整体使用,即EFLAGS寄存器当中每一个位表示的都是一个不同的状态,当一个标志位被设置时其值为1,清楚或重置时其值为0,因此有的时候我们也将EFLAGS当中储存的信息叫做程序状态字(Program Status Word)
部分指令可以测试与控制这些单独的处理器标志位
低16位FLAG当中储存的标志位示意如下图:

1)控制标志位
顾名思义,控制标志位用于控制CPU的操作,程序可以通过设置EFLAGS寄存器当中的单独位来控制CPU的操作,通常包括如下位:
中断标志位(Interrupt Flag):
当IF位为1时,允许CPU响应可屏蔽中断请求,否则关闭中断
这里不做过多解析,涉及到单片机原理的相关技术(其实我也不懂…
方向标志位(Direction Flag):
当该位置为1时(DF=1),存储器地址自动减少,串操作指令为自动减量指令,即从高位到低位处理字符串
当该位置为0时(DF=0),存储器地址自动增加,串操作指令为自动增量指令,即从低位到高位处理字符串
跟踪标志位(Trace Flag):
当TF被设置为1时,CPU进入单步模式,在每执行一步指令后都产生一个单步中断,主要用于程序的调试
在8086CPU中没有专门用来置位和清零TF的命令,需要用其他办法
2)状态标志位
状态标志位用以储存CPU执行算术与逻辑操作的结果,通常包括如下位:
进位标志位(Carry Flag):
当两个数相加时,若最高位向上形成进位,则CF=1
当两个数相减时,若最高位向上形成借位,则CF=1
当两个无符号数相乘时,若乘积的高一半为0,则CF=0
当两个带符号数相乘时,若乘积的高一半是低一半的符号扩展,则CF=0
与目标位置相比,无符号算术运算结果太大时也会设置该标志位
溢出标志位(Overflow Flag):
有符号算术运算结果太大或太小(即发生溢出)时设置该标志位
符号标志位(Sign Flag):
算术或逻辑操作产生的结果为负值时设置该标志位
零标志位(Zero Flag):
算术或逻辑操作产生的结果为0时设置该标志位
辅助进位标志位(Auxiliary carry Flag):
在8位操作数当中产生了3位向4位的进/借位时设置该标志位
奇偶校验标志位(Parity Flag):
运算结果的最低有效字节包含偶数个1时设置该标志位,否则清除该标志位
在数据有可能被修改或损坏的情况下,该标志位也被用于进行错误检测
(2)MMX寄存器
MMX 是MultiMedia eXtensions(多媒体扩展)的缩写,是第六代CPU芯片的重要特点。MMX技术是在CPU中加入了特地为视频信号(Video Signal),音频信号(Audio Signal)以及图像处理(Graphical Manipulation)而设计的57条指令,因此,MMX CPU极大地提高了电脑的多媒体(如立体声、视频、三维动画等)处理功能。
(百度百科:MMX)
8个64位的MMX寄存器极大的提高了intel CPU在实现高级多媒体与通信应用的性能
MMX寄存器同时也支持SIMD指令
(3)XMM寄存器
XMM寄存器恐怕是位数最宽的寄存器(128位),在x86结构当中一共有8个XMM寄存器,被用于SIMD流扩展指令集
(4)浮点单元(FPU)
浮点单元(floating-point unit)用于执行高速浮点算术运算,自486处理器后FPU已被集成到主处理器芯片上
FPU当中一共有八个80位的浮点数据寄存器,两个48位的指针寄存器,三个16位的控制寄存器,以及一个操作码寄存器,如下图:

关于浮点数运算的原理便不在此进行过多阐述(因为本弱鸡也不懂…
2、高速存储器(Cache)
(1)定义:什么是cache?
Cache存储器:电脑中为高速缓冲存储器,是位于CPU和主存储器DRAM(Dynamic Random Access Memory)之间,规模较小,但速度很高的存储器,通常由SRAM(Static Random Access Memory 静态存储器)组成。它是位于CPU与内存间的一种容量较小但速度很高的存储器。CPU的速度远高于内存,当CPU直接从内存中存取数据时要等待一定时间周期,而Cache则可以保存CPU刚用过或循环使用的一部分数据,如果CPU需要再次使用该部分数据时可从Cache中直接调用,这样就避免了重复存取数据,减少了CPU的等待时间,因而提高了系统的效率。Cache又分为L1Cache(一级缓存)和L2Cache(二级缓存),L1Cache主要是集成在CPU内部,而L2Cache集成在主板上或是CPU上。
(百度百科:CACHE存储器)
由于从内存当中读取数据的过程十分漫长(至少比寄存器慢的要太多了),而绝大多数程序都需要对各种变量进行访问,因此早期的CPU设计者们选择——将大部分近期使用过的指令与数据存放在cache当中,cache保存这些值使其能被快速访问到
当处理器在cache当中发现想要发现的数据,则成为cache hit,反之称为cache miss
cache由一种被称为静态(static)RAM的特殊存储器芯片构成,价格高昂,但是不需要像传统存储器使用的动态(dynamic)RAM那样保持不断刷新
(2)cache的类型:
X86系列中有两种cache:
I.一级缓存(L1Cache)
L1Cache内置在CPU当中,与CPU一同运行,L1Cache越大CPU的运行效率越高
因为材料贵+结构限制,一般也不会特别大…
II.二级缓存(L2Cache)
L2Cache为介于一级缓存和内存之间的存储器,其容量较大于一级缓存、远小于内存,主要用来协调一级缓存于内存之间的速率差
3、时钟(Clock)
时钟的作用是对CPU内部操作与系统其他组件进行同步
与CPU和系统总线相关的每一个操作都由一个速率恒定的内部时钟脉冲进行同步
机器指令的基本时间单位是机器周期(machine cycle),又称作时钟周期(clock cycle),一个时钟周期的时长为一个完整时钟脉冲所需的时间
时钟速度通常用每秒震荡数进行衡量,由简单的数学运算我们可以得知时钟周期的持续时间则为时钟速度的倒数
例如1GHz的时钟每秒震荡数变为10亿次,其时钟周期为1纳秒
执行一条指令至少需要一个时钟周期,部分指令可达数十个时钟周期
由于CPU、系统总线、内存电路之间存在速度差异,因此有的时候会需要用到空时间周期,也被称为等待状态(wait states)
4、控制单元(Control Unit)
控制单元负责程序的流程管理,用于协调参与机器指令执行的步骤序列
CU通常由指令寄存器IR(Instruction Register)、指令译码器ID(Instruction Decoder)和操作控制器OC(Operation Controller)三个部件组成
控制单元可以作为CPU的一部分,也可以安装于CPU外部
5、算术逻辑单元(Arithmetic Logic Unit)
算术逻辑单元是计算机当中用以执行算术运算与逻辑运算的组件,同时也是所有CPU的核心组成部分
ALU主要由与门与或门组成,进行二位元单的算术运算,大部分ALU都可以独立完成整数运算、位逻辑运算与移位运算
二、总线(Bus)
总线即计算机各部件之间的一组用于进行数据传输的并行线
总线的带宽(即单位时间内可以传输的总数据数)为:总线带宽 = 频率×宽度(Bytes/sec)
豆知识:总线之所以被叫做bus是因为他就如同公交车一般在各组件之间来回不断地搬运数据
一个计算机系统通常包含四类总线:
1、数据总线(Data Bus)
在CPU与内存之间传输指令和数据的总线
2、I/O总线(Input/Output Bus)
在CPU与系统输入/输出设备之间传输数据的总线
3、控制总线(Control Bus)
控制总线主要用来传送控制信号和时序信号。控制信号中,有的是微处理器送往存储器和输入输出设备接口电路的,比如:读/写信号、片选信号、中断响应信号等;也有是其它部件反馈给CPU的,比如:中断申请信号、复位信号、总线请求信号、设备就绪信号等。因此,控制总线的传送方向由具体控制信号而定,一般是双向的,控制总线的位数要根据系统的实际控制需要而定。实际上控制总线的具体情况主要取决于CPU
(百度百科:控制总线)
控制总线使用二进制信号对所余连接在总线上设备的行为进行同步
4、地址总线(Adress Bus)
地址总线用于保存指令与数据的地址
三、操作模式
1、保护模式(Protected Mode)
保护模式为当今处理器的原生状态,是一种80286系列和之后的x86兼容CPU操作模式
处在保护模式下的CPU,所有的指令与特性都是可用的
分配给程序的独立内存区域被称之为段,且处理器会阻止程序使用自身段范围之外的内存
CPU启动保护模式后,程序运行在虚拟地址空间中,保护模式下所有的地址都是虚拟地址
大部分的现今x86 操作系统都在保护模式下运行,包含 Linux、FreeBSD、以及 微软 Windows 2.0 和之后版本
EXTRA.01:虚拟8086模式(Virtual-8086 Mode)
虚拟8086模式其实是基于保护模式之下的一种特殊的模式,在保护模式下处理器可以安全地执行实地址模式的软件
虚拟8086模式主要是为了在保护模式下兼容以前的实模式应用,即可支持多任务, 但每个任务都是实模式的工作方式
2、实(时)模式(Real-Time Mode)
实时模式简称实模式,在CPU复位(reset)或加电(power on)的时候以实模式启动,处理器以实模式工作
通俗的讲就是刚开机的那一段时间CPU处在实模式之下,以向前兼容老式的系统
在实模式下,内存寻址方式和8086相同,由16位段寄存器的内容乘以16(10H)当做段基地址,加上16位偏移地址形成20位的物理地址,最大寻址空间1MB,最大分段64KB。可以使用32位指令。32位的x86 CPU用做高速的8086
在实模式下,所有的段都是可以读、写和可执行的,实模式下所有的地址都是真实的物理地址
EXTRA.01:实地址模式(Real-Adress Mode)
咕咕咕,鸽了,因为我也不懂和实时模式的区别,以后有时间再补上
3、系统管理模式(System Management Mode)
SMM向操作系统提供了诸如实现电池管理、系统安全等功能的机制,这里便不再详细展开讲解(因为我也没整明白…)
计算机其他组件
一、主板
主板是什么想必大家都清楚,作为一个集成了CPU、支持处理器(芯片组)、主存、输入输出接口、电源接口和扩展插槽的屏幕电路板,毫无疑问,他可以说是PC机的心脏
在主板上的各组件通过总线进行互联互通,其中比较重要的组件如下:
1、PCI&PCI Express总线架构
PCI(Peripheral Component Interconnect)即外部设备互联标准,是目前个人电脑使用的最为广泛的接口,在所有的主板上都带有这种类型接口的插槽
PCI总线为CPU与系统的其他设备(硬盘驱动器、网卡、显卡、内存、声卡等)提供了连接桥
PCI Express(PCI-E)是一种高速串行计算机总线,他在设备、内存、处理器之间提供了双向串行连接与点对点串行连接,每个设备都有自己的专用连接,不需要向整个总线请求带宽,这样便可以提供给设备极高的带宽与传统PCI所不能及的速度
2、主板芯片组(Motherboard Chipest)
主板芯片组是一组处理器芯片的集合,是主板的核心组成部分,通常被设计为在特定类型的主板上一起工作,是CPU与周边设备间通信的桥梁
下图为Intel 965 Express芯片组的框图:

3、内存(Memory)
内存是什么就不用我多说了⑧
内存又称为主存,是计算机当中十分重要的一个组件,计算机当中所有的程序都是在内存当中运行的
基于intel的系统使用的是以下几种基础内存:
1)只读存储器(Read Only Memory)
ROM内的数据永久烧录在芯片上,且不能擦除(那 就 物 理 擦 除 ),一般是在装机前写好的,且断电后数据也不会丢失
2)可擦除可编程只读存储器(Erasable Programmable Read Only Memory)
EPROM和传统的ROM不同,他可以使用紫外线进行擦除并重新进行编程
3)动态随机存取存储器(Dynamic Random-Access Memory)
DRAM就是我们常说的内存,在程序运行时保存其数据,虽然造价便宜但是需要每毫秒进行刷新以避免内容丢失
部分系统使用的是ECC存储器
4)静态随机存取存储器(Static Random-Access Memory)
SRAM与DRAM所不同的一点是它不需要担心因为不刷新而造成数据丢失的问题,但是他与DRAM一样在断电后便会丢失数据
5)图像随机存储器(Video Random-Access Memory)
VRAM是显存的一种形式,作为影像绘图卡、显卡所使用的DRAM(内存),属于双埠随机存取内存,可让RAMDAC与影像处理同时存取
6)互补金属氧化物半导体(Complementary Metal Oxide Semiconductor)RAM
CMOS RAM一般在系统主板上用于储存系统的设置信息,由主板上的电池进行供电,BIOS也储存在里面
所以也有人通过取出主板电池对BIOS等进行物理破解
二、输入输出系统(Input Output System)
输入输出系统是计算机系统中的主机与外部进行通信的系统。它由外围设备和输入输出控制系统两部分组成,是计算机系统的重要组成部分。外围设备包括输入设备、输出设备和磁盘存储器、磁带存储器、光盘存储器等。从某种意义上也可以把磁盘、磁带和光盘等设备看成一种输入输出设备,所以输入输出设备与外围设备这两个名词经常是通用的。在计算机系统中,通常把处理机和主存储器之外的部分称为输入输出系统,输入输出系统的特点是异步性、实时性和设备无关性。
(百度百科:输入输出系统)
没啥好讲的,就不抄录了,咕咕咕
64位X86-64处理器
一、基本特征
64位x86-64处理器有以下特征:
1)向后兼容x86指令集
2)地址长度为48位,虚拟地址空间为264字节,按照当前芯片的实现情况只能使用地址的低48位
3)可以使用64位通用寄存器,允许指令具有64位整数操作数
4)相较于x86,有着8个新的寄存器
5)物理地址为48位,支持高达256TB的RAM
二、64位操作模式
Intel 64架构引入了一个名为IA-32e的新模式,就技术而言其包含两个子模式:
1、兼容模式
兼容模式下现有的16/32位程序通常不需要重新编译就可以直接运行,但是win16&DOS程序都不能在64位Windows下运行
2、64位模式
64位模式是64位Windows的原生模式,在此模式下,处理器执行的是使用64位线性地址空间的应用程序,该模式能使用64位指令操作数
三、基本64位执行环境
1、基本架构
64位Intel CPU包含的寄存器如下,基本功能大体同32位寄存器:
1)16个64位通用寄存器
2)8个80位浮点寄存器
3)1个64位状态标志寄存器RFLAGS(一般只用低32位)
4)8个64位MMX寄存器
5)16个128位XMM寄存器
2、通用寄存器
64位模式下操作数的大小默认是32位,有8个寄存器,在给每条指令加上REX(寄存器扩展)前缀后操作数可以达到64位,可用通用寄存器数量也达到16个:8个32位模式下寄存器+8个有标号寄存器(R8-R15)
访问寄存器需要使用的标号详见下表,功能大体同32位寄存器


记于结束之后
(其实是一些学习的体会…)
汇编的入门需要的知识很多,没有想象当中那么简单,需要看的书也很多…
那就努力⑧












1161

被折叠的 条评论
为什么被折叠?



