0%

8086汇编指令集

一、数据传输指令

它们在存贮器和寄存器、寄存器和输入输出端口之间传送数据.

  1. 通用数据传送指令.

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    MOV     传送字或字节.  
    MOVSX 先符号扩展,再传送.
    MOVZX 先零扩展,再传送.
    PUSH 把字压入堆栈.
    POP 把字弹出堆栈.
    PUSHA 把AX,CX,DX,BX,SP,BP,SI,DI依次压入堆栈.
    POPA 把DI,SI,BP,SP,BX,DX,CX,AX依次弹出堆栈.
    PUSHAD 把EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI依次压入堆栈.
    POPAD 把EDI,ESI,EBP,ESP,EBX,EDX,ECX,EAX依次弹出堆栈.
    BSWAP 交换32位寄存器里字节的顺序
    XCHG 交换字或字节.(至少有一个操作数为寄存器,段寄存器不可作为操作数)
    CMPXCHG 比较并交换操作数.(第二个操作数必须为累加器AL/AX/EAX)
    XADD 先交换再累加.(结果在第一个操作数里)
    XLAT 字节查表转换.----BX指向一张256字节的表的起点,AL为表的索引值(0-255,即0-FFH);
    返回AL为查表结果.([BX+AL]->AL)
  2. 输入输出端口传送指令.

    1
    2
    IN      I/O端口输入. ( 语法: IN   累加器,    {端口号│DX} )  
    OUT I/O端口输出. ( 语法: OUT {端口号│DX},累加器 )输入输出端口由立即方式指定时, 其范围是 0-255; 由寄存器 DX 指定时,其范围是 0-65535.
  3. 目的地址传送指令.

    1
    2
    3
    4
    5
    6
    LEA     装入有效地址.例: LEA DX,string ;把偏移地址存到DX.  
    LDS 传送目标指针,把指针内容装入DS.例: LDS SI,string ;把段地址:偏移地址存到DS:SI.
    LES 传送目标指针,把指针内容装入ES.例: LES DI,string ;把段地址:偏移地址存到ES:DI.
    LFS 传送目标指针,把指针内容装入FS.例: LFS DI,string ;把段地址:偏移地址存到FS:DI.
    LGS 传送目标指针,把指针内容装入GS.例: LGS DI,string ;把段地址:偏移地址存到GS:DI.
    LSS 传送目标指针,把指针内容装入SS.例: LSS DI,string ;把段地址:偏移地址存到SS:DI.
  4. 标志传送指令.

    1
    2
    3
    4
    5
    6
    LAHF    标志寄存器传送,把标志装入AH.  
    SAHF 标志寄存器传送,把AH内容装入标志寄存器.
    PUSHF 标志入栈.
    POPF 标志出栈.
    PUSHD 32位标志入栈.
    POPD 32位标志出栈.

二、算术运算指令

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
ADD     加法.  
ADC 带进位加法.
INC 加 1.
AAA 加法的ASCII码调整.
DAA 加法的十进制调整.
SUB 减法.
SBB 带借位减法.
DEC 减 1.
NEG 求反(以 0 减之).
CMP 比较.(两操作数作减法,仅修改标志位,不回送结果).
AAS 减法的ASCII码调整.
DAS 减法的十进制调整.
MUL 无符号乘法.结果回送AH和AL(字节运算),或DX和AX(字运算),
IMUL 整数乘法.结果回送AH和AL(字节运算),或DX和AX(字运算),
AAM 乘法的ASCII码调整.
DIV 无符号除法.结果回送:商回送AL,余数回送AH, (字节运算);或 商回送AX,余数回送DX, (字运算).
IDIV 整数除法.结果回送:商回送AL,余数回送AH, (字节运算);或 商回送AX,余数回送DX, (字运算).
AAD 除法的ASCII码调整.
CBW 字节转换为字. (把AL中字节的符号扩展到AH中去)
CWD 字转换为双字. (把AX中的字的符号扩展到DX中去)
CWDE 字转换为双字. (把AX中的字符号扩展到EAX中去)
CDQ 双字扩展. (把EAX中的字的符号扩展到EDX中去)

三、逻辑运算指令

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
AND     与运算.  
OR 或运算.
XOR 异或运算.
NOT 取反.
TEST 测试.(两操作数作与运算,仅修改标志位,不回送结果).
SHL 逻辑左移.
SAL 算术左移.(=SHL)
SHR 逻辑右移.
SAR 算术右移.(=SHR)
ROL 循环左移.
ROR 循环右移.
RCL 通过进位的循环左移.
RCR 通过进位的循环右移.
以上八种移位指令,其移位次数可达255次.
移位一次时, 可直接用操作码. 如 SHL AX,1.
移位>1次时, 则由寄存器CL给出移位次数.
如 MOV CL,04 SHL AX,CL

四、串指令

DS:SI 源串段寄存器 :源串变址.
ES:DI 目标串段寄存器:目标串变址.
CX 重复次数计数器.
AL/AX 扫描值.
D标志 0表示重复操作中SI和DI应自动增量; 1表示应自动减量.
Z标志 用来控制扫描或比较操作的结束.

1
2
3
4
5
6
7
8
9
10
MOVS    串传送.( MOVSB 传送字符. MOVSW 传送字. MOVSD 传送双字. )  
CMPS 串比较.( CMPSB 比较字符. CMPSW 比较字. )
SCAS 串扫描.把AL或AX的内容与目标串作比较,比较结果反映在标志位.
LODS 装入串.把源串中的元素(字或字节)逐一装入AL或AX中.( LODSB 传送字符. LODSW 传送字. LODSD 传送双字. )
STOS 保存串.是LODS的逆过程.
REP 当CX/ECX<>0时重复.
REPE/REPZ 当ZF=1或比较结果相等,且CX/ECX<>0时重复.
REPNE/REPNZ 当ZF=0或比较结果不相等,且CX/ECX<>0时重复.
REPC 当CF=1且CX/ECX<>0时重复.
REPNC 当CF=0且CX/ECX<>0时重复.

五、程序转移指令

  1. 无条件转移指令 (长转移)

    1
    2
    3
    JMP         无条件转移指令  
    CALL 过程调用
    RET/RETF 过程返回.
  2. 条件转移指令 (短转移,-128到+127的距离内)( 当且仅当(SF XOR OF)=1时,OP1<OP2 )

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    JA/JNBE     不小于或不等于时转移.  
    JAE/JNB 大于或等于转移.
    JB/JNAE 小于转移.
    JBE/JNA 小于或等于转移.
    以上四条,测试无符号整数运算的结果(标志C和Z).
    JG/JNLE 大于转移.
    JGE/JNL 大于或等于转移.
    JL/JNGE 小于转移.
    JLE/JNG 小于或等于转移.
    以上四条,测试带符号整数运算的结果(标志S,O和Z).
    JE/JZ 等于转移.
    JNE/JNZ 不等于时转移.
    JC 有进位时转移.
    JNC 无进位时转移.
    JNO 不溢出时转移.
    JNP/JPO 奇偶性为奇数时转移.
    JNS 符号位为 "0" 时转移.
    JO 溢出转移.
    JP/JPE 奇偶性为偶数时转移.
    JS 符号位为 "1" 时转移.
  3. 循环控制指令(短转移)

    1
    2
    3
    4
    5
    LOOP            CX不为零时循环.  
    LOOPE/LOOPZ CX不为零且标志Z=1时循环.
    LOOPNE/LOOPNZ CX不为零且标志Z=0时循环.
    JCXZ CX为零时转移.
    JECXZ ECX为零时转移.
  4. 中断指令

    1
    2
    3
    INT         中断指令  
    INTO 溢出中断
    IRET 中断返回
  5. 处理器控制指令

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    HLT         处理器暂停,  直到出现中断或复位信号才继续.  
    WAIT 当芯片引线TEST为高电平时使CPU进入等待状态.
    ESC 转换到外处理器.
    LOCK 封锁总线.
    NOP 空操作.
    STC 置进位标志位.
    CLC 清进位标志位.
    CMC 进位标志取反.
    STD 置方向标志位.
    CLD 清方向标志位.
    STI 置中断允许位.
    CLI 清中断允许位.

六、伪指令

1
2
3
4
5
6
7
DW          定义字(2字节).  
PROC 定义过程.
ENDP 过程结束.
SEGMENT 定义段.
ASSUME 建立段寄存器寻址.
ENDS 段结束.
END 程序结束.

七、处理机控制指令:标志处理指令

1
2
3
4
5
6
7
8
9
10
11
12
CLC     进位位置0指令  
CMC 进位位求反指令
STC 进位位置为1指令
CLD 方向标志置1指令
STD 方向标志位置1指令
CLI 中断标志置0指令
STI 中断标志置1指令
NOP 无操作
HLT 停机
WAIT 等待
ESC 换码
LOCK 封锁

汇编intel与att

汇编有两种语法标准, 分别是intel, att语法

intel语法对应, intel x86_x64体系, x86系列CPU上
att语法对应, gcc objdump 默认格式, 多种CPU上可用(x86, power, VAX)

编译器有

  • gasm: .s文件
  • nasm: .asm文件
  • masm: .asm文件
  • fasm: .asm文件

intel att 区别

https://blog.csdn.net/goodcrony/article/details/92794938 ATT与Intel汇编代码格式

指令名
Intel, 内存操作数前用前缀byte prt, word ptr, dword ptr表大小
ATT, 指令都有字符后缀b, w, l, 表内存操作数的大小

Intel是 mov al, byte ptr foo
AT&T是 movb $foo, %al
movb 传送字节 (1 B = 8 bit)
movw 传送字 (2 B = 16 bit)
movl 传送双字 (4 B = 32 bit)
因为在许多机器上, 32位数都称为长字(long word)

指令顺序
Intel右->左
ATT左->右

Intel是 mov dst, src
ATT是 mov src, dst

寄存器名字, Intel不用前缀%

Intel是 esp
ATT是 %esp

寄存器中值 = 地址

Intel是 dword ptr [ebp+8]
ATT是 8(%ebp)

立即数, Intel不用前缀$
Intel十六, 二进制后缀hb
ATT十六进制立即数前缀0x

十进制数
Intel是 123
ATT是 $123
十六进制数
Intel是 123h
ATT是 $0x123

ATT直接跳转, (跳转目标: 指令内一部分编码)

jmp Label_1

ATT间接跳转, (跳转目标: 寄存器R, 存储器M中的值[代码地址])
‘*’后为操作数

jmp *%eax 寄存器%eax中的值 = 跳转目标
jmp *(%eax) %eax中的值 = 存储器M地址, 存储器M中的值 = 跳转目标

远跳转和远调用

ATT是 ljmp/lcall section,section,offset
Intel是 jmp/call far section:offset

远返回

ATT是 lret $stack-adjust
Intel是 ret far stack-adjust

Intel可多代码段程序
ATT不用多代码段程序, UNIX要求所有代码一个段seg

gasm

已有c文件

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <math.h>
#include <stdio.h>

int main(void) {
const double pi = acos(-1.0);
double r, h, s, v;
printf("radius, height = ");
scanf("%lf%lf", &r, &h);
s = 2.0 * pi * r * (r + h);
v = pi * r * r * h;
printf("面积 = %.2f\n", s);
printf("体积 = %.2f\n", v);
return 0;
}

对应gcc, 通过c文件, 生成s文件

1
2
3
4
5
6
7
8
dassein@pad:~/nasm_pjt$ gcc -E area_2019_sep_24.c > area_2019_sep_24.i
dassein@pad:~/nasm_pjt$ gcc -S area_2019_sep_24.i
dassein@pad:~/nasm_pjt$ gcc -c area_2019_sep_24.s
dassein@pad:~/nasm_pjt$ gcc area_2019_sep_24.o -o area_2019_sep_24
dassein@pad:~/nasm_pjt$ ./area_2019_sep_24
radius, height = 13 14
面积 = 2205.40
体积 = 7433.01

z直接通过c生成可执行文件

1
gcc -c area_2019_sep_24.c -o area_2019_sep_24

生成s文件

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
	.file	"area_2019_sep_24.c"
.section .rodata
.LC1:
.string "radius, height = "
.LC2:
.string "%lf%lf"
.LC3:
.string "\351\235\242\347\247\257 = %.2f\n"
.LC4:
.string "\344\275\223\347\247\257 = %.2f\n"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
subq $64, %rsp
movq %fs:40, %rax
movq %rax, -8(%rbp)
xorl %eax, %eax
movsd .LC0(%rip), %xmm0
movsd %xmm0, -32(%rbp)
leaq .LC1(%rip), %rdi
movl $0, %eax
call printf@PLT
leaq -40(%rbp), %rdx
leaq -48(%rbp), %rax
movq %rax, %rsi
leaq .LC2(%rip), %rdi
movl $0, %eax
call __isoc99_scanf@PLT
movsd -32(%rbp), %xmm0
addsd %xmm0, %xmm0
movsd -48(%rbp), %xmm1
mulsd %xmm0, %xmm1
movsd -48(%rbp), %xmm2
movsd -40(%rbp), %xmm0
addsd %xmm2, %xmm0
mulsd %xmm1, %xmm0
movsd %xmm0, -24(%rbp)
movsd -48(%rbp), %xmm0
mulsd -32(%rbp), %xmm0
movsd -48(%rbp), %xmm1
mulsd %xmm1, %xmm0
movsd -40(%rbp), %xmm1
mulsd %xmm1, %xmm0
movsd %xmm0, -16(%rbp)
movq -24(%rbp), %rax
movq %rax, -56(%rbp)
movsd -56(%rbp), %xmm0
leaq .LC3(%rip), %rdi
movl $1, %eax
call printf@PLT
movq -16(%rbp), %rax
movq %rax, -56(%rbp)
movsd -56(%rbp), %xmm0
leaq .LC4(%rip), %rdi
movl $1, %eax
call printf@PLT
movl $0, %eax
movq -8(%rbp), %rcx
xorq %fs:40, %rcx
je .L3
call __stack_chk_fail@PLT
.L3:
leave
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size main, .-main
.section .rodata
.align 8
.LC0:
.long 1413754136
.long 1074340347
.ident "GCC: (Ubuntu 6.2.0-5ubuntu12) 6.2.0 20161005"
.section .note.GNU-stack,"",@progbits

nasm

用c2nasm.bash反汇编nasm已有c文件

1
./c2nasm.bash area_2019_sep_24.c

自动生成area_2019_sep_24.asm

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
default rel
global main

extern __stack_chk_fail
extern __isoc99_scanf
extern printf
extern _GLOBAL_OFFSET_TABLE_

SECTION .text
main:
push rbp
mov rbp, rsp
sub rsp, 64
mov rax, qword [fs:abs 28H]
mov qword [rbp-8H], rax
xor eax, eax
movsd xmm0, qword [rel L_006]
movsd qword [rbp-20H], xmm0
lea rdi, [rel L_002]
mov eax, 0
call printf
lea rdx, [rbp-28H]
lea rax, [rbp-30H]
mov rsi, rax
lea rdi, [rel L_003]
mov eax, 0
call __isoc99_scanf
movsd xmm0, qword [rbp-20H]
addsd xmm0, xmm0
movsd xmm1, qword [rbp-30H]
mulsd xmm1, xmm0
movsd xmm2, qword [rbp-30H]
movsd xmm0, qword [rbp-28H]
addsd xmm0, xmm2
mulsd xmm0, xmm1
movsd qword [rbp-18H], xmm0
movsd xmm0, qword [rbp-30H]
mulsd xmm0, qword [rbp-20H]
movsd xmm1, qword [rbp-30H]
mulsd xmm0, xmm1
movsd xmm1, qword [rbp-28H]
mulsd xmm0, xmm1
movsd qword [rbp-10H], xmm0
mov rax, qword [rbp-18H]
mov qword [rbp-38H], rax
movsd xmm0, qword [rbp-38H]
lea rdi, [rel L_004]
mov eax, 1
call printf
mov rax, qword [rbp-10H]
mov qword [rbp-38H], rax
movsd xmm0, qword [rbp-38H]
lea rdi, [rel L_005]
mov eax, 1
call printf
mov eax, 0
mov rcx, qword [rbp-8H]
xor rcx, qword [fs:abs 28H]
jz L_001
call __stack_chk_fail
L_001: leave
ret

SECTION .data
SECTION .bss
SECTION .rodata align=8

L_002:
db 72H, 61H, 64H, 69H, 75H, 73H, 2CH, 20H
db 68H, 65H, 69H, 67H, 68H, 74H, 20H, 3DH
db 20H, 00H

L_003:
db 25H, 6CH, 66H, 25H, 6CH, 66H, 00H

L_004:
db 0E9H, 9DH, 0A2H, 0E7H, 0A7H, 0AFH, 20H, 3DH
db 20H, 25H, 2EH, 32H, 66H, 0AH, 00H

L_005:
db 0E4H, 0BDH, 93H, 0E7H, 0A7H, 0AFH, 20H, 3DH
db 20H, 25H, 2EH, 32H, 66H, 0AH, 00H, 00H

L_006: dq 400921FB54442D18H

附录: c2nasm.bash

先把objconv程序放到/bin中, 供cmd使用obconv

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#!/bin/bash
# thanks to http://stackoverflow.com/a/20743090
# thanks to https://github.com/diogovk/c2nasm
# install objconv: https://github.com/vertis/objconv
#
# $1: source code

set -e
C_FILE="$1"
BASE_NAME="${C_FILE%.*}"
O_FILE="$BASE_NAME.o"
NASM_FILE="$BASE_NAME.asm"
gcc -Werror=implicit-function-declaration -fno-asynchronous-unwind-tables -O0 -c -o "$O_FILE" "$C_FILE"
objconv -fnasm "$O_FILE" "$NASM_FILE"
sed -i 's|st(0)|st0 |g' "$NASM_FILE"
sed -i 's|noexecute| |g' "$NASM_FILE"
sed -i 's|execute| |g' "$NASM_FILE"
sed -i 's|: function||g' "$NASM_FILE"
sed -i 's|?_|L_|g' "$NASM_FILE"
sed -i -n '/SECTION .eh_frame/q;p' "$NASM_FILE"
sed -i 's|;.*||g' "$NASM_FILE"
sed -i 's/^M//g' "$NASM_FILE"
sed -i 's|\s\+$||g' "$NASM_FILE"
sed -i 's|align=1||g' "$NASM_FILE"
rm "$O_FILE"