找回密码
 register

QQ登录

只需一步,快速开始

查看: 41|回复: 0

[汇编语言] [零基础入门学习]·20·第一个程序·源程序·编译源程序·编译·连接·以简化的方式进行编译和连接·1.exe的执行

[复制链接]

[汇编语言] [零基础入门学习]·20·第一个程序·源程序·编译源程序·编译·连接·以简化的方式进行编译和连接·1.exe的执行

[复制链接]
  • 打卡等级:热心大叔
  • 打卡总天数:91
  • 打卡月天数:14
  • 打卡总奖励:91
  • 最近打卡:2025-01-15 02:59:34
Waylee

主题

0

回帖

1万

积分

仙帝

积分
11890
Waylee 2024-12-31 16:47 | 显示全部楼层 |阅读模式 | Google Chrome | Windows 10

马上注册,查看网站隐藏内容!!

您需要 登录 才可以下载或查看,没有账号?register

×

4.2  源程序

下面就是一段简单的汇编语言源程序。

程序 4.1

assume cs:codesg
codesg segment
    mov ax,0123H
    mov bx,0456H
    add,ax,ax
    add,ax,ax
    mov ax,4c00H
    int 21H
codesg ends
end

下面对程序进行说明。

1.伪指令
在汇编语言源程序中,包含两种指令,一种是汇编指令,一种是伪指令。汇编指令是有对应的机器码的指令,可以被编译为机器指令,最终为CPU所执行。而伪指令没有对应的机指令,最终不被CPU所执行。那么谁来执行伪指令呢?伪指令是由编译器来执行的指令,编译器根据伪指令来进行相关的编译工作。

你现在能看出来程序 4.1 中哪些指令是伪指令吗?
程序4.1中出现了3次伪指令。

(1)   XXX segment  ……  XXX ends
segment 和ends是一对成对使用的伪指令,这是在写可被编译器编译的汇编程序时,必须要用到的一对伪指令。segment和ends的功能是定义一个段,segment说明一个段开始,ends说明一个段结束。一个段必须有一个名称来标识,使用格式为:

段名 segment
    .
    .
    .
段名 ends

比如,程序4.1中的:

codesg = segment        ;定义一个段,段的名字称为codesg,这个段从此开始
    .
    .
    .
codesg = ends           ;名称为“codesg”的段到此结束

一个汇编程序是由多个段组成的,这些段被用来存放代码、数据或当作栈空间来使用。我们在前面的课程中所讲解的段的概念,在汇编源程序中得到了应用与体现,一个源程序中所有将被计算机所处理的信息:指令、数据、栈,被划分到了不同的段中。

一个有意义的汇编程序至少要有一个段,这个段用来存放代码。

我们可以看到,程序4.1中,在 codesg segment和codesg ends之间写的汇编指令是这个段中存放的内容,这是一个代码段(其中还有我们不认识的指令,后面会进行讲解)。

(2)  end
end是一个汇编程序的结束标记,编译器在编译汇编程序的过程中,如果碰到了伪指令end,就结束对源程序的编译。所以,我们写程序的时候,如果程序写完了,要在结尾加上伪指令end。否则,编译器在编译程序时,无法知道程序在何处结束。
注意,不要搞混了end和ends,ends是和segment成对使用的,标记一个段的结束,ends的含义可理解为“end segment”。我们这里讲的end的作用是标记整个程序的结束。

(3)  assume
这条伪指令的含义为“假设”。它假设某一段寄存器和程序中的某一个用segment...ends定义的段相关联。通过assume说明这种关联,在需要的情况下,编译程序可以将段寄存器和某一个具体的段相联系。assume并不是一条非要深入理解不可的伪指令,以后我们编程时,记着用assume将有特定用途的段和相关的段寄存器关联起来即可。
比如,在程序4.1中,我们用codesg segment ... codesg ends 定义一个名为codesg的段,在这个段中存放代码,所以这个段就是一个代码段。在程序的开头,用assume cs:codesg将用作代码段的段codesg和CPU中的段寄存器cs联系起来。

**2.源程序中的“程序”
用汇编语言写的源程序,包括伪指令和汇编指令,我们编程的最终目的是让计算机完成一定的任务。源程序中的汇编指令组成了最终由计算机执行的程序,而源程序中的伪指令是由编译器处理的,它们并不实现我们编程的最终目的。这里所说的程序就是指源程序中最终由计算机执行、处理的指令或数据。
注意,以后可以将源程序文件中的所有内容称为源程序,将源程序中最终由计算机执行、处理的指令或数据,称为程序。程序最先以汇编指令的形式存在源程序中,经编译、连接后转变为机器码,存储在可执行文件中。这个过程如图4.2所示。

002.webp

3. 标号
汇编源程序中,除了汇编指令和伪指令外,还有一些标号,比如“codesg”。一个标号代码了一个地址。比如codesg在segment的前面,作为一个段的名称,这个段的名称最终将被编译、连接程序处理为一个段的段地址。

4. 程序的结构
我们现在讨论一下汇编程序的结构。在前3章中,我们都是通过直接在Debug中写入汇编指令来写汇编程序,对于十分简陋的程序这样做的确方便。可对于大一些的程序,就不能如此了。我们需要写出能让编译器进行编译的源程序,这样的源程序应该具备起码的结构。
源程序是由一些段构成的。我们可以在这些段中存放代码、数据,或将某个段当作栈空间。我们现在来一步步地完成一个小程序,从这个过程中体会一下汇编程序中的基本要素和汇编程序的简单框架。

任务:编程运算2^3。源程序应该怎样来写呢?
(1)我们要定义一个段,名称为abc。

abc segment
    .
    .
    .
abc ends

(2)在这个端中写入汇编指令,来实现我们的任务。

abc segment
    mov ax,2
    add,ax,ax
    add,ax,ax
abc ends

(3)然后,要指出程序在何处结束。

abc segment
    mov ax,2
    add,ax,ax
    add,ax,ax
abc ends
end

(4)abc被当作代码段来用,所以,应该将abc和cs联系起来。(当前,对于这个程序,并不是非这样做不可。)

assume cs:abc
abc segment
    mov ax,2
    add,ax,ax
    add,ax,ax
abc ends
end

最终写成的程序图程序4.2所示。

**程序4.2

assume cs:abc
abc segment
    mov ax,2
    add,ax,ax
    add,ax,ax
abc ends
end

5.程序返回
我们的程序最先以汇编指令的形式存在源程序中,经编译、连接后转变为机器码,存储在可执行文件中,那么,它怎样得到运行呢?
下面,我们在DOS(一个单任务操作系统)的基础上,简单地讨论一下这个问题。
一个程序P2在可执行文件中,则必须有一个正在运行的程序P1,将P2从可执行文件中加载入内存后,将CPU的控制器交给P2,P2才能得到运行。P2运行开始后,P1暂停运行。
而当P2运行完毕后,应该将CPU的控制器交还给使它得以运行的程序P1,此后,P1继续运行。
现在,我们知道,一个程序结束后,将CPU的控制器交还给使它得以运行的程序,我们称这个过程为:程序返回。那么,如何返回呢?应该在程序的末尾添加返回的程序段。

我们回过头来,看一下程序4.1中的两条指令:

mov ax,4c00H
int 21H

这两条指令所实现的功能就是程序返回。
在目前阶段,我们不必去理解int 21H的含义,和为什么要在这条指令前加上指令mov ax,4c00H。我们只要知道,在程序的末尾使用这两条指令就可以实现程序返回。
到目前为止,我们好像已经遇到了几个和结束相关的内容:段结束、程序结束、程序返回。表4.1展示了它们的区别。

表4.1  与结束相关的概念

目的 相关指令 指令性质 指令执行者
通知编译器一个段结束 段名 ends 伪指令 编译时,由编译器执行
通知编辑器程序结束 end 伪指令 编译时,由编译器执行
程序返回 mov ax,4c00H  int 21H 汇编指令 执行时,由CPU执行

6.语法错误和逻辑错误
可见,程序4.2在运行时会引发一些问题,,因为程序没有返回。当然,这个错误在编译的时候是不能表现出来的,也就是说,程序4.2对于编译器来说是正确的程序。
一般来说,程序在编译时被编译器发现的错误是语法错误,比如程序4.2写成如下这样就会发生语法错误:

aume cs:abc
abc segment
    mov ax,2
    add ax,ax
    add ax,ax
end

显然,程序中有编译器不能识别的aume,而且编译器在编译的过程中也无法知道abc段何时结束。
在源程序编译后,在运行时发生的错误是逻辑错误。语法错误容易发现,也容易解决。而逻辑错误通常不容易被发现。不过,程序4.2中的错误却显而易见,我们将它修正过程:

assume cs:abc
abc segment
    mov ax,2
    add ax,ax
    add ax,ax
    mov ax,4c00H
    int 21H
abc ends
end

4.3 编辑源程序

可以用任意的文本编辑器来编辑源程序,只要最终将其存储为纯文本文件即可。在我们的课程中,使用Dos下的Edit。以程序4.1为例,说明工作过程。

(1)进入DOS方式,运行Edit,如图4.3所示。

01.webp

(2)在Edit中编辑程序,如图4.4所示。
4.4.webp

(3)将程序保存为c:\1.asm后,退出Edit,结束对源程序的编辑。

4.4 编译

在4.3节中,完成对源程序的编辑后,得到一个源程序文件 c:\1.asm。可以对其进行编译,生成包含机器代码的目标文件。
在编译一个源程序之前首先要找到一个相应的编译器。在我们的课程中,采用微软的masm5.0汇编编译器,文件名为masm.exe。假设汇编编译器在c:\masm目录下。可以按照下面的过程来进行源程序的编译,以c:\1.asm为例。
(1)进入DOS方式,进入c:\masm目录,运行masm.exe,如图4.5所示。

4.5.webp

图4.5中,运行masm后,首先显示出一些版本信息,然后提示输入将要被建议的源程序文件的名称。注意,“[.ASM]”提示我们,默认的文件扩展名是asm,比如,要建议的源程序文件名是“p1.asm”,只要在这里输入“p1”即可,可如果源程序不是以asm为扩展名的话,就要输入它的全名。比如源程序文件名为“p1.txt”,就要输入全名。
在输入源程序文件名的时候一定要指明它所在的路径。如果文件就在当前路径下,只要输入文件名就可以,可如果文件在其他的目录,则要输入路径,比如,要编译的文件p1.txt在“c:\windows\desktop”下,则要输入“c:\windows\desktop\p1.txt”。
这里,我们要编译的文件是C盘根目录下的1.asm,所以此处输入“c:\1.asm”。

(2)输入要编译的源程序文件名后,按Enter键,屏幕显示如图4.6所示。

4.6.webp

图4.6中,在输入源程序文件名后,程序继续提示我们输入要编译出的目标文件的名称,目标文件是我们对一个源程序进行编译要得到的最终结果。注意屏幕上的显示:"[1.OBJ]",因为我们已经输入了源程序的文件名1.asm,则编译程序默认要输出的目标文件名为1.obj,所以可以不必再另行指令文件名。直接按Enter键,编译程序将在当前的目录下,生成1.obj文件。
这里,也可以指定生成的目标文件所在的目录,比如,想让编译程序在"c:\windows\desktop"下生成目标文件1.obj,则可输入“c:\windows\desktop\1”。
我们直接按Enter键,使用编译程序设定的目标文件夹。

(3) 确定了目标文件的名称后,屏幕显示如图4.7所示。

4.7.webp

图4.7中,编译程序提示输入列表文件的名称,这个文件是编译器将源程序编译为目标文件的过程中产生的中间结果。可以让编译器不生成这个文件,直接按Enter键即可。

(4)忽略了列表文件的生成后,屏幕显示如图4.8所示。

4.8.webp

图4.8中,编译程序提示输入交叉引用文件的名称,这个文件同列表文件一样,是编译器将源程序编译为目标文件过程中产生的中间结果。可以让编译器不生成这个文件,直接按Enter键即可。

(5)忽略了交叉引用文件的生成后,屏幕显示如图4.9所示。

4.9.webp

图4.9中,对源程序的编译结束,编译器输出的最后两行告诉我们这个程序没有警告错误和必须要修正的错误。
上面我们通过对C盘根目录下的1.asm进行编译的过程,展示了使用汇编编译器对源程序进行编译的方法。按照上面的过程进行了编译之后,在编译器masm.exe运行的目录c:\masm下(即当前路径下),将出现一个新的文件:1.obj,这是对源程序1.asm进行编译所得到的结果。当然,如果编译的过程中出现错误,那么将得不到目标文件。一般来说,有两类错误使我们得不到所期望的目标文件:

  1. 程序中有“Servere Errors”;
  2. 找不到所给出的源程序文件。

注意,在编译的过程中,我们提供了一个输入,即源程序文件。最多可以得到3个输出:目标文件(.obj)、列表文件(.lst)、交叉引用文件(.crf),这3个输出文件中,目标文件是我们最终要得到的结果,而另外两个只是中间结果,可以让编译器忽略对它们的生成。在汇编课程中,我们不讨论这两类文件。

4.5 连接

在对源程序进行编译得到目标文件后,我们需要对目标文件进行连接,从而得到可执行文件。接续上一节的过程,我们已经对c:\1.asm进行编译得到c:\masm\1.obj,现在再将c:\masm\1.obj连接为c:\masm\1.exe。
我们使用微软的Overlay Linker3.60连接器,文件名为link.exe,假设连接器在c:\masm目录下。可以按照下面的过程来进行程序的链接,以c:\masm\1.obj为例。
(1)进入DOS方式,进入c:\masm目录,运行link.exe,如图4.10所示。
图4.10中,运行link后,首先显示出一些版本信息,然后提示输入将要被链接的目标文件的名称。注意,"[.OBJ]"提示我们,默认的文件扩展名是obj,比如要连接的目标文件名是"p1.obj",只要在这里输入“p1”即可。可如果文件不是以obj为扩展名,就要输入它的全名。比如目标文件名为"p1.bin",就要输入全满。
在输入目标文件名的时候,要注意指明它所在的路径。这里,要连接的文件是当前目标下的1.obj,所以此处输入“1”。

4.10.webp

(2)输入要连接的目标文件名后,按Enter键,屏幕显示如图4.11所示。

4.11.webp

图4.11中,在输入目标文件夹名后,程序继续提示我们输入要生成的可执行文件的名称,可执行文件是我们对一个程序进行连接要得到的最终结果。注意屏幕上的显示:"[1.EXE]",因为已经确定了目标文件名为1.obj,则程序默认要输出的可执行文件名为1.EXE,所以可以不必再另行指定文件名。直接按Enter键,编译程序将在当前的目标下,生成1.EXE。
这里,也可以指定生成的可执行文件所在的目录,比如,想让连接程序在"c:\windows\desktop"下生成可执行文件1.EXE,则可输入“c:\windows\desktop\1”。
我们直接按Enter键,使用连接程序设置的可执行文件名。

(3)确定了可执行文件的名称后,屏幕显示如图4.12所示。

4.12.webp

图4.12中,连接程序提示输入映像文件的名称,这个程序是连接程序将目标文件连接为可执行文件过程中产生的中间结果,可以让连接程序不生成这个文件,中间按Enter键即可。

(4)忽略了映像文件的生成后,屏幕显示如图4.13所示。
图4.13中,连接程序提示输入库文件的名称。库文件里面包含了一些可以调用的子程序,如果程序中调用了某一个库文件中的子程序,就需要在连接的时候,将库文件和目标文件连接到一起,生成可执行文件。但是,这个程序中没有调用任何子程序,所以,这里忽略库文件名的输入,直接按Enter键即可。

4.13.webp

(5)忽略库文件的连接后,屏幕显示如图4.14所示。

4.14.webp

图4.14中,对目标文件的连接结束,连接程序输出的最后一行告诉我们,这个程序中有一个警告错误:“没有栈段”,这里我们不理会这个错误。
上面我们通过对当前路径下的1.obj进行连接的过程,展示了使用连接器对目标文件进行连接的方法。按照上面的过程进行了连接之后,在连接器link.exe运行的目录c:\masm下(即当前路径下),将出现一个新的文件:1.exe,这是对目标文件1.obj进行连接所得到的结果。当然,如果连接过程中出现错误,那么将得不到可执行文件。
连接的作用是什么?
对于连接,我们也不想过多地讨论。实际上,在汇编课程中,我们将会接触到许多知识、概念,对于这些,我们并不是都有深入讨论的必要。
在这里再次强调一下,我们学习汇编的主要目的,就是通过用汇编语言进行编程而深入地理解计算机底层的基本工作机理,达到可以随心所欲地控制计算机的目的。基于这种考虑,我们的编程活动,大都是直接对硬件进行的。我们希望直接对硬件编程,却并不希望用机器码编程。我们用汇编语言编程,就要用到编辑器(Edit)、编译器(masm)、连接器(link)、调试工具(Debug)等所有工具,而这些工具都是在操作系统上运行的程序,所以我们的学习过程必须在操作系统的环境中进行。我们在一个操作系统坏境中,使用了许多工具,这势必要牵扯到操作系统、编译原理等方面的知识和原理。我们只是利用这些环境、工具来方便我们的学习,而不希望这些东西分散了我们的注意力。所以,对于涉及而又不在我们学习的主要内容之中的东西,我们只做简单的解释。
好了,我们简单的讲连接的作用,连接的作用有以下几个。

  1. 当源程序很大时,可以将它分为多个源程序文件来编译,每个源程序编译称为目标文件后,再用连接程序将它们连接到一起,生成一个可执行文件;
  2. 程序中调用了某个库文件中的子程序,需要将这个库文件和该程序生成的目标文件连接到一起,生成一个可执行文件;
  3. 一个源程序编译后,得到了存有机器码的目标文件,目标文件中的有些内容还不能直接用来生成可执行文件,连接程序将这些内容处理为最终的可执行信息。所以,在只有一个源程序文件,而又不需要调用某个库中的子程序的情况,也必须用连接程序对目标文件进行处理,生成可执行文件。
    注意,对于连接的过程,可执行文件是我们要得到的最终结果。

4.6 以简化的方式进行编译和连接

在前面的内容里,介绍了如何使用masm和link进行编译和连接。可以看出,我们编译、连接的最终目的是用源程序文件生成可执行文件。在这个过程中所产生的中间文件都可以忽略。我们可以用一种较为便捷的方式进行编译、连接。简洁的编译过程如图4.15所示。

4.15.webp

注意图4.15中的命令行“masm c:\1”,在masm后面加上被编译的源程序文件的路径、文件名,在命令行的结尾再加上分号,按Enter键后,编译器就会c:\1.asm进行编译,在当前路径下生成目标文件1.obj,并在编译的过程中自动忽略中间文件的生成。
图4.16展示了便捷的连接过程。
4.16.webp

注意图4.16中的命令行"link 1;",在link后面加上被连接的目标文件的路径、文件名,在命令行的结尾再加上分号,按Enter键后,连接程序就对当前路径下的1.obj进行处理,在当前路径下生成可执行文件1.exe,并在过程中自动忽略中间文件的生成。

4.7 1.exe的执行

现在,终于将我们的第一个汇编程序加工成了一个可在操作系统下执行的程序文件,我们现在执行一下,图4.17展示了1.exe的执行情况。

4.17.webp

奇怪吗?程序运行后,竟然没有任何结果,就像没有运行一样。那么程序到底运行了吗?
程序当然运行了,只是从屏幕上不可能看到任何运动结果,因为,我们的程序根本没有向显示器输出任何信息。程序只是做了一些将数据送入寄存器和加法操作,而这些事情,我们不可能从显示屏上看出。程序执行完成后,返回,屏幕上再次出现操作系统的提示(图4.17中第2行)。
当然,我们不能总是写这样的看不到任何结果的程序,随着课程的进行,我们将会向显示器上输出信息,不过那将是几章以后的事情了,请耐心等到。

您需要登录后才可以回帖 登录 | register

本版积分规则

雪舞知识库 | 浙ICP备15015590号-1 | 萌ICP备20232229号|浙公网安备33048102000118号 |天天打卡

GMT+8, 2025-1-15 13:55 , Processed in 0.117561 second(s), 9 queries , Redis On.

Powered by XueWu Licensed

Copyright © Tencent Cloud.

快速回复 返回顶部 返回列表