当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 16 篇帖子 ]  前往页数 1, 2  下一页
作者 内容
1 楼 
 文章标题 : GCC系列教程 二
帖子发表于 : 2008-09-11 18:14 

注册: 2007-11-22 17:25
帖子: 129
送出感谢: 0 次
接收感谢: 2
-----自己也是刚接触gcc,也是在不断学习,不断的在网上搜些资料不断的进行总结什么的,难免有些错误的地方,还望大家给指正。

今天,我们继续gcc之旅吧。上节我们讲了些gcc的历史发展什么的,还有就是gcc与g++的区别。今天我们就从整体上对gcc编译过程有个细致的了解,也好明白他的工作原理,好为以后深入学习研究打下个基础。
gcc的编译流程分为四个步骤,分别为:
· 预处理(Pre-Processing)
· 编译(Compiling)
· 汇编(Assembling)
· 链接(Linking)
以hello.c为例子,在这四个步骤中可以设置选项分别生成hello.i, hello.s, hello.o以及最终的hello文件:
hello.c : 最初的源代码文件;
hello.i : 经过编译预处理的源代码;
hello.s : 汇编处理后的汇编代码;
hello.o : 编译后的目标文件,即含有最终编译出的机器码,但它里面所引用的其他文件中函数的内存位置尚未定义。
hello / a.out : 最终的可执行文件
(还有.a(静态库文件), .so(动态库文件), .s(汇编源文件)留待以后讨论)

下面就具体来查看一下gcc是如何完成四个步骤的。

hello.c源代码

#include<stdio.h>
int main()
{
printf("Hello World!\n");
return 0;
}

(1)预处理阶段

在该阶段,编译器将上述代码中的stdio.h编译进来,并且用户可以使用gcc的选项”-E”进行查看,该选项的作用是让gcc在预处理结束后停止编译过程。

《深入理解计算机系统》中是这么说的:
预处理器(cpp)根据以字符#开头的命令(directives),修改原始的C程序。如hello.c中#include <stdio.h>指令告诉预处理器读系统头文件stdio.h的内容,并把它直接插入到程序文本中去。结果就得到另外一个C程序,通常是 以.i作为文件扩展名的。

注意:
Gcc指令的一般格式为:Gcc [选项] 要编译的文件 [选项] [目标文件]
其中,目标文件可缺省,Gcc默认生成可执行的文件名为:编译文件.out

[gan@localhost gcc]# gcc –E hello.c –o hello.i
选项”-o”是指目标文件,”.i”文件为已经过预处理的C原始程序。以下列出了hello.i文件的部分内容:

typedef int (*__gconv_trans_fct) (struct __gconv_step *,
struct __gconv_step_data *, void *,
__const unsigned char *,
__const unsigned char **,
__const unsigned char *, unsigned char **,
size_t *);



# 2 "hello.c" 2

int main()
{
printf("Hello World!\n");
return 0;
}

由此可见,gcc确实进行了预处理,它把”stdio.h”的内容插入到hello.i文件中。

(2)编译阶段

接 下来进行的是编译阶段,在这个阶段中,Gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,Gcc把代码翻译成 汇编语言。用户可以使用”-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。汇编语言是非常有用的,它为不同高级语言不同编译器提供了 通用的语言。如:C编译器和Fortran编译器产生的输出文件用的都是一样的汇编语言。

[gan@localhost gcc]# gcc –S hello.i –o hello.s
以下列出了hello.s的内容,可见Gcc已经将其转化为汇编了,感兴趣的读者可以分析一下这一行简单的C语言小程序是如何用汇编代码实现的。
.file "hello.c"
.section .rodata
.align 4

.LC0:
.string "Hello World!"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
subl $8, %esp
andl $-16, %esp
movl $0, %eax

addl $15, %eax
addl $15, %eax
shrl $4, %eax
sall $4, %eax
subl %eax, %esp
subl $12, %esp
pushl $.LC0

call puts
addl $16, %esp
movl $0, %eax
leave
ret
.size main, .-main
.ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"
.section .note.GNU-stack,"",@progbits


(3)汇编阶段

汇编阶段是把编译阶段生成的”.s”文件转成目标文件,读者在此可使用选项”-c”就可看到汇编代码已转化为”.o”的二进制目标代码了。如下所示:
[gan@localhost gcc]# gcc –c hello.s –o hello.o

(4)链接阶段

在成功编译之后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。

在这个源程序中并没有定义”printf”的函数实现,且在预编译中包含进的”stdio.h”中也只有该函数的声明,而没有定 义函数的实现,那么,是在哪里实现”printf”函数的呢?最后的答案是:系统把这些函数实现都被做到名为libc.so.6的库文件中去了,在没有特 别指定时,gcc会到系统默认的搜索路径”/usr/lib”下进行查找,也就是链接到libc.so.6库函数中去,这样就能实现函数”printf” 了,而这也就是链接的作用。

函数库一般分为静态库和动态库两种。静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成 的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a”。动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在 程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为”.so”,如前面所述的libc.so.6就是动态库。gcc在编译时 默认使用动态库。
(Linux下动态库文件的扩展名为".so"(Shared Object)。按照约定,所有动态库文件名的形式是libname.so(可能在名字中加入版本号)。这样,线程函数库被称作libthread.so。静态库的文件名形式是libname.a。共享archive的文件名形式是libname.sa。共享archive只是一种过渡形式,帮助人们从静态库转变到动态库。)
完成了链接之后,gcc就可以生成可执行文件,如下所示。

[gan@localhost gcc]# gcc hello.o –o hello

运行该可执行文件,出现正确的结果如下。
[root@localhost Gcc]# ./hello
Hello World!

好啦 这一节就到这。后面我们就开始对gcc的一些比较常用参数进行讲解啦。[color=olive]
[/color]



_________________
评价: 7.69% 2gunmsos
 
页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-09-11 18:43 
头像

注册: 2006-09-02 14:18
帖子: 5308
地址: 汉桑城
送出感谢: 1
接收感谢: 1
希望你最终能做个PDF


_________________
全世界linux爱好者联合起来 !
一切闭源操作系统都是纸老虎 !
要斗私批修,拒绝黑屏,使用linux !
让一部分人先用起Archlinux来 !
linux是第一生产力 !
讲正气,讲开源,讲free
要坚定不移的走开源的道路 !
linux明天会更好 !

dpkg -l |grep ^rc|awk '{print $2}' |tr ["\n"] [" "]|sudo xargs dpkg -P -
ubuntu粉丝群 26660836 已满员


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-09-19 16:52 

注册: 2007-09-17 16:20
帖子: 244
送出感谢: 0 次
接收感谢: 0 次
推荐使用-Wall选项


页首
 用户资料  
 
4 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2008-10-24 23:55 
头像

注册: 2008-10-24 23:28
帖子: 19
送出感谢: 0 次
接收感谢: 0 次
我也是个新人,看到你能够自己总结出来这些东西,很是佩服!多谢!


页首
 用户资料  
 
5 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-01-13 1:22 
头像

注册: 2008-12-22 22:48
帖子: 217
送出感谢: 0 次
接收感谢: 0 次
等待pdf中

我用c++来的helloworld ,voidmain怎么还要我返回int阿,无语中,高手指点下 :em20


_________________
不要小人得志


页首
 用户资料  
 
6 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-01-13 12:22 
头像

注册: 2008-07-21 9:44
帖子: 2371
地址: 深圳
送出感谢: 0 次
接收感谢: 0 次
赞LZ,继续哦~~ :em11


页首
 用户资料  
 
7 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-02-19 16:24 

注册: 2009-01-31 9:50
帖子: 7
送出感谢: 0 次
接收感谢: 0 次
.file "hello.c"
.section .rodata
.LC0:
.string "Hello,World!"
.text
.globl main
.type main, @function
main:
leal 4(%esp), %ecx
andl $-16, %esp
pushl -4(%ecx)
pushl %ebp
movl %esp, %ebp
pushl %ecx
subl $4, %esp
movl $.LC0, (%esp)
call puts
movl $0, %eax
addl $4, %esp
popl %ecx
popl %ebp
leal -4(%ecx), %esp
ret
.size main, .-main
.ident "GCC: (GNU) 4.3.2 20081105 (Red Hat 4.3.2-7)"
.section .note.GNU-stack,"",@progbits :em01
似乎redhat的gcc编译出来的.s文件与LZ的稍有不同,耐人寻味


页首
 用户资料  
 
8 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-03-01 9:11 
头像

注册: 2009-02-22 14:15
帖子: 173
送出感谢: 0 次
接收感谢: 0 次
很受益。有个问题想问一下,运行时我在当前目录下为什么还要指定绝对路径./hello?
当我不这样做时,它会输出bash:a:找不到命令。


_________________
Desire Freedom, Love Beauty, Keep Hacking。


页首
 用户资料  
 
9 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-03-01 9:20 
头像

注册: 2007-11-29 9:41
帖子: 8455
送出感谢: 0 次
接收感谢: 0 次
不错,多读有益 :em04


页首
 用户资料  
 
10 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-03-12 16:33 
头像

注册: 2008-12-03 21:05
帖子: 76
送出感谢: 0 次
接收感谢: 0 次
好!等待pdf.


页首
 用户资料  
 
11 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-03-13 10:34 

注册: 2008-04-25 15:34
帖子: 11
送出感谢: 0 次
接收感谢: 0 次
openware 写道:
很受益。有个问题想问一下,运行时我在当前目录下为什么还要指定绝对路径./hello?
当我不这样做时,它会输出bash:a:找不到命令。


因为你默认的环境变量的路径是:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games(在命令行中输入命令 echo $PATH 可以查看得到),所以你如果直接输入hello时,它会到上述路径中去查找,所以查找不到。


页首
 用户资料  
 
12 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-03-13 10:48 
头像

注册: 2007-05-08 16:26
帖子: 2058
地址: 火星内核某分子内某原子核内
系统: arch
送出感谢: 20
接收感谢: 6
希望cx51.exe有LINUX版本


_________________
笔记本 :
F208S : gentoo
A460P i3G D6 : UBUNTU + WIN7
UN43D1 : UBUNTU + WIN7
1000人超级QQ群 LINUX + WIN : 31465544 或 18210387


页首
 用户资料  
 
13 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-03-20 23:20 
头像

注册: 2008-12-05 20:43
帖子: 97
地址: 深圳
送出感谢: 0 次
接收感谢: 0 次
anjiannian 写道:
等待pdf中

我用c++来的helloworld ,voidmain怎么还要我返回int阿,无语中,高手指点下 :em20

因为main()函数以返回值0代表执行到文件尾,非0代表出错或者其他。所以从这句话理解,main返回值是个整形的。
下面是原文:
代码:
since main is a function like any other,it may return a value to its caller,which is in effect the environment in which the program was executed.Typically,a retrun value of zero implies  normal termination;non-zero values signal unusual or erroneous termination conditions


_________________
道是何物,直教,生死相许?


页首
 用户资料  
 
14 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-08-18 22:32 

注册: 2008-10-31 22:12
帖子: 6546
系统: 践兔
送出感谢: 18
接收感谢: 25
换句话说,因为其他程式的main是int,所以你的main也要返回int
代码:
18/08/2009 22:32:48
tusooa (~)
>> echo -en "\e[5mHello World\e[0m\n"
Hello World
18/08/2009 22:33:52
tusooa (~)
>> echo $?
0 <== 整数
18/08/2009 22:33:57
tusooa (~)
>>


_________________
代码:
] ls -ld //


页首
 用户资料  
 
15 楼 
 文章标题 : Re: GCC系列教程 二
帖子发表于 : 2009-09-07 16:23 

注册: 2009-09-01 22:09
帖子: 4
送出感谢: 0 次
接收感谢: 0 次
写得真好,很有帮助。


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 16 篇帖子 ]  前往页数 1, 2  下一页

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 3 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译