原文地址:http://www.yesban.com/group/forum/g10034/showtopic_10817.html
准备找工作了。
今天第一次笔试,郁闷了。
多选看成单选。
卷子别人都当草稿,我不好意思,还觉得人家公司留个干净卷子还能回收再次使
用,愣是打腹稿,直接写代码,想起来不对,直接划掉再写,卷子写的龙飞凤舞不
说,程序划来划去,整个答题纸跟草稿之差不多,汗啊。
再说,笔试内容的部分。
指针和数组,我觉得我本来挺清楚的,可是做题的时候,有些题目(具体记不得
了)就是有些含糊,看来还是不确定,于是重又拿去《c traps and pit falls》。
写的貌似也不甚详细,google下,搜到下面这篇东西,确实对指针和数组算是理解
的很深刻了,不过人家还很谦虚,叫略谈.......
数组与指针是两个不同的概念,即使是从编译的层面上来看。不过,在很多时候,
两者的用法极为相似。本文将讨论两者的区别。
一、理论分析
编译器在处理指针与数组的时候,是区别对待的。
对于指针
CODE:
int *p;
p 是一个变量,所以编译器要为之分配一个空间。
CODE:
.comm p, 4
对于数组:
CODE:
int a[10]
a 是一个地址,编译器会为数组 a 分配一个空间,但不会为 a 本身分配空间,在
使用到a的地方,会被替换为一个地址+属性,其结果为一个"常量指针"。
//###我注,a本身没有分配空间,但是a指向a[10]的首地址,所以,a=&a[0],*a=a[0]
CODE:
.comm a, 40
在对一个指针变量进行 dereferance 的时候,比如 (*p)。编译器首先要得到 p
的地址,从中取值,然后把得到的值作为地址,再取值。类似如下汇编:
/******####我注,此处很重要。对比与数组a的不同。程序中用到a的地方,直接
视a为"地址(&a[0])+属性(数组大小10)",是一个"常量指针",不可以更改a的
指向,但是a指向的地址的内容可以改变。
即
a=p;//错误的,不能改变a的指向
*a=199;//正确,等价于a[0]=199,即a指向地址的内容可以改变
而指针p不同,当程序使用指针的时候,存在一个解引用(dereference)的概念,
即程序先取指针p的地址,p地址内的值即为p指向的地址,程序需要的值就是p指向
地址内存储的值。
####我注,结束***/
CODE:
lea (p), %esi /* this is &p */
mov (%esi), %edi /* this is p */
mov (%edi), %eax /* this is p[0] */
或者,更简单的
mov (p), %esi /* this is p */
mov (%esi), %eax /* and this is p[0] */
相比之下,数组的引用
CODE:
int a[10];
a[0];
则省去了取 a 地址的过程,符号 a 代表一个地址,这个地址不存放在任何变量中!
CODE:
lea (a), %esi /* this is a */
mov (%esi), %eax /* this is a[0] */
或更简单的:
mov (a), %esi /* this is a[0] */
熟悉汇编的人,容易从看出,区别是大的。
二、两个例子
第一个例子,演示 "把数组声明为指针" 是如何使程序崩溃的。
CODE:
file: 1.c
int a[10]={0};
file: 2.c
int
main ()
{
extern int *a;
printf ( "%d\n", a[0]);
return 0;
}
/****####我注
此程序在gcc 4.3 OPENsuse 11 下,编译错误,不知道早期gcc可不可以编译通过。
lnever@fang:~> gcc 2.c
2.c: In function 'main':
2.c:5: error: conflicting types for 'a'
1.c:2: error: previous definition of 'a' was here
作者的意思,看明白了。但是一时还想不起来一个能够验证这个概念的程序:(
*****************************/
运行这个程序,Segmentation fault
在模块1.c 中, a 被定义为一个数组,但在模块 2.c中,a被声明为指针。所以编
译器在处理 printf ("%d\n", a[0]) 时:
认为 a 是一个指针,所以先取其地址&a,然而,a 实际是个数组,&a 就是 a本
身,所的 &a 是 a 的首地址。
然后编译器取 指针a的值,这实际上是 得到的是数组的第一个元素 a[0] ,值为
0!也就是,编译器得到了一个 0 指针,最后,编译器对其derefrence,崩溃!
第二个例子演示"把指针声明为数组"如何的到错误的数据:
CODE:
file: 3.c
int *pa = (int *)0;
/*****我注
此处,我没有看明白为什么是(int*)0,这样怎么是如作者所说的给pa赋初值0呢?
(in*)不是强制类型转换吗?这个意思不就是取0的地址了吗?但结果如作者所说,
没明白
我改成了int *pa=0;结果一样,都是0
/*****end
f ()
{
printf ( "%x\n", &pa);
}
file: 4.c
int
main ()
{
extern int pa[];
printf ( "%p\n", pa);
printf ( "%d\n", pa[0]);
f ();
return 0;
}
CODE:
0x403010
0
403010
在这个例子中, pa 被定义为一个指针,并初始化为0, 但在另一个模块中,被声
明为一个数组.
编译器在处理 printf ("%p\n", pa) 时,认为 pa 是数组,所以直接打印符号pa
的值,此值为指针pa的地址!
编译器在处理 printf ("%p\n", pa[0]) 时,认为 pa 是数组,以符号 pa 对应的
值加一个偏移0,并取其值,得到的实际上是 指针 pa 的值 即 0.
数组是一些同名同类型变量的有序集合,它们储存在内存的一个连续的储存区内。
其中每个成员称为数组元素,各元素用下标加以区别。所以,数组元素又称为下标
变量。
数组名是一个常量指针,它恒指向该数组的第一个元素。
指针变量的值是一个正整数,它表示内存中的地址.
0 评论:
发表评论