Tao of Programmer: 略谈 c 语言中指针与数组的区别（转＋分析）

原文地址：http://www.yesban.com/group/forum/g10034/showtopic_10817.html

准备找工作了。

今天第一次笔试，郁闷了。

多选看成单选。

卷子别人都当草稿，我不好意思，还觉得人家公司留个干净卷子还能回收再次使
用，愣是打腹稿，直接写代码，想起来不对，直接划掉再写，卷子写的龙飞凤舞不
说，程序划来划去，整个答题纸跟草稿之差不多，汗啊。

再说，笔试内容的部分。

指针和数组，我觉得我本来挺清楚的，可是做题的时候，有些题目（具体记不得
了）就是有些含糊，看来还是不确定，于是重又拿去《c traps and pit falls》。

写的貌似也不甚详细，google下，搜到下面这篇东西，确实对指针和数组算是理解
的很深刻了，不过人家还很谦虚，叫略谈.......

数组与指针是两个不同的概念，即使是从编译的层面上来看。不过，在很多时候，
两者的用法极为相似。本文将讨论两者的区别。

一、理论分析

编译器在处理指针与数组的时候，是区别对待的。

对于指针

CODE:

int *p;

p 是一个变量，所以编译器要为之分配一个空间。

CODE:

.comm p, 4

对于数组：

CODE:

int a[10]

a 是一个地址，编译器会为数组 a 分配一个空间，但不会为 a 本身分配空间，在
使用到a的地方，会被替换为一个地址+属性，其结果为一个"常量指针"。

//###我注，a本身没有分配空间，但是a指向a[10]的首地址，所以，a=&a[0]，*a=a[0]

CODE:

.comm a, 40

在对一个指针变量进行 dereferance 的时候，比如 (*p)。编译器首先要得到 p
的地址，从中取值，然后把得到的值作为地址，再取值。类似如下汇编：

/******####我注，此处很重要。对比与数组a的不同。程序中用到a的地方，直接
视a为"地址（&a[0]）＋属性(数组大小10)"，是一个"常量指针"，不可以更改a的
指向，但是a指向的地址的内容可以改变。
即
a=p;//错误的，不能改变a的指向
*a=199;//正确，等价于a[0]=199,即a指向地址的内容可以改变

而指针p不同，当程序使用指针的时候，存在一个解引用（dereference）的概念，
即程序先取指针p的地址，p地址内的值即为p指向的地址，程序需要的值就是p指向
地址内存储的值。
####我注，结束***/

CODE:

lea (p), %esi /* this is &p */
mov (%esi), %edi /* this is p */
mov (%edi), %eax /* this is p[0] */

或者，更简单的

mov (p), %esi /* this is p */
mov (%esi), %eax /* and this is p[0] */

相比之下，数组的引用

CODE:

int a[10];
a[0];

则省去了取 a 地址的过程，符号 a 代表一个地址，这个地址不存放在任何变量中！

CODE:

lea (a), %esi /* this is a */
mov (%esi), %eax /* this is a[0] */

或更简单的：

mov (a), %esi /* this is a[0] */

熟悉汇编的人，容易从看出，区别是大的。

二、两个例子
第一个例子，演示 "把数组声明为指针" 是如何使程序崩溃的。

CODE:

file: 1.c
int a[10]={0};

file: 2.c
int
main ()
{
extern int *a;

printf ( "%d\n", a[0]);
return 0;
}

/****####我注
此程序在gcc 4.3 OPENsuse 11 下，编译错误,不知道早期gcc可不可以编译通过。
lnever@fang:~> gcc 2.c
2.c: In function 'main':
2.c:5: error: conflicting types for 'a'
1.c:2: error: previous definition of 'a' was here

作者的意思，看明白了。但是一时还想不起来一个能够验证这个概念的程序：（
*****************************/

运行这个程序，Segmentation fault

在模块1.c 中， a 被定义为一个数组，但在模块 2.c中，a被声明为指针。所以编
译器在处理 printf ("%d\n", a[0]) 时:
认为 a 是一个指针，所以先取其地址&a，然而，a 实际是个数组，&a 就是 a本
身，所的 &a 是 a 的首地址。
然后编译器取指针a的值，这实际上是得到的是数组的第一个元素 a[0] ，值为
0！也就是，编译器得到了一个 0 指针，最后，编译器对其derefrence，崩溃！

第二个例子演示"把指针声明为数组"如何的到错误的数据:

CODE:

file: 3.c
int *pa = (int *)0;

/*****我注

此处，我没有看明白为什么是(int*)0,这样怎么是如作者所说的给pa赋初值0呢？
(in*)不是强制类型转换吗？这个意思不就是取0的地址了吗？但结果如作者所说，
没明白

我改成了int *pa=0;结果一样，都是0

/*****end

f ()
{
printf ( "%x\n", &pa);
}

file: 4.c
int
main ()
{
extern int pa[];
printf ( "%p\n", pa);
printf ( "%d\n", pa[0]);
f ();

return 0;
}

CODE:

0x403010
0
403010

在这个例子中， pa 被定义为一个指针，并初始化为0, 但在另一个模块中，被声
明为一个数组.
编译器在处理 printf ("%p\n", pa) 时，认为 pa 是数组，所以直接打印符号pa
的值，此值为指针pa的地址！

编译器在处理 printf ("%p\n", pa[0]) 时，认为 pa 是数组，以符号 pa 对应的
值加一个偏移0，并取其值，得到的实际上是指针 pa 的值即 0.

数组是一些同名同类型变量的有序集合，它们储存在内存的一个连续的储存区内。
其中每个成员称为数组元素，各元素用下标加以区别。所以，数组元素又称为下标
变量。
数组名是一个常量指针，它恒指向该数组的第一个元素。
指针变量的值是一个正整数，它表示内存中的地址.

Tao of Programmer

略谈 c 语言中指针与数组的区别（转＋分析）

2008年11月20日星期四

0 评论:

博客归档

类别