2. C 语言的基本语法_C 语言教程

C 语言的代码由一行行语句（statement）组成。语句就是程序执行的一个操作命令。C 语言规定，语句必须使用分号结尾，除非有明确规定可以不写分号。

语句

C 语言的代码由一行行语句（statement）组成。语句就是程序执行的一个操作命令。C 语言规定，语句必须使用分号结尾，除非有明确规定可以不写分号。
```
int x = 1;
```
上面就是一个变量声明语句，声明整数变量x，并且将值设为1。
多个语句可以写在一行。
```
int x; x = 1;
```
上面示例是两个语句写在一行。所以，语句之间的换行符并不是必需的，只是为了方便阅读代码。
一个语句也可以写成多行，这时就要依靠分号判断语句在哪一行结束。
```
int x;
x
=
1
;
```
上面示例中，第二个语句x = 1;被拆成了四行。编译器会自动忽略代码里面的换行。
单个分号也是有效语句，称为“空语句”，虽然毫无作用。
```
;
```

表达式

C 语言的各种计算，主要通过表达式完成。表达式（expression）是一个计算式，用来获取值。
```
1 + 2
```
上面代码就是一个表达式，用来获取1 + 2这个算术计算的结果。
表达式加上分号，也可以成为语句，但是没有实际的作用。
```
8;
3 + 4;
```
上面示例是两个表达式，加上分号以后成为语句。
表达式与语句的区别主要是两点：
- 语句可以包含表达式，但是表达式本身不构成语句。
- 表达式都有返回值，语句不一定有。因为语句用来执行某个命令，很多时候不需要返回值，比如变量声明语句（int x = 1）就没有返回值。

语句块

C 语言允许多个语句使用一对大括号{}，组成一个块，也称为复合语句（compounded statement）。在语法上，语句块可以视为多个语句组成的一个复合语句。
```
{
  int x;
  x = 1;
}
```
上面示例中，大括号形成了一个语句块。
大括号的结尾不需要添加分号。

空格

C 语言里面的空格，主要用来帮助编译器区分语法单位。如果语法单位不用空格就能区分，空格就不是必须的，只是为了增加代码的可读性。
```
int x = 1;
// 等同于
int x=1;
```
上面示例中，赋值号（=）前后有没有空格都可以，因为编译器这里不借助空格，就能区分语法单位。
语法单位之间的多个空格，等同于单个空格。
```
int    x =     1;
```
上面示例中，各个语法单位之间的多个空格，跟单个空格的效果是一样的。
空格还用来表示缩进。多层级的代码有没有缩进，其实对于编译器来说并没有差别，没有缩进的代码也是完全可以运行的。强调代码缩进，只是为了增强代码可读性，便于区分代码块。
大多数 C 语言的风格要求是，下一级代码比上一级缩进4个空格。为了书写的紧凑，本书采用缩写两个空格。
```
// 缩进四个空格
if (x > 0)
    printf("positive\n");
// 缩进两个空格
if (x > 0)
  printf("positive\n");
```
只包含空格的行被称为空白行，编译器会完全忽略该行。

注释

注释是对代码的说明，编译器会忽略注释，也就是说，注释对实际代码没有影响。
C 语言的注释有两种表示方法。第一种方法是将注释放在/*...*/之间，内部可以分行。
```
/* 注释 */
/*
  这是一行注释
* /
```

这种注释可以插在行内。

int open(char* s /* file name */, int mode);

上面示例中，/* file name */用来对函数参数进行说明，跟在它后面的代码依然会有效执行。

这种注释一定不能忘记写结束符号*/，否则很导致错误。

printf("a "); /* 注释一
printf("b ");
printf("c "); /* 注释二 */
printf("d ");

上面示例的原意是，第一行和第三行代码的尾部，有两个注释。但是，第一行注释忘记写结束符号，导致注释一延续到第三行结束。
第二种写法是将注释放在双斜杠//后面，从双斜杠到行尾都属于注释。这种注释只能是单行，可以放在行首，也可以放在一行语句的结尾。这是 C99 标准新增的语法。
```
// 这是一行注释
int x = 1; // 这也是注释
```
不管是哪一种注释，都不能放在双引号里面。双引号里面的注释符号，会成为字符串的一部分，解释为普通符号，失去注释作用。
```
printf("// hello /* world */ ");
```
上面示例中，双引号里面的注释符号，都会被视为普通字符，没有注释作用。
编译时，注释会被替换成一个空格，所以min/* space */Value会变成min Value，而不是minValue。

printf()

基本用法

本书的示例会大量用到printf()函数，这里先介绍一下这个函数。

printf()的作用是将参数文本输出到屏幕。它名字里面的f代表format（格式化），表示可以定制输出文本的格式。
```
printf("Hello World");
```
上面命令会在屏幕上输出一行文字“Hello World”。
printf()不会在行尾自动添加换行符，运行结束后，光标就停留在输出结束的地方，不会自动换行。为了让光标移到下一行的开头，可以在输出文本的结尾，添加一个换行符\n`。
```
printf("Hello World\n");
```
如果文本内部有换行，也是通过插入换行符来实现。
```
printf("Hello\nWorld\n");
```
上面示例先输出一个Hello，然后换行，在下一行开头输出World，然后又是一个换行。
上面示例也可以写成两个printf()，效果完全一样。
```
printf("Hello\n");
printf("World\n");
```
printf()是在标准库的头文件stdio.h定义的。使用这个函数之前，必须在源码文件头部引入这个头文件。
```
#include <stdio.h>
int main(void) {
  printf("Hello World\n");
}
```
上面示例中，只有在源码头部加上#include <stdio.h>，才能使用printf()这个函数。#include指令的详细解释，请看《 16. 预处理器》一章。

占位符

printf()可以在输出文本中指定占位符。所谓“占位符”，就是这个位置可以用其他值代入。
```
// 输出 There are 3 apples
printf("There are %i apples\n", 3);
```
上面示例中，There are %i apples\n是输出文本，里面的%i就是占位符，表示这个位置要用其他值来替换。占位符的第一个字符一律为百分号%，第二个字符表示占位符的类型，%i表示这里代入的值必须是一个整数。
printf()的第二个参数就是替换占位符的值，上面的例子是整数3替换%i。执行后的输出结果就是There are 3 apples。
常用的占位符除了%i，还有%s表示代入的是字符串。
```
printf("%s will come tonight\n", "Jane");
```
上面示例中，%s表示代入的是一个字符串，所以printf()的第二个参数就必须是字符串，这个例子是Jane。执行后的输出就是Jane will come tonight。

输出文本里面可以使用多个占位符。

printf("%s says it is %i o'clock\n", "Ben", 21);

上面示例中，输出文本%s says it is %i o'clock有两个占位符，第一个是字符串占位符%s，第二个是整数占位符%i，分别对应printf()的第二个参数（Ben）和第三个参数（21）。执行后的输出就是Ben says it is 21 o'clock。
printf()参数与占位符是一一对应关系，如果有n个占位符，printf()的参数就应该有n + 1个。如果参数个数少于对应的占位符，printf()可能会输出内存中的任意值。
printf()的占位符有许多种类，与 C 语言的数据类型相对应。下面按照字母顺序，列出常用的占位符，方便查找，具体含义在后面章节介绍。
- %a：浮点数。
- %A：浮点数。
- %c：字符。
- %d：十进制整数。
- %e：使用科学计数法的浮点数，指数部分的e为小写。
- %E：使用科学计数法的浮点数，指数部分的E为大写。
- %i：整数，基本等同于%d。
- %f：小数（包含float类型和double类型）。
- %g：6个有效数字的浮点数。整数部分一旦超过6位，就会自动转为科学计数法，指数部分的e为小写。
- %G：等同于%g，唯一的区别是指数部分的E为大写。
- %hd：十进制 short int 类型。
- %ho：八进制 short int 类型。
- %hx：十六进制 short int 类型。
- %hu：unsigned short int 类型。
- %ld：十进制 long int 类型。
- %lo：八进制 long int 类型。
- %lx：十六进制 long int 类型。
- %lu：unsigned long int 类型。
- %lld：十进制 long long int 类型。
- %llo：八进制 long long int 类型。
- %llx：十六进制 long long int 类型。
- %llu：unsigned long long int 类型。
- %Le：科学计数法表示的 long double 类型浮点数。
- %Lf：long double 类型浮点数。
- %n：已输出的字符串数量。该占位符本身不输出，只将值存储在指定变量之中。
- %o：八进制整数。
- %p：指针。
- %s：字符串。
- %u：无符号整数（unsigned int）。
- %x：十六进制整数。
- %zd：size_t类型。
- %%：输出一个百分号。

输出格式

printf()可以定制占位符的输出格式。

限定宽度
- printf()允许限定占位符的最小宽度。
```
printf("%5d\n", 123); // 输出为 "  123"
```
- 上面示例中，%5d表示这个占位符的宽度至少为5位。如果不满5位，对应的值的前面会添加空格。
- 输出的值默认是右对齐，即输出内容前面会有空格；如果希望改成左对齐，在输出内容后面添加空格，可以在占位符的%的后面插入一个-号。
```
printf("%-5d\n", 123); // 输出为 "123  "
```
- 上面示例中，输出内容123的后面添加了空格。
- 对于小数，这个限定符会限制所有数字的最小显示宽度。
```
// 输出 "  123.450000"
printf("%12f\n", 123.45);
```
- 上面示例中，%12f表示输出的浮点数最少要占据12位。由于小数的默认显示精度是小数点后6位，所以123.45输出结果的头部会添加2个空格。
总是显示正负号
- 默认情况下，printf()不对正数显示+号，只对负数显示-号。如果想让正数也输出+号，可以在占位符的%后面加一个+。
```
printf("%+d\n", 12); // 输出 +12
printf("%+d\n", -12); // 输出 -12
```
- 上面示例中，%+d可以确保输出的数值，总是带有正负号。
限定小数位数
- 输出小数时，有时希望限定小数的位数。举例来说，希望小数点后面只保留两位，占位符可以写成%.2f。
```
// 输出 Number is 0.50
printf("Number is %.2f\n", 0.5);
```
- 上面示例中，如果希望小数点后面输出3位（0.500），占位符就要写成%.3f。
- 这种写法可以与限定宽度占位符，结合使用。
```
// 输出为 "  0.50"
printf("%6.2f\n", 0.5);
```
- 上面示例中，%6.2f表示输出字符串最小宽度为6，小数位数为2。所以，输出字符串的头部有两个空格。
- 最小宽度和小数位数这两个限定值，都可以用*代替，通过printf()的参数传入。
```
printf("%*.*f\n", 6, 2, 0.5);
// 等同于
printf("%6.2f\n", 0.5);
```
- 上面示例中，%*.*f的两个星号通过printf()的两个参数6和2传入。
输出部分字符串
- %s占位符用来输出字符串，默认是全部输出。如果只想输出开头的部分，可以用%.[m]s指定输出的长度，其中[m]代表一个数字，表示所要输出的长度。
```
// 输出 hello
printf("%.5s\n", "hello world");
```
- 上面示例中，占位符%.5s表示只输出字符串“hello world”的前5个字符，即“hello”。

标准库，头文件

程序需要用到的功能，不一定需要自己编写，C 语言可能已经自带了。程序员只要去调用这些自带的功能，就省得自己编写代码了。举例来说，printf()这个函数就是 C 语言自带的，只要去调用它，就能实现在屏幕上输出内容。
C 语言自带的所有这些功能，统称为“标准库”（standard library），因为它们是写入标准的，到底包括哪些功能，应该怎么使用的，都是规定好的，这样才能保证代码的规范和可移植。
不同的功能定义在不同的文件里面，这些文件统称为“头文件”（header file）。如果系统自带某一个功能，就一定还会自带描述这个功能的头文件，比如printf()的头文件就是系统自带的stdio.h。头文件的后缀通常是.h。
如果要使用某个功能，就必须先加载对应的头文件，加载使用的是#include命令。这就是为什么使用printf()之前，必须先加载stdio.h的原因。
```
#include <stdio.h>
```
注意，加载头文件的#include语句不需要分号结尾，详见《 16. 预处理器》一章。

下一节：C 语言最初是作为 Unix 系统的开发工具而发明的。