对于更多紧凑的数据,C 程序可以用独立的位或多个组合在一起的位来存储信息。文件访问许可就是一个常见的应用案例。位运算符允许对一个字节或更大的数据单位中独立的位做处理:
整数类型的位模式由一队按位置从右到左编号的位组成,位置编号从 0 开始,这是最低有效位(least significant bit)。例如,考虑字符值'*',它的 ASCII 编码为 42,相当于二进制的 101010:
位模式 0 0 1 0 1 0 1 0
位位置 7 6 5 4 3 2 1 0
在本例中,值 101010 被表示成一个 8 位的字节内容,因此前面多两个 0。
布尔位运算符
表 1 中列举的运算符可以对操作数的每个位进行布尔运算。这种二元运算符把两个不同操作数内相同位置的位关联起来。被设定的位(也就是值为 1 的位)被解释为 true,被清除的位(也就是值为 0 的位)被解释为 false。除布尔运算符 AND、OR 和 NOT 以外,也有位异或运算符(exclusive-OR,XOR)。这些都在表 1 进行了列举。
位运算符的操作数必须是整数类型,并且遵循寻常算术转换(usualarithmetic conversion)。转换后获得的操作数通用类型就是整个计算结果的类型。表 2 展示了这些运算符的效果。
可以将一个整数 a 的特定位清除,做法是将整数 a 和另一个整数进行位 AND 运算,其中,另一个整数在需要清除的位为 0,其他位则为 1,并位 AND 运算,其中,另一个整数在需要清除的位为 0,其他位则为 1,并将 AND 运算的结果赋值给整数 a。
该另一个整数,即位 AND 运算的第二个操作数,被设定为 1 的位置(称为位掩码),这些位置经过位 AND 运算,不会改变第一个操作数对应位置的值。例如,一个整数与一个位掩码 0xFF 进行位 AND 运算后,将保留最低位置的 8 个位,而会清除其他所有位的值:
a &= OxFF; // 相当于:a = a & OxFF;
在该示例中,复合赋值运算符 &= 也会执行 & 运算。复合赋值运算符与其他二元位运算符具有类似的执行方式,这里不再赘述。
位运算符也可以用来生成位掩码,以供以后的位运算使用。例如,在位模式 0x20 中,只有位5被设定。因此表达式 ~0x20 会生成一个只有位 5 没有被设定的位掩码:
a &= ~0x20; // 清除a中的位5位掩码 ~0x20 比 0xFFFFFFDF 更受欢迎,因为它的可移植性更好:结果不会受到机器字大小的影响(同时也更方便人阅读)。
也可以使用运算符 |(OR)和 ^(XOR)来设定或清除特定位,下面是一个示例:
int mask = OxC; a |= mask; // 设定a的位2和位3 a ^= mask; // 求反a的位2和位3
第二个转换使用相同的位掩码,它会将第一次转换的结果再反转一次。换句话说,b^mask^mask 会得到原来 b 的值。这个操作可以用于交换两个整数的值,而不需要使用第三个临时变量:
a ^= b; // 等效于 a = a ^ b; b ^= a; // 将a原来的值赋值给b a ^= b; // 将b原来的值赋值给a
本例中的前两个表达式等同于 b=b^(a^b)或 b=(a^b)^b。其结果等同于 b=a,副作用是 a 的值也被修改了,其修改后的值为 a^b。在这时,第三个表达式具有如下副作用 a=(a^b)^a 或 a=b(使用 a 和 b 的原始值)。
移位运算符
移位运算符将左操作数的位模式移动数个位置,至于移动几个位置,由右操作数指定。它们如表 3 列举。移位运算符的操作数必须是整数。在实际移位操作之前,两个操作数都要进行整数提升(promotion)。右边操作数不可以为负值,并且必须少于左边操作数在整数提升之后的位长。如果不符合这些条件,程序运行结果将无法确定。
移位运算结果的类型等于左操作数在整数提升后的类型。下面示例的移位表达式具有 unsigned long 类型。
unsigned long n = 0xB, // 位模式: 0 ... 0 0 0 1 0 1 1 result = 0; result = n << 2; // 0 ... 0 1 0 1 1 0 0 result = n >> 2; // 0 ... 0 0 0 0 0 1 0
在向左移位运算时,右边多出来的位用 0 来填充。移动超出左边边界的位则直接抛弃。向左移动 y 个位置,就等同于将左操作数乘以 2^{y}:如果左操作数 x 是无符号类型,那么表达式 x<<y 的结果等于表达式 x×2^{y} 的值。因此,在前面的例子,n<<2 的值为 n×4,也就是 44。
在向右位移运算时,如果左操作数是无符号类型,或者左操作数是带符号类型但为非负值,则左边多出来的位用 0 来填充。在这种情况下,表达式 x>>y 的结果等效于表达式 x/2^{y} 的值。如果左操作数是负值,那么由编译器决定用于填充至左边多出来的位的内容,可能是 0,也可能是符号位。
// 函数setBit() // 设定掩码m中p位置的位。 // 使用定义在limits.h中的CHAR_BIT,存储一个字节内的位的数目。 // 返回值: 完成位设定的新掩码,其中p位置已设定好 // 如果p不是有效的位置,则返回原始掩码。 unsigned int setBit( unsigned int mask, unsigned int p ) { if ( p >= CHAR_BIT * sizeof(int) ) return mask; else return mask | (1<<p); }
移位运算符的优先级比算术运算符的优先级更低,但相对于比较运算符以及其他的位操作运算符,具有更高的优先级。上例表达式 mask|(1<<p)中的括号必要性不大,主要是让程序代码更容易阅读。