引言
在学C++或者Java的时候应该都会先了解各种基本数据类型的初值和它们的取值范围,有些人可能会不太重视这块内容,其实很重要,很多大公司面试的过程中都会问到int的取值范围,溢出之后会怎么样等问题。
正文
基本数据类型
上图可以看到c++和java之间的基本数据类型的区别,java多了一类布尔类型的数据。本文主要介绍int的取值范围,int数据类型在c++和java中都存在,是一种比较常用的数据类型。
int的取值范围为:-2^31 —- 2^31-1 ,即:-2147483648 – 2147483647
那么为什么会这样取值呢?
在计算机当中数据都是以01二进制形式存储的,而整型变量int占的是4个字节,一个字节8位,也就是32位,所以一个整型变量在计算机当中其实可以用32位的二进制来表示。
正整数
比如1这个整型变量,用二进制可以表示为(int是带符号的整型变量):
0000 0000 | 0000 0000 | 0000 0000 | 0000 0001 (第一位为符号位)
以上为正数1的原码(每8位为一个字节所以正好占4个字节) 。注:正整数用原码表示,负整数用补码表示,正整数的原码和补码相同。
所以用32位二进制数可表示的最大正整数为:
0111 1111 | 1111 1111 | 1111 1111 | 1111 1111 即:2^31-1=2147483647 因为是正整数,所以第一位符号位是0;全0的情况最后讨论。
负整数
同理-1这个负的整型变量在内存中用二进制可以表示为
1000 0000 | 0000 0000 | 0000 0000 | 0000 0001 (负数-1的原码),但是负整数在计算机中是用补码表示的,所以要把这个原码转化成补码,补码就是原码除符号位之外取反后加1。
1111 1111 | 1111 1111 | 1111 1111 | 1111 1110 (-1反码),再对反码加1
1111 1111 | 1111 1111 | 1111 1111 | 1111 1111 (-1补码)
同理计算机中用32位二进制数可表示的最小负整数为:
1111 1111 | 1111 1111 | 1111 1111 | 1111 1111(-2147483648原码)
1000 0000 | 0000 0000 | 0000 0000| 0000 0000 (-2147483648反码)
1000 0000 | 0000 0000 | 0000 0000| 0000 0001 (-2147483648补码)
零
此外还有两种情况没有包含进去:
+0:
0000 0000 | 0000 0000 | 0000 0000| 0000 0000
即整数为0这种情况,在二进制中0可以表示为-0和+0这两种情况,但是0只有一个,所以取二进制全为0这种情况表示整数0;
-0:
1000 0000 | 0000 0000 | 0000 0000| 0000 0000 (原码)
即-0,反码表示为:
1111 1111 | 1111 1111 | 1111 1111 | 1111 1111
-0补码为反码加1,则补码为:
1 0000 0000 | 0000 0000 | 0000 0000| 0000 0000 第一位1舍去即:
0000 0000 | 0000 0000 | 0000 0000| 0000 0000,所以+0和-0的原码是一样的。
程序验证
最后来考虑如果取int的值超过这个范围的情况,以下为程序来验证:
#include<iostream>
using namespace std;
int main()
{int i=2147483647;int j=2147483648;int k=2147483649;cout<<i<<endl;cout<<j<<endl;cout<<k<<endl;return 0;
}
输出结果
从上图输出结果来看,可以看到一个很有趣的结果,当正整数超出2147483647范围后出现了循环取值的现象,即2147483648溢出后回到了最小负整数-2147483648,2147483649溢出后变成了-2147483648+1=-2147483647,依次类推。
所以2147483649可以表示为-2147483648+1,1000 0000 | 0000 0000 | 0000 0000 | 0000 0000 + 0000 0000 | 0000 0000 | 0000 0000 | 0000 0001 = 1000 0000 | 0000 0000 | 0000 0000 | 0000 0001
所以int整型溢出后可以用这样的方式类推。