Htons():【摘自百度百科】
htons是將整型變量從主機字節順序轉變成網絡字節順序, 就是整數在地址空間存儲方式變為:高位字節存放在內存的低地址處。
網絡字節順序是TCP/IP中規定好的一種數據表示格式,它與具體的CPU類型、操作系統等無關,從而可以保證數據在不同主機之間傳輸時能夠被正確解釋,網絡字節順序采用big-endian排序(大尾順序)方式。
因為項目中需要,設定例如來自端口號為9877的數據要做些什么處理,在上層設置了9877這個數字,但是讀取TCP頭部(TCP頭部的前十六字節為源端口號),發現不是原想的9877這個數,而是38182。
因為他是傳入9877,通過htons()函數轉變為網絡字節順序(見上),也就能理解為何網絡編程時候會使用:servaddr.sin_port=htons(9877);
但是因為在開發板的內核中,無法直接調用這個函數,所以需要自己實現該功能,結合網上查找,方法實現如下:#define BigLittleSwap16(A) ((((uint16)(A) & 0xff00) >> 8) | (((uint16)(A) & 0x00ff) << 8))
int checkCPUendian()
{
union{
unsigned long int i;
unsigned char s[4];
}c;
c.i = 0x12345678;
return (0x12 == c.s[0]);
}
unsigned short int HtoNs(unsigned short int h)
{
return checkCPUendian() ? h : BigLittleSwap16(h);
}Part 1: htons函數具體解釋
在Linux和Windows網絡編程時需要用到htons和htonl函數,用來將主機字節順序轉換為網絡字節順序。
在Intel機器下,執行以下程序int main()
…{
printf(“%d /n”,htons(16));
return 0;
}
得到的結果是4096,初一看感覺很怪。解釋如下,數字16的16進制表示為0x0010,數字4096的16進制表示為0x1000。 由於Intel機器是小尾端,存儲數字16時實際順序為1000,存儲4096時實際順序為0010。因此在發送網絡包時為了報文中數據為0010,需要經過htons進行字節轉換。如果用IBM等大尾端機器,則沒有這種字節順序轉換,但為了程序的可移植性,也最好用這個函數。
另外用注意,數字所占位數小於或等於一個字節(8 bits)時,不要用htons轉換。這是因為對於主機來說,大小尾端的最小單位為字節(byte)。
Part 2: 大小端模式
不同的CPU有不同的字節序類型 這些字節序是指整數在內存中保存的順序 這個叫做主機序
最常見的有兩種
1. Little endian:將低序字節存儲在起始地址
2. Big endian:將高序字節存儲在起始地址
LE little-endian
最符合人的思維的字節序
地址低位存儲值的低位
地址高位存儲值的高位
怎么講是最符合人的思維的字節序,是因為從人的第一觀感來說
低位值小,就應該放在內存地址小的地方,也即內存地址低位
反之,高位值就應該放在內存地址大的地方,也即內存地址高位
BE big-endian
最直觀的字節序
地址低位存儲值的高位
地址高位存儲值的低位
為什么說直觀,不要考慮對應關系
只需要把內存地址從左到右按照由低到高的順序寫出
把值按照通常的高位到低位的順序寫出
兩者對照,一個字節一個字節的填充進去
例子:在內存中雙字0x01020304(DWORD)的存儲方式
內存地址
4000 4001 4002 4003
LE 04 03 02 01
BE 01 02 03 04
例子:如果我們將0x1234abcd寫入到以0x0000開始的內存中,則結果為
big-endian little-endian
0x0000 0x12 0xcd
0x0001 0x23 0xab
0x0002 0xab 0x34
0x0003 0xcd 0x12
x86系列CPU都是little-endian的字節序.
網絡字節順序是TCP/IP中規定好的一種數據表示格式,它與具體的CPU類型、操作系統等無關,從而可以保證數據在不同主機之間傳輸時能夠被正確解釋。網絡字節順序采用big endian排序方式。
為了進行轉換 bsd socket提供了轉換的函數 有下面四個
htons 把unsigned short類型從主機序轉換到網絡序
htonl 把unsigned long類型從主機序轉換到網絡序
ntohs 把unsigned short類型從網絡序轉換到主機序
ntohl 把unsigned long類型從網絡序轉換到主機序
在使用little endian的系統中 這些函數會把字節序進行轉換
在使用big endian類型的系統中 這些函數會定義成空宏
同樣 在網絡程序開發時 或是跨平台開發時 也應該注意保證只用一種字節序 不然兩方的解釋不一樣就會產生bug.
注:
1、網絡與主機字節轉換函數:htons ntohs htonl ntohl (s 就是short l是long h是host n是network)
2、不同的CPU上運行不同的操作系統,字節序也是不同的,參見下表。
處理器 操作系統 字節排序
Alpha 全部 Little endian
HP-PA NT Little endian
HP-PA UNIX Big endian
Intelx86 全部 Little endian
Motorola680x() 全部 Big endian
MIPS NT Little endian
MIPS UNIX Big endian
PowerPC NT Little endian
PowerPC 非NT Big endian
RS/6000 UNIX Big endian
SPARC UNIX Big endian
IXP1200 ARM核心 全部 Little endian
Part 3: 模擬htonl、ntohl、htons、ntohs函數實現
今天在如鵬網里討論htonl、ntohl在不同機器的區別,特意模擬了htonl、ntohl、htons、ntohs函數實現。
實現如下:typedef unsigned short int uint16;
typedef unsigned long int uint32;
// 短整型大小端互換
#define BigLittleSwap16(A) ((((uint16)(A) & 0xff00) >> 8) | /
(((uint16)(A) & 0x00ff) << 8))
// 長整型大小端互換
#define BigLittleSwap32(A) ((((uint32)(A) & 0xff000000) >> 24) | /
(((uint32)(A) & 0x00ff0000) >> 8) | /
(((uint32)(A) & 0x0000ff00) << 8) | /
(((uint32)(A) & 0x000000ff) << 24))
// 本機大端返回1,小端返回0
int checkCPUendian()
{
union{
unsigned long int i;
unsigned char s[4];
}c;
c.i = 0x12345678;
return (0x12 == c.s[0]);
}
// 模擬htonl函數,本機字節序轉網絡字節序
unsigned long int HtoNl(unsigned long int h)
{
// 若本機為大端,與網絡字節序同,直接返回
// 若本機為小端,轉換成大端再返回
return checkCPUendian() ? h : BigLittleSwap32(h);
}
// 模擬ntohl函數,網絡字節序轉本機字節序
unsigned long int NtoHl(unsigned long int n)
{
// 若本機為大端,與網絡字節序同,直接返回
// 若本機為小端,網絡數據轉換成小端再返回
return checkCPUendian() ? n : BigLittleSwap32(n);
}
// 模擬htons函數,本機字節序轉網絡字節序
unsigned short int HtoNs(unsigned short int h)
{
// 若本機為大端,與網絡字節序同,直接返回
// 若本機為小端,轉換成大端再返回
return checkCPUendian() ? h : BigLittleSwap16(h);
}
// 模擬ntohs函數,網絡字節序轉本機字節序
unsigned short int NtoHs(unsigned short int n)
{
// 若本機為大端,與網絡字節序同,直接返回
// 若本機為小端,網絡數據轉換成小端再返回
return checkCPUendian() ? n : BigLittleSwap16(n);
}