(C语言)signed和unsigned类型转化

本文介绍了C语言中signed和unsigned数据类型的差异,包括它们如何影响数值解析、二进制表示、高位补足以及在类型转换时可能出现的问题。讨论了在使用printf输出时的注意事项,以及如何通过显式转换避免潜在的错误。最后提供了一个综合性的代码示例,展示了在不同环境和编译器下可能出现的行为。

于long, int, short, char等数据类型,我们可以通过signed和unsigned修饰来确定其能存储的数据范围。其中signed中保存的数据是可正可负,而unsigned的数据范围是0-对应数据类型的上限。

平时我们声明:int a的时候,默认a是一个signed类型的,也就是a可能是正值也可以是负值。

而在使用诸如printf函数的输出的时候,也需要注意输出的控制字符,即便声明的时候为:unsigned int a, 但是如果用printf("%d", a);进行输出,那么C语言在编译的时候会有一个隐性的转换,从而等同于:printf("%d", (signed)a);的结果。所以要输出一个unsigned int的值,需要使用printf("%u", a);的方式。

实际上无论是signed还是unsigned的方式,对于数据的二进制本身都是没有任何影响的,只是处理不同而已。比如:一个数据如果在内存中的二进制编码为:1001 0101,那么当使用signed进行解析的时候,高位的1,即:【1】001 0101,被看成了符号位。而当使用unsigned进行解析的时候高位的1和其他位上的1没有任何区别,都是用于存储数据的。在使用补码存储负数的情况下:

signed 1001 0101 = -107;

unsigned 1001 0101 = 149。

另外一个signed与unsigned在补足高位的时候也有一个显著的区别:

1、如果是一个signed的数据类型,那么在高位会按照符号位来进行补足,比如:1001 0101如果保存在两个字节中,那么结果是:1111 1111 1001 0101;

2、如果是一个unsigned的数据类型,那么在高位将直接补0,比如:1001 0101如果保留在两个字节中,那么结果是:0000 0000 1001 0101。

不同的补足方式,如果在后续的操作中将signed和unsigned进行转化,显示的结果也许会和你预想的大相径庭。

最后再补充一点,在数据进行signed和unsigned的转换时,默认是转化为int类型,而非你定义的类型,如:

short s = 10;

printf("%u", (unsigned) s); //这句话等价与:printf("%u", (unsigned int)s); 这就会导致前面提到的高位补数的问题,从而显示结果也许与预想不同。

所以如果你对数据占几个字节很了解,那么为了防止高位部位从而可能带来不必要的问题,还是进行显式的转换:

printf("%u", (unsigned short) s);

当然正如会出现高位补数的情况,也可能因为存储空间的减少而出现截断的现象,如:

printf("%u", (unsigned char) s); //short 一般占2个字节,而char仅仅占一个字节,这个时候s中的高位8位将丢失,仅仅保留低位的8位。

以下是以上叙述的一个段综合性代码:

环境:

1、Windows Home Ed SP3;

2、 Visual Studio C++ 6.0 Enterprise Ed。

/*
Date: 2011-08-03
Author: garyHost;
Description: 查看使用(unsigned char)ch 方式以及 (unsigned)ch的区别; 
Remarks: 1) 
*/
#include <stdio.h>
#include <stdlib.h>
#include "myTools.h"

#define _STRING_END_FLAG '\0' //字符串休止符号;

//将字符转化为对应的数值;
int getNumberByChar(char ch)
{
	if (NULL != ch)
	{
		if ('0' == ch)
		{
			return (0);
		}
		else if ('1' == ch)
		{
			return (1);
		}
		else
		{
			exit(-3);
		}
	}
	else
	{
		exit(-2);
	}
}

//将二进制代码转化为unsigned的整型值;
unsigned int convertBtoUnsignedD(char * bCode)
{
	if (NULL != bCode && bCode[0] != _STRING_END_FLAG)
	{
		unsigned int result = 0;
		int count = 1;
		int times = 0;
		char chBit = bCode[0];

		while (chBit != _STRING_END_FLAG)
		{
			chBit = bCode[++count];
		}

		for (int i = count - 1; i >= 0; i--)
		{
			int number = getNumberByChar(bCode[i]);
			if (1 == number)
			{
				int tempValue = 1;
				for (int j = 0; j < times; j++)
				{
					tempValue *= 2;
				}

				result += tempValue;
			}

			times++;
		}

		return (result);
	}
	else
	{
		exit(-3);
	}
}

//将二进制代码转化为int类型;(带符号的整型)
//包含二进制编码的字符串指针;
int convertBtoD(char * bCode)
{
	if (NULL != bCode && bCode[0] != _STRING_END_FLAG)
	{
		const int MAX_CODE_LENGTH = 20;
		int result = 0;
		char chBit = bCode[0];
		char strCode[MAX_CODE_LENGTH];
		int count = 0;

		//1、判断二进制代码的符号;
		if ('1' == bCode[0])
		{
			//如果是负数,那么需要先求其补码;
			while (chBit != _STRING_END_FLAG)
			{
				if (count < MAX_CODE_LENGTH)
				{
					//1、逐项取反;
					strCode[count] = (('0' == chBit) ? '1' : '0');
				}
				else
				{
					exit(-1);
				}

				chBit = bCode[++count];
			}

			//增加字符串结束标识符;
			strCode[count] = _STRING_END_FLAG;

			//2、末项+1;
			for (int i = count - 1; i >= 0; i--)
			{
				if ('0' == strCode[i])
				{
					strCode[i] = '1';
					break;
				}
				else
				{
					strCode[i] = '0';
				}
			}

			//3、将得到的补码转化成无符号的十进制代码;
			result = convertBtoUnsignedD(strCode);
			//4、将绝对值加上符号;
			return (0 - result);
		}
		else
		{
			return (convertBtoUnsignedD(bCode));
		}
	}
	else
	{
		exit(-4);
	}
}

int main(void)
{
	printf("测试半角字符(即:可以用一个字节表示)的转化情况...\n\n");
	short ch = 'F';	  //十六进制编码为:46 <=> 0000 0000 0100 0110;十进制编码:70;

	printf("char: ch = %c\n\n", ch);
	printf("hex: ch = %#x\n\n", ch);
	printf("(unsigned char) ch = %u\n\n", (unsigned char)ch); 
	printf("(unsigned) ch = %u\n\n", (unsigned) ch);
	printf("(short) ch = %d\n\n", (short) ch);
	printf("ch = %d\n\n", ch); //隐式的(int)ch,结果和(int)ch一致;

	showSplitLine();

	printf("测试全角字符(如:汉字)的转化情况...\n\n");
	short wch = '你'; //十六进制编码为:0xC4E3 <=> 1100 0100 1110 0011
	//unsigned wch = '你';

	printf("char: wch = %c\n\n", wch); //会被截断;
	printf("hex: wch = %#x\n\n", wch);
	printf("(unsigned char) wch = %u\n\n", (unsigned char)wch); //由于这里有char进行修饰,所以这里会有截断,仅仅保留最低的8个位(最后一个字节),所以结果为:1110 0011 = 27d
	printf("(unsigned) wch = %u\n\n", (unsigned) wch); //(unsigned) <=> (unsigned int) 而int是有4个字节保存的,所以会在高位的两个字节补1,从而形成一个很大的数据:4294952163;高位补1(即:按照符号位补充)是因为声明的wch为short是有符号的类型,如果声明为:unsigned short就不会有这个问题;
	printf("(unsigned short) wch = %u\n\n", (unsigned short) wch);
	//printf("(short) wch = %d\n\n", (short) wch); 
	printf("wch = %d\n\n", wch);

	showSplitLine();

	printf("从二进制到整型(0000000001000110)\n\n"); //'F'的二进制编码;
	int result1 = convertBtoD("0000000001000110");
	printf("result1 = %d\n\n", result1);

	printf("从二进制到整型(负数)(1100010011100011)\n\n"); //'你'的二进制编码;(16位, short)
	int result2 = convertBtoD("1100010011100011");
	printf("(signed) result2 = %d\n\n", result2);
	int result3 = convertBtoUnsignedD("1100010011100011");
	printf("(unsigned) result3 = %d\n\n", result3);
	unsigned int result4 = convertBtoUnsignedD("11111111111111111100010011100011"); //'你'的二进制编码;(32位, int)
	printf("(unsigned) result4 = %u\n\n", result4); 

	showSplitLine();

	return (0);
}
myTools.h:
#include <stdio.h>

//分割线;
void showSplitLine(void)
{
	printf("********************************************************************************\n\n");
	return;
}


 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值