今天来聊一聊字符集和字符编码。
首先来解释一下啥是字符,实际上字符就是一些文字和符号,这个比较容易理解。例如:666,绪哥,nice,@&!都可以称作字符!
字符集,从字面上拆解是不是“字符的集合”呢?
嘿嘿,的确是滴,字符集(charset)就是字符的集合。
字符集是和某一种特定的语言文字相对应的,比如英文字符集、汉字字符集等。
我们都晓得,所有的字符都是要显示出来呈现给人看的。
但是计算机在存储的时候,计算机只识别0和1这样的二进制数字,所以需要把这些字符跟二进制数字对应起来。
怎么对应呢?这就需要各种不同的编码来实现了,比如说将小写字母a通过ASCII码的形式整成01000001。
当然了,除了ASCII码还有其他的编码方式。
ASCII是对数字、英文字母、符号进行编码。
GB2312针对的是中文,UTF-8是针对所有语言的。(UTF-8非常流行)
咱们访问一个网页的时候,有时候会出现这么一个情况,这个网页内容乱码了。
原因就是这个网页的html文件的源文件声明中的编码和该文件保存时的编码不一致,不一致就会出现乱码。