做外贸批发的网站seo优化有百度系和什么
ASCII 与 GBK
- ASCII:英文专用
- GBK:中文专用
万国码
- unicode想要统一这个世界上所有的语言,所以创造了UTF-32
- 但是使用32位,也就是4个字节,对于很多语言来说,过于奢侈,也会造成
通信效率
和存储效率
变低
UTF-8
- unicode 创造出来没人用,就很尴尬,就出现了
- utf-8 是Unicode改良的一种方案,采用
可变长编码
- 长度区间:1、2、3、4个字节长度
编码的时候,应该使用utf-8的编码格式,比较统一
注意
- gbk中文是2个字节,unicode字符中文是三个字节
- 因为很多编码都兼容ASCII,所以英文一般不会乱码
编码与解码
- 尽量使用第二种,指定编码格式,更加明确
// 编码 这个方法是属于String类的方法
bytes = str.getBytes(StandardCharsets.UTF_8);
// 解码 这个方法是属于String类的构造方案
String parseStr = new String(bytes, StandardCharsets.UTF_8);
System.out.println(parseStr);