当前位置:首页 > 内存 > 正文

一个字大约多少内存

  • 内存
  • 2024-07-23 09:42:10
  • 4966

我们常说“一个字”占多少内存,其实并不准确。 因为一个字的实际大小取决于使用的码方式。 不同的码方式,会使用不同的字节数来表示一个字。


常见的字符码方式



  • ASCII:使用一个字节 (8 位) 表示一个字符,最多能表示 256 个字符,主要用于英文和一些特殊字符。

  • GB2312:使用两个字节 (16 位) 表示一个汉字,最多能表示 7000 多个汉字,是中大陆早期使用的标准。

  • GBK:使用两个字节 (16 位) 表示一个汉字,最多能表示 21000 多个汉字,是中大陆目前最常用的码方式。

  • UTF-8:使用可变字节数表示一个字符,英文使用一个字节,汉字使用三个字节,最多能表示 1112064 个字符,是目前际通用的码方式。


内存占用情况


码方式
一个字占用的内存
ASCII
1 字节
GB2312/GBK
2 字节
UTF-8
1~4 字节

总结


因此,想要确定一个字占多少内存,需要明确使用的码方式。 在日常开发中,我们通常使用 UTF-8 码,而一个汉字在 UTF-8 码下通常占用 3 个字节的内存。