虎绿林已支持 Unicode 14.0 中几乎所有汉字的显示
『回复列表(32|显示机器人聊天)』
汉字内码国家强制标准GB18030更新到2022版了,共87887个汉字,说会提供配套公共字库,期待。
GB18030和UTF-8一样也是一种Unicode转换格式(UTF),可以在GB18030和UTF-8/UTF-16等其他Unicode转换格式之间进行无损转换。所以GB18030字库也可以用于本站。此外,作为一种UTF,所有现存和未来新增的Unicode字符都可以用GB18030编码保存,包括各种emoji表情。
GB18030和GB2312/GBK一样,字母1字节,常用汉字2字节。不过和GB2312/GBK不同,它还有4字节编码模式,用于编码生僻字和其他所有不在GBK范围内的Unicode字符——这就是它的UTF部分。可以认为,GB18030是Unicode的一种特殊映射,分为两个部分:在GBK范围内的部分,采用查表定义;在GBK范围之外的部分,采用偏移变换规则定义。而这个偏移变换规则能够表示所有现有和未来的Unicode字符。
GB18030-2022全文强制执行对本站有什么影响?没有影响,本站目前很可能已经符合标准,可以正常存储和显示标准规定的87887个汉字(有待测试)。如果不能完全显示,等标准配套公共字库发布,本站就可以拿来显示了。
需要说明的是,标准全文强制执行并不是要求所有网站都使用GB18030编码格式输出页面,它要求的只是网站能正常存储和显示标准包含的汉字。所以,网站还是可以继续选用人民群众喜爱的UTF-8编码(又名GB13000)输出页面。只是为了达成87887个汉字的目标,数据库字段里的utf8
肯定要改成utf8mb4
了。
https://zhs.glyphwiki.org/wiki/Group:hu60_GlyphWikiFont-02A000
我会继续生成其他范围的字体,直到对Unicode汉字形成完整覆盖。