研究了下黄狗输入法超大字符集版的码表,觉得真是不错。
第一是全,CJK汉字基本搜罗殆尽,各种生僻字、古文用字基本尽在掌握。
第二是井然有序。系统码表、CJK、CJKA-I、符号编码、emoji、快捷命令、用户码表等等分门别类,不至于一团乱帐。哪里缺了什么或者错误出自哪里,容易定位修改,心中有数。非常非常好。早期有过其它符号、字符隐匿于系统码表的,容易产生乱帐,天下一统之前,分门别类,非常非常好。
好处还有很多,不一一列举。
要说还可以改进的地方,个人觉得有两点:
一是系统码表93912条,其中二字及以上词比较多,达82323条,不少词条没有必要,聊作充数。不过词库巨大,个人修改的话工程浩繁,作为公共词库,众口难调,取舍标准难以统一,先这么用着吧,也无大碍。
二是个别零碎处,举个栗子,【官】这个字五笔编码达6条之多,历来86五笔的正规全码是pnhn,二简是pn,有这两个编码足够了。黄狗加了三简pnh,似无必要。另外又加了容错码phnn及其二简ph三简phn。这种做法少见。使码表产生不必要的膨胀,而且助长歪风邪气。容错码不是不可以用,最好严格谨慎,不得已而用之。
说到这里,顺便说个字的编码,以前有朋友提过的【㓁】一般来说是pwu,不过pqb亦可,放眼世界,只是同字不同形而已。
作了一个简单统计,以供同仁参考,如有错误敬请不吝指正。
其实这样的科普如果由楼主M大佬亲自来做是最合适不过了。