CPC中文印刷社区

CPC中文印刷社区 (https://www.cnprint.org/bbs/index.php)
-   ◆- 黄狗五笔输入法 (https://www.cnprint.org/bbs/forumdisplay.php?f=197)
-   -   黄狗五笔超大字符集版发布,2024年02月11日开始支持Unicode 15.1 (https://www.cnprint.org/bbs/showthread.php?t=328367)

hlm12345 2024-07-17 07:17

读到一篇关于生僻字的文章:
引用:

「⿰牛马」,U+2ECFA
海南省地名用字,也是有一定使用范围的俗字。海南省儋州市、琼中县、定安县均有用例,证件使用人数至少在百人以上。
「⿱山𭃂」,U+2EC65
“岃”的异体字,广东省新丰县多个地名使用。
「⿱㓁林」,U+2EC05
“罧”的异体字。安徽省地名用字,行政村,使用人数2000余人。
「⿱兴土」,U+2EC21
广东省地名用字,使用人数应在千人以上。
「⿰牛居」,U+2ECFC
山东省烟台市龙口市地名用字,使用人数1000人左右。
「⿱㓁廾」,U+2ED87
“𢌷(U+22337)”的异体字,甘肃省地名用字,使用人数应在千人以上。
「⿰贝亅」,U+2EDCC
姓氏、地名用字。在山东省潍坊市奎文区,媒体多有报道。
「⿱相里」,U+2EDEE
姓氏,复姓“相里”的合字。
「⿱王玨」,U+2ED21
“圣”的俗字,典籍中也有。
「⿰香宾」,U+2EE40
“馪”的类推简化字,见于《信息交换用汉字编码字符集 第二辅助集》(GB/T 7589-1987),含义是“香气”。
院士姓名生僻字:朱永「⿰贝𥈠」,徐銤。
逐个试了试,一股自豪感不禁油然而生,我用黄狗输入法大字符集版,一个不落,全部都能打出。感谢老大。
V423.280对穀榖穀也进行了更新,真是从善如流啊!:red_heart:
————————————
上文中的
引用:

⿰⿲⿳⿱
我还是第一次注意到,用来表示文字结构挺高大上的,以前描述时我总是用括号(A上B下)(A左B右),现在感觉low爆了。
这样的字符到unicode15.1共收有16个,平时用到的大概就这么4个。
————————————
发现一些好玩的字符:
输入时间zztm:🕐1点🕜1点半……,是词组,不是单个字符,今天发现unicode存在这些字符:
㍘ ㍙ ㍚ ㍛ ㍜ ㍝ ㍞ ㍟ ㍠ ㍡ ㍢ ㍣ ㍤ ㍥ ㍦ ㍧ ㍨ ㍩ ㍪ ㍫ ㍬ ㍭ ㍮ ㍯ ㍰
㏠ ㏡ ㏢ ㏣ ㏤ ㏥ ㏦ ㏧ ㏨ ㏩ ㏪ ㏫ ㏬ ㏭ ㏮ ㏯ ㏰ ㏱ ㏲ ㏳ ㏴ ㏵ ㏶ ㏷ ㏸ ㏹ ㏺ ㏻ ㏼ ㏽ ㏾
————————————
然后发现unicode其它一些好玩的字符:
㍿ ㋿ ㍻ ㍼ ㍽ ㍾
这是合字,unicode12.1已经收入。
咱们中国也有,西周国王姬发,谥号为“武王”,合写成“珷”。
近代中国翻译国外科学文献,也曾大量制造合字,如“人工石”(混凝土)写成“砼”,“千瓦”“千克”“海里”“加仑”写成“瓩”“兛”“浬”“嗧”。
这些人真是会玩:big_smile:

hlm12345 2024-07-17 10:14

2 个附件
上面三个字我在记事本中全宋体显示的是,输入法候选字体用的默认jigmo,和我记事本中全宋体显示是一样的。
本页面中显示的是
奇怪,大概是字体字形的问题,挠头

wangyu1314 2024-07-17 10:32

引用:

作者: hlm12345 (帖子 2884274)
上面三个字我在记事本中全宋体显示的是,输入法候选字体用的默认jigmo,和我记事本中全宋体显示是一样的。
本页面中显示的是
奇怪,大概是字体字形的问题,挠头

无解,浏览器内核的问题,Unicode 汉字本来就是一堆大垃圾,10多万字了,让这些不用汉字的老外处理起来真是焦头烂额。

rebelrebel 2024-07-18 11:24

3 个附件
附件 502410
附件 502404
附件 502409
我是一个小白,请教楼主和诸位同好,这个问题,怎么解决?
还需要额外再安装什么字库吗?

wangyu1314 2024-07-18 11:52

引用:

作者: rebelrebel (帖子 2884429)
附件 502410
附件 502404
附件 502409
我是一个小白,请教楼主和诸位同好,这个问题,怎么解决?
还需要额外再安装什么字库吗?

无解,这问题你得给微软公司提意见,一是对最新的Unicode标准支持不好,二是字体技术有局限,一个字体最多只能包括65535个字符,一个字体根本装不下这么多的中文大字符,就算我们提供的相对完整的 Jigmo 字体也是分成3个字体的,在你的记事本或word里你需要将显示字体设置成 Jigmo Jigmo2 Jigmo3来进行测试,看看哪一个字体包含你输入的字符,换句话说,也才能正确显示你输入的字符。另外如果你没有真实的需求,建议你不要倒腾这个版本,实际工作中根本用不上,纯粹浪费时间。

rebelrebel 2024-07-18 12:49

引用:

作者: wangyu1314 (帖子 2884435)
无解,这问题你得给微软公司提意见,一是对最新的Unicode标准支持不好,二是字体技术有局限,一个字体最多只能包括65535个字符,一个字体根本装不下这么多的中文大字符,就算我们提供的相对完整的 Jigmo 字体也是分成3个字体的,在你的记事本或word里你需要将显示字体设置成 Jigmo Jigmo2 Jigmo3来进行测试,看看哪一个字体包含你输入的字符,换句话说,也才能正确显示你输入的字符。另外如果你没有真实的需求,建议你不要倒腾这个版本,实际工作中根本用不上,纯粹浪费时间。

是的,感谢您的回复
那些显示为框框的字,我感觉应该也是生僻字
sdf,是我随意敲的,发现是个框框,并不是我想要打某个字
我想,显示不出来就算了,不过是不是有办法让它也不要显示成框框?

rebelrebel 2024-07-18 15:26

2 个附件
引用:

作者: rebelrebel (帖子 2884443)
是的,感谢您的回复
那些显示为框框的字,我感觉应该也是生僻字
sdf,是我随意敲的,发现是个框框,并不是我想要打某个字
我想,显示不出来就算了,不过是不是有办法让它也不要显示成框框?

附件 502420
附件 502421
我把G、H、I三项清空了,输出时就不见框框了

wangyu1314 2024-07-18 15:50

引用:

作者: rebelrebel (帖子 2884473)
附件 502420
附件 502421
我把G、H、I三项清空了,输出时就不见框框了

大哥太聪明了,把脚砍了,就不用怕穿不上鞋了。我佩服得五体投地。:horror::horror:

river1010 2024-07-18 17:01

引用:

作者: wangyu1314 (帖子 2884479)
大哥太聪明了,把脚砍了,就不用怕穿不上鞋了。我佩服得五体投地。:horror::horror:

通过修改注册表,候选窗口可以全部关联显示。:nothing:

river1010 2024-07-18 17:03

引用:

作者: rebelrebel (帖子 2884473)
附件 502420
附件 502421
我把G、H、I三项清空了,输出时就不见框框了

引用:

作者: rebelrebel (帖子 2884443)
是的,感谢您的回复
那些显示为框框的字,我感觉应该也是生僻字
sdf,是我随意敲的,发现是个框框,并不是我想要打某个字
我想,显示不出来就算了,不过是不是有办法让它也不要显示成框框?

引用:

作者: wangyu1314 (帖子 2884435)
无解,这问题你得给微软公司提意见,一是对最新的Unicode标准支持不好,二是字体技术有局限,一个字体最多只能包括65535个字符,一个字体根本装不下这么多的中文大字符,就算我们提供的相对完整的 Jigmo 字体也是分成3个字体的,在你的记事本或word里你需要将显示字体设置成 Jigmo Jigmo2 Jigmo3来进行测试,看看哪一个字体包含你输入的字符,换句话说,也才能正确显示你输入的字符。另外如果你没有真实的需求,建议你不要倒腾这个版本,实际工作中根本用不上,纯粹浪费时间。

引用:

作者: wangyu1314 (帖子 2884479)
大哥太聪明了,把脚砍了,就不用怕穿不上鞋了。我佩服得五体投地。:horror::horror:

通过修改注册表,候选窗口可以全部关联显示。:bad_smile:

hlm12345 2024-07-18 21:00

1 个附件
引用:

作者: rebelrebel (帖子 2884429)
附件 502410
附件 502404
附件 502409
我是一个小白,请教楼主和诸位同好,这个问题,怎么解决?
还需要额外再安装什么字库吗?

我的全都可以正常显示,如图
需要安装大字符集字体,如全宋体,天珩字体,并且修改注册表,如 [MENTION=40147]river1010[/MENTION] 所言。

rebelrebel 2024-07-19 13:24

1 个附件
引用:

作者: river1010 (帖子 2884495)
通过修改注册表,候选窗口可以全部关联显示。:bad_smile:

附件 502450
感谢,已经下载并安装全宋体和天珩字体,并已经执行注册表
可是CJKExt_G还是不能显示,CJKExt_H和CJKExt_I可以了
是否哪里还需要设置?

river1010 2024-07-25 11:48

引用:

作者: hlm12345 (帖子 2884522)
我的全都可以正常显示,如图
需要安装大字符集字体,如全宋体,天珩字体,并且修改注册表,如 [MENTION=40147]river1010[/MENTION] 所言。

由于我是业余爱好水平,请兄台能否把你的相关修改的注册表分享一份上来帮助大家解决这个问题。谢谢!:shame:

river1010 2024-07-25 11:50

1 个附件
引用:

作者: rebelrebel (帖子 2884598)
附件 502450
感谢,已经下载并安装全宋体和天珩字体,并已经执行注册表
可是CJKExt_G还是不能显示,CJKExt_H和CJKExt_I可以了
是否哪里还需要设置?

看这里!:greedy:
附件 502666

hlm12345 2024-07-25 23:29

1 个附件
研究了下黄狗输入法超大字符集版的码表,觉得真是不错。
第一是全,CJK汉字基本搜罗殆尽,各种生僻字、古文用字基本尽在掌握。
第二是井然有序。系统码表、CJK、CJKA-I、符号编码、emoji、快捷命令、用户码表等等分门别类,不至于一团乱帐。哪里缺了什么或者错误出自哪里,容易定位修改,心中有数。非常非常好。早期有过其它符号、字符隐匿于系统码表的,容易产生乱帐,天下一统之前,分门别类,非常非常好。
好处还有很多,不一一列举。
要说还可以改进的地方,个人觉得有两点:
一是系统码表93912条,其中二字及以上词比较多,达82323条,不少词条没有必要,聊作充数。不过词库巨大,个人修改的话工程浩繁,作为公共词库,众口难调,取舍标准难以统一,先这么用着吧,也无大碍。
二是个别零碎处,举个栗子,【官】这个字五笔编码达6条之多,历来86五笔的正规全码是pnhn,二简是pn,有这两个编码足够了。黄狗加了三简pnh,似无必要。另外又加了容错码phnn及其二简ph三简phn。这种做法少见。使码表产生不必要的膨胀,而且助长歪风邪气。容错码不是不可以用,最好严格谨慎,不得已而用之。
说到这里,顺便说个字的编码,以前有朋友提过的【㓁】一般来说是pwu,不过pqb亦可,放眼世界,只是同字不同形而已。
作了一个简单统计,以供同仁参考,如有错误敬请不吝指正。
其实这样的科普如果由楼主M大佬亲自来做是最合适不过了。


所有时间均为 +8, 现在的时间是 2025-03-13 00:03.

Powered by vBulletin® Version 3.8.12 by vBS
Copyright ©2000 - 2025, vBulletin Solutions, Inc.