找回密码
 立即注册
搜索
查看: 3|回复: 0

走之底和两分编码 转自《马黑博客》》

[复制链接]

1075

主题

2741

回帖

1万

积分

管理员

积分
10259
发表于 昨天 23:18 | 显示全部楼层 |阅读模式
民间将部首【辶】称为走之底、走之旁或走字底不无道理,这些俗称均突出“走”字,暗合字源信息:【辶】来源于【辵】,是【辵】部首的异写、简写之一。 【辵】是会意字,行走之意,简化部首【辶】继承并延伸其本意,例字如【迁】、【过】、【逝】等都能容易看出与【走】的密切关联。顺便提一下,【辶】的读音完全继承【辵】的读音,chuò,ㄨㄛˋ,但字海输入法给【辶】的编码是zou,取其俗读音,更便于记忆和使用。

截取图片_20260111230412.png

虽然【辶】源于【辵】,后者并未消失,例字如其本字表示“走走停停”,【𨒼gèn】意同“退”,【蟽dá】意同“达”等等。所以【辶】既源自【辵】又是其衍生、派生的简化部件。


Unicode意欲给全球每一个存在的字符设计唯一的码点,其将【辵】作为独立部首而存在,因为如上已述汉字中存在很多以【辵】为部首的字,同时将一些含有【辶】部件的字归入此部,例如【𮟢】等字,可能强调和突出的是字源信息,很多字词典(例如汉典等)亦采用此种分类规范,或许是Unicode给汉字编码时参照了它们的做法。


😒 两分输入法码表的失误


【𮟢】、【𰺰】、【𰺶】之类的字虽然在部首归类上划入【辵】部首,但其书写形态在现代汉字规范看来,部首已经演变为【辶】,输入法码表编码应将关切点放眼到部首【辶】而非部首【辵】,更不应是其他的部首。令人困惑的是,字海两分输入法对此类含有、并已定型部首为【辶】的字并非归类到【辶】部,也非规划到【辵】部,而是【廴】部,音yǐn,yìn,编码定为【之】的读音zhi,例如键入zhiling会打出【𮞊】字。这类字在输入法码表5.0中有近150个,罗列如下:

截取图片_20260111230557.jpg

仔细观察可以发现,这些字的部首基本都是【辶】,仅个别字的部首在写法上有所差异但整体形貌仍是【辶】部首。这些字,从业已定型的字形字貌看,它们和【这】字所使用的部首其实并无本质区别,但和建字底【廴】有肉眼可见的明显不同。从前述我们已经知道【走】来源于【辵】,上面列举出来的字如果像【这】字一样取部首【辶】的俗读音zou(走)作为编码并无不妥,若坚守保持字源信息取【辵】chuo音也可以理解为遵从Unicode分类规范但极易造成编码逻辑的混乱,而现有码表中视此类字的部首为【廴】实在令人费解,即便从此类字的历史渊源上找到什么依据也必然过于牵强。最佳的编码选择应当是取走之底【辶】的俗读音zou,无需区别对待【𮞊】和【这】两字的部首——它们俩从观感上看区别仅是两个方面:笔画的粗细、书写中末笔画的捺的收笔不同,整体形态可以归为同类,而因“形似”的不同字元采取相同编码的做法在两分输入法中被大量使用,这两个外观上大同小异的部首也就没有必要去纠结它们之间的差异。


如果从隶定字等历史渊源这类因素去考察,我们能否看出字海对上述文字如此编码的依据所在呢?例如,以【𰻇】字为例,隶定字的部首写法为【⻍】,多一个点丶。写法不同,其根本却不变:【⻍】是【辶】的旧写,二者来源相同、音义无异,当是同类,【⻍】与【廴】并非因此而可以画上等号。左思右想,还是找不到字海对这些字的部首使用zhi编码的合理理由。理解为编码错误倒是能找到依据:在字海网查询【𰻇】字,两分字元定为辶 复,【这】字两分字元是辶 文,两字的第一字元完全一致;查询其他类似字情况亦是如此。可以斗胆猜测:字海最终制定编码规则时是将上述罗列的字的部首归类为【辶】部,而给这些字实现编码的时间可能早于最终规则的定型,而后又未能发现错误的存在。当然这仅是猜测,事实未必如此,但查询页面的字元拆分和码表编码的矛盾现实存在,理应厘清。

字海网收录单字已达14.6万个之众,释义的有也有近14万,工作量不可谓不庞大不可谓不繁杂,而编码工作略为滞后于文字的收录,目前编码工作仍在持续进行中。面对如此庞大的单字进行编码实属不易,出现一些问题在所难免,可以理解。祝愿两分输入法码表的编码工作越做越顺畅。


《马黑博客》地址:  https://mahei.ccccocccc.cc/?i=1






您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

协同嘉业科技有限公司 ( 京ICP备2024053108号-1 )

GMT+8, 2026-1-12 07:37 , Processed in 0.089355 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表