我修改的五笔字型说明档

系统字体配置、中文显示和输入法问题
回复
wutong
帖子: 345
注册时间: 2007-10-22 16:54

我修改的五笔字型说明档

#1

帖子 wutong » 2009-04-13 19:08

我的五笔字型说明档

作者:源遠流長

  修改五笔字型的想法起於使用九八版五笔字型输入繁体字,结果发现看上去很
美。因为简繁双字共用一个码,大量使用了识别码,非常不适用。所以我生出改动
五笔原码的想法。首先将「讠45」从41挪到了45, 45的「宀445」挪到了44. 「貝
」从 m 挪到了 l. 「车」回到了a.


15部a主键分别为“工七戈弋”,還有草字头。我把敲a的高频字给了“成”,王永民先
生选的是“工“,而“成”的编码是“dq”,但“成”是“戈”部字,我考虑成“aq”。“工”的
编码是“aaa”。

  同样的考虑,感atgn、戌atg、戊ate。

25部m主键为“山且贝”,不再是“山由贝”。“由”拆分成“mf”,这样“油”就是“imf”。
换“且”,主要考虑“且”是男性生殖器的象征。组成的字也是常用字。姐姐当然比妯
娌常用。

  简化字形成的新字根,除了鸟和车以外,都没有为他它们编码。例如:乐tci
、这里t表是一撇c表示竖折,就如“世”的末笔、“以”的起笔。另外,用b“及、乃”
表示那一弯折。用“l”表示“飞、气”的折笔,用“nl”表示“乙”,注意後两种笔画的
异同。这样“迅”的码就是“lfp”。“艺”anl.

  简化字有哪些繁体字所没有的字根呢?「东、乐、乌、鸟、发、长、与、尧」
这些字根除了「东、鸟」外,组成的字以笔画来编码。为什么这样考虑呢?因为「
车、鸟」都是部首,「车」笔顺是1512=af,af就是车的编码。而车傍的笔顺是
1521=ah,所以「输」的码是「ahw」.

  这样就产生了双码字根的概念,规定双码字根在码首和码尾用双码表示这个字
根,而在中间的二码和三码出现时就只用一个码来表示。举例说明:惭nar.

  原来的双码字根是示字傍礻和衣傍衤就是双码字根。
  三画字和四画字就可以笔顺来写,例如“川”就按"thh".


  原作者在设定字根时用了两种思路,一是这个字根首两笔的写的数字对应的键
。如“十”12=f,同时有设定“二横”在f里,三横在d里,但是“g”的本意就是11, 而
11是两横,这就会自相矛盾。在折部很容易将甾头和粼的右边划到55的门下。这样
甾的编码就是xl. 粼的编码则是oqax.

  11部是「王傍青头半五一」,半ug. 建vgc, 原来的戋是由戔简化而成,这样
「线」的码就是xga. 「来」的繁体字是「來」,从木,所以九八版将「来」的码
改成了「gus」. 二级简码为「来」,而不是「go」.
98版11部还有「夫」,想想還是去掉了。因为「夫」的笔顺1134=gw, 所以「
夫」有二级简码「gw」. 一般的带「夫」字根的字都编成了「fw」. 其实编成「
gw」也很和谐。


15a 开江东七号车戈弋花巨
aa 增加字根亏兮编为a=15
ab 车乐与尧乌长鸟发
ac 只吸收车为字根
ad 其它字根用单笔画来编
ae 烧ognq
ae 尧gntq
af 长tgcy
af c来代表单笔画竖折
ag 革akf
ah 革傍af
ah 堇傍艱傍均取ak
ai 车1512=af
aj 车傍1521=ah
ak 轻ahc
al 车傍为中间字根只取a
al 惭nar
am 牙aht
an 臣在繁体字中只编为a
an 緊acx
ao ao中收有凹凸
ao 说说戈gnty
ao 成我戍戌戊都在戈部
ap 成不再是dn而是aq
ap 我tahg
ap 戊at
aq 戌atg
aq 戍aty
52b 耳了犯爿巴凵也
ba 巴5215=ba
ba 居然与读音一样
bb 声下笔顺5213=bd-->d
bc 声fb
bd 幽的部首是凵
bd 幽hxxb
53c 马又登去矛
ca 单笔画规定为c
cb 世ac
cc 断ocr
cd 抒中的予编cnh
ce 预cndm
cf 矛本身编为cnht
ch 務騖中的矛整编c
ci 務ctv
cj 騖ctco
ck 癶是两足張开,行走不便
ck 其笔顺是54334, 54正是c
ck 所以癶编成c
cl 癸cgd
cm 登cgku-->cu
cm 这样登也成了双码字根
cn 瞪hcu
co 98版马也是双码字根cg
co 98版馬co
cp 我将马傍恢复成单码字根
cq 但是马置於字根尾采用了倒编法
cr 腾eucg
cs 騰euco
ct 倒编法是给部首置後的一种方法
ct 致顺编是gcft
cu 倒编是所有的攵傍的字末两码都给了tw
cv 攵3134=tw
cw 致gctw--->gct
cx 倒编的部首有「攵、欠、鳥、鸟、马、馬、页、頁、殳」
cx 左中右的字「撇、撤」照旧
cy 弊上面是敝
cy 敝umtw
cy 相应「弊」umta
cy 鑿是凿的繁体字编成oumq
cy 也是这个倒编的原则起作用
d 古石厂三大犬
e 月用狂行毛衣舊
ea 行有简码eh
eb 彳亍都与足有关
ec 故取行eh
ed 将犭挪到33部
ee 因为犭有两撇
ef 豸ee
ef 豺eeft
eg 艮後三笔画534
eh 彳
eh 所以艮取vvy-->vv
ei 狠evv不是eve
ej 家oe全码应是oge
ek 所以蒙apfe
el 豪ypge
f 土士二十寸雨
fa 删除字根「干」
g 王青半夫五一
ga 王1121=gh-->g
ga 戋ga
gb 五gmg
gb 亘gjg
gc 亚gog
gd 互gxg
ge 亞gfg
ge 亞中间是空心十
gf 严和亚从字源上
gg 与业无关
gh 严繁体是嚴
gh 严god
gl 垩gof
gm 堊gff
go 就像盥eil
gp 一个e代表了两边
gq 业本身
gw 夫1134=gw
gw 夫是双码字根
gx 扶rfw
gy 取三优先
h 足目上虍步
ha 卜24=l故挪到l
hb 虍215315=hva-->h
hc 足kh
hc 足傍h
hc 路htk
hd 齿傍hwb-->hw
hd 齒傍hb
i 水小
ia I在郑码中是一竖
ib 规定
ic 年ti
ij 日ji
ik 口ki
il 車li
im 贝mi
io 业oi
is 甫si
ip ci部是日语平假名
iq li部是日语片假名
ka 川thh撇竖竖
kd 独体字三笔和四笔
ke 提供笔画输入
kf 干ggh
kg 口hng
kh 气tggl
ki 乙nl
kk 丸tly
kl 毛tggn
km 及tby
l 車田甲貝惠四黑數卜
la 惠lnu
lb 黑lo
lb 熏tlo
lc 舞tgla
ld 下gl
m 山且贝几周
ma m本是25字根
ma 几起笔是撇
ma 但这是竖撇
mb 由mf
mc 曲ma
md 两者拆分的想法一样
md 曹gmaj 把曹头想成一横加一个「曲」
me 且mh, 这是「由」原來的码
n 心羽尸
na 尺5134=nw
nb 尽nwu
nc 民51515=nca--->nc
o 火米四点宝业
oa 业oi
on 宁on这是就着「宁」的繁体字來编的
oh 定oh,原是ogh,省去g
ok 富ok 富人当然ok了
oc 叢oc 丛的繁体
p 视试軍被巡
pa 廴54=c挪到了c
pb 建vgc
pc 视pq
pc 祖pm初pv被pb神pj
pw 今3445wp
pq 鸟35451qpg-->qp
pqm 岛qpm
q 金九儿夕
qa 35的字根相当多下嫁了不少
qb 匕來到了55
pc 几來到了25
qd 月來到了33
qe 这里又将反犬傍下嫁到33
qf 金属傍钅和釒在一起重码最多,没有办法
r 手气牛白斤失追版隹
ra 片thgn3215=ra
ra 版rar
rw 失rw
rn 追始笔顺是3251所以rnp
rq 鬼rqc是三码字根
rq 三码部首遇到接下来的字根多於一个时
rq 就删掉第三个码留两个给後续字根
ru 魁rqcf
ru 魅rqgs
rv 隹ry是双码字根
rv 集rys
rv 奮drl
rv 难cryg
rw 亻在二三码出现时记为r
rx 夜yrt-->yr
ry 花arx
ry 这是因为r的字根很少出现在中间
s 木丁西甫
si 甫si
sq 西sq
sw「 來」sw繁体字「来」
sk 束sdk
sk 整
t 禾竹告头
ta 先tq
tb 舟tmgu
tc 舟就是四码部首
td 四码部首与三码部首一样
td 在此字根为首的字较多时,也要让出两个码
te 舢tmgm
tf 船tmmk
u 立羊辛两点门
ua 立yu
ub 羊ugj
uc 辛yuf
ud 门yhn
ue 車gjf
uf 雨gmho
ug 士ghg
ug 十fg
v 女力刀乃归
va 集了所有的53字
vb 皮53254vhc
vc 即vcb 左为双码鍵
vk 朗yve
w 人和亻
wa 人下常带一横,故决定缩并
wb 命wkb
wc 验cwi
wd 俞wej
we 祭qcfi
wf 登cgku-->cu
x 弓乂匕
y 文言方广
ya 方4153=yv
yaa 良yvv
yb 高享省去「口」,亨哀京不省去「口」
ybb 郭ybb
ybc 京yki

  我使用fcitx输入汉字。

  你在自己的~/.fcitx/里加入这个码表,在终端运行
txt2mb wb.txt wb.mb
并在同样文件夹里建tables.conf

[码表]
名称=五筆
码表=wb.mb
调频=0
拼音=1
拼音键=z
自动上屏=1
模糊=1
模糊键=z
自动词组=0
自动词组长度=4
词组参与自动造词=1
保存自动词组=0
精确匹配=0
提示编码=0


  再按ctrl+5, 就重新读入数据。如有不满意,可再命令
mb2txt wb.mb > wb.txt
vi wb.txt
來修改。
附件
wb.zip
(53.23 KiB) 已下载 34 次
头像
jioyo源
帖子: 3476
注册时间: 2008-10-08 13:48

Re: 我修改的五笔字型说明档

#2

帖子 jioyo源 » 2009-04-14 11:44

:em20 不是吧……
--------------------------------------
论坛精华贴全集:http://forum.ubuntu.org.cn/viewtopic.php?f=48&t=199845
book:http://forum.ubuntu.org.cn/viewtopic.php?f=21&t=198286
头像
daf3707
论坛版主
帖子: 12739
注册时间: 2007-06-13 15:57
来自: 在他乡

Re: 我修改的五笔字型说明档

#3

帖子 daf3707 » 2009-04-14 11:51

五笔熟悉了再改很难
我就用95码的
98版的就不会
习惯,现在是动手就来,基本不用刻意去想码
习惯是可怕的 :em09
头像
xtay573269555
帖子: 217
注册时间: 2008-09-24 23:56

Re: 我修改的五笔字型说明档

#4

帖子 xtay573269555 » 2009-04-14 12:25

习惯是一种毒药……
我们都已中毒!
knowfarway
帖子: 877
注册时间: 2007-08-25 10:37

Re: 我修改的五笔字型说明档

#5

帖子 knowfarway » 2009-04-14 12:39

这个,我已经记不住了。
头像
wangdu2002
帖子: 13284
注册时间: 2008-12-13 19:39
来自: 物华天宝人杰地灵

Re: 我修改的五笔字型说明档

#6

帖子 wangdu2002 » 2009-04-14 12:46

支持下,我以前打86的,后来改98了,不过楼主的码表只能看看而已,即使好也没法用,因为到其他机器打不出来字,除非王码官方修订才行。 :em02
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
头像
petrele.chen
帖子: 261
注册时间: 2008-09-11 17:41

Re: 我修改的五笔字型说明档

#7

帖子 petrele.chen » 2009-04-18 22:37

:em20 我是没看完全文,我看到“油”字那里就没看下去了,我不知道作者这样改的具体的意图是什么,但我发现一个很不合逻辑的地方:

比如说“由”字,作者说改后的编码是mf。我就在想谁写“由”字的时候是先写个“山”再写“二”么,我是没见过这样的人。

我想法是好的,但要切合实际。

wutong 写了:我的五笔字型说明档

作者:源遠流長

  修改五笔字型的想法起於使用九八版五笔字型输入繁体字,结果发现看上去很
美。因为简繁双字共用一个码,大量使用了识别码,非常不适用。所以我生出改动
五笔原码的想法。首先将「讠45」从41挪到了45, 45的「宀445」挪到了44. 「貝
」从 m 挪到了 l. 「车」回到了a.


15部a主键分别为“工七戈弋”,還有草字头。我把敲a的高频字给了“成”,王永民先
生选的是“工“,而“成”的编码是“dq”,但“成”是“戈”部字,我考虑成“aq”。“工”的
编码是“aaa”。

  同样的考虑,感atgn、戌atg、戊ate。

25部m主键为“山且贝”,不再是“山由贝”。“由”拆分成“mf”,这样“油”就是“imf”。
换“且”,主要考虑“且”是男性生殖器的象征。组成的字也是常用字。姐姐当然比妯
娌常用。

  简化字形成的新字根,除了鸟和车以外,都没有为他它们编码。例如:乐tci
、这里t表是一撇c表示竖折,就如“世”的末笔、“以”的起笔。另外,用b“及、乃”
表示那一弯折。用“l”表示“飞、气”的折笔,用“nl”表示“乙”,注意後两种笔画的
异同。这样“迅”的码就是“lfp”。“艺”anl.

  简化字有哪些繁体字所没有的字根呢?「东、乐、乌、鸟、发、长、与、尧」
这些字根除了「东、鸟」外,组成的字以笔画来编码。为什么这样考虑呢?因为「
车、鸟」都是部首,「车」笔顺是1512=af,af就是车的编码。而车傍的笔顺是
1521=ah,所以「输」的码是「ahw」.

  这样就产生了双码字根的概念,规定双码字根在码首和码尾用双码表示这个字
根,而在中间的二码和三码出现时就只用一个码来表示。举例说明:惭nar.

  原来的双码字根是示字傍礻和衣傍衤就是双码字根。
  三画字和四画字就可以笔顺来写,例如“川”就按"thh".


  原作者在设定字根时用了两种思路,一是这个字根首两笔的写的数字对应的键
。如“十”12=f,同时有设定“二横”在f里,三横在d里,但是“g”的本意就是11, 而
11是两横,这就会自相矛盾。在折部很容易将甾头和粼的右边划到55的门下。这样
甾的编码就是xl. 粼的编码则是oqax.

  11部是「王傍青头半五一」,半ug. 建vgc, 原来的戋是由戔简化而成,这样
「线」的码就是xga. 「来」的繁体字是「來」,从木,所以九八版将「来」的码
改成了「gus」. 二级简码为「来」,而不是「go」.
98版11部还有「夫」,想想還是去掉了。因为「夫」的笔顺1134=gw, 所以「
夫」有二级简码「gw」. 一般的带「夫」字根的字都编成了「fw」. 其实编成「
gw」也很和谐。


15a 开江东七号车戈弋花巨
aa 增加字根亏兮编为a=15
ab 车乐与尧乌长鸟发
ac 只吸收车为字根
ad 其它字根用单笔画来编
ae 烧ognq
ae 尧gntq
af 长tgcy
af c来代表单笔画竖折
ag 革akf
ah 革傍af
ah 堇傍艱傍均取ak
ai 车1512=af
aj 车傍1521=ah
ak 轻ahc
al 车傍为中间字根只取a
al 惭nar
am 牙aht
an 臣在繁体字中只编为a
an 緊acx
ao ao中收有凹凸
ao 说说戈gnty
ao 成我戍戌戊都在戈部
ap 成不再是dn而是aq
ap 我tahg
ap 戊at
aq 戌atg
aq 戍aty
52b 耳了犯爿巴凵也
ba 巴5215=ba
ba 居然与读音一样
bb 声下笔顺5213=bd-->d
bc 声fb
bd 幽的部首是凵
bd 幽hxxb
53c 马又登去矛
ca 单笔画规定为c
cb 世ac
cc 断ocr
cd 抒中的予编cnh
ce 预cndm
cf 矛本身编为cnht
ch 務騖中的矛整编c
ci 務ctv
cj 騖ctco
ck 癶是两足張开,行走不便
ck 其笔顺是54334, 54正是c
ck 所以癶编成c
cl 癸cgd
cm 登cgku-->cu
cm 这样登也成了双码字根
cn 瞪hcu
co 98版马也是双码字根cg
co 98版馬co
cp 我将马傍恢复成单码字根
cq 但是马置於字根尾采用了倒编法
cr 腾eucg
cs 騰euco
ct 倒编法是给部首置後的一种方法
ct 致顺编是gcft
cu 倒编是所有的攵傍的字末两码都给了tw
cv 攵3134=tw
cw 致gctw--->gct
cx 倒编的部首有「攵、欠、鳥、鸟、马、馬、页、頁、殳」
cx 左中右的字「撇、撤」照旧
cy 弊上面是敝
cy 敝umtw
cy 相应「弊」umta
cy 鑿是凿的繁体字编成oumq
cy 也是这个倒编的原则起作用
d 古石厂三大犬
e 月用狂行毛衣舊
ea 行有简码eh
eb 彳亍都与足有关
ec 故取行eh
ed 将犭挪到33部
ee 因为犭有两撇
ef 豸ee
ef 豺eeft
eg 艮後三笔画534
eh 彳
eh 所以艮取vvy-->vv
ei 狠evv不是eve
ej 家oe全码应是oge
ek 所以蒙apfe
el 豪ypge
f 土士二十寸雨
fa 删除字根「干」
g 王青半夫五一
ga 王1121=gh-->g
ga 戋ga
gb 五gmg
gb 亘gjg
gc 亚gog
gd 互gxg
ge 亞gfg
ge 亞中间是空心十
gf 严和亚从字源上
gg 与业无关
gh 严繁体是嚴
gh 严god
gl 垩gof
gm 堊gff
go 就像盥eil
gp 一个e代表了两边
gq 业本身
gw 夫1134=gw
gw 夫是双码字根
gx 扶rfw
gy 取三优先
h 足目上虍步
ha 卜24=l故挪到l
hb 虍215315=hva-->h
hc 足kh
hc 足傍h
hc 路htk
hd 齿傍hwb-->hw
hd 齒傍hb
i 水小
ia I在郑码中是一竖
ib 规定
ic 年ti
ij 日ji
ik 口ki
il 車li
im 贝mi
io 业oi
is 甫si
ip ci部是日语平假名
iq li部是日语片假名
ka 川thh撇竖竖
kd 独体字三笔和四笔
ke 提供笔画输入
kf 干ggh
kg 口hng
kh 气tggl
ki 乙nl
kk 丸tly
kl 毛tggn
km 及tby
l 車田甲貝惠四黑數卜
la 惠lnu
lb 黑lo
lb 熏tlo
lc 舞tgla
ld 下gl
m 山且贝几周
ma m本是25字根
ma 几起笔是撇
ma 但这是竖撇
mb 由mf
mc 曲ma
md 两者拆分的想法一样
md 曹gmaj 把曹头想成一横加一个「曲」
me 且mh, 这是「由」原來的码
n 心羽尸
na 尺5134=nw
nb 尽nwu
nc 民51515=nca--->nc
o 火米四点宝业
oa 业oi
on 宁on这是就着「宁」的繁体字來编的
oh 定oh,原是ogh,省去g
ok 富ok 富人当然ok了
oc 叢oc 丛的繁体
p 视试軍被巡
pa 廴54=c挪到了c
pb 建vgc
pc 视pq
pc 祖pm初pv被pb神pj
pw 今3445wp
pq 鸟35451qpg-->qp
pqm 岛qpm
q 金九儿夕
qa 35的字根相当多下嫁了不少
qb 匕來到了55
pc 几來到了25
qd 月來到了33
qe 这里又将反犬傍下嫁到33
qf 金属傍钅和釒在一起重码最多,没有办法
r 手气牛白斤失追版隹
ra 片thgn3215=ra
ra 版rar
rw 失rw
rn 追始笔顺是3251所以rnp
rq 鬼rqc是三码字根
rq 三码部首遇到接下来的字根多於一个时
rq 就删掉第三个码留两个给後续字根
ru 魁rqcf
ru 魅rqgs
rv 隹ry是双码字根
rv 集rys
rv 奮drl
rv 难cryg
rw 亻在二三码出现时记为r
rx 夜yrt-->yr
ry 花arx
ry 这是因为r的字根很少出现在中间
s 木丁西甫
si 甫si
sq 西sq
sw「 來」sw繁体字「来」
sk 束sdk
sk 整
t 禾竹告头
ta 先tq
tb 舟tmgu
tc 舟就是四码部首
td 四码部首与三码部首一样
td 在此字根为首的字较多时,也要让出两个码
te 舢tmgm
tf 船tmmk
u 立羊辛两点门
ua 立yu
ub 羊ugj
uc 辛yuf
ud 门yhn
ue 車gjf
uf 雨gmho
ug 士ghg
ug 十fg
v 女力刀乃归
va 集了所有的53字
vb 皮53254vhc
vc 即vcb 左为双码鍵
vk 朗yve
w 人和亻
wa 人下常带一横,故决定缩并
wb 命wkb
wc 验cwi
wd 俞wej
we 祭qcfi
wf 登cgku-->cu
x 弓乂匕
y 文言方广
ya 方4153=yv
yaa 良yvv
yb 高享省去「口」,亨哀京不省去「口」
ybb 郭ybb
ybc 京yki

  我使用fcitx输入汉字。

  你在自己的~/.fcitx/里加入这个码表,在终端运行
txt2mb wb.txt wb.mb
并在同样文件夹里建tables.conf

[码表]
名称=五筆
码表=wb.mb
调频=0
拼音=1
拼音键=z
自动上屏=1
模糊=1
模糊键=z
自动词组=0
自动词组长度=4
词组参与自动造词=1
保存自动词组=0
精确匹配=0
提示编码=0


  再按ctrl+5, 就重新读入数据。如有不满意,可再命令
mb2txt wb.mb > wb.txt
vi wb.txt
來修改。
回复