田畑さんの uim memo

マッチングのルールが微妙に異なります
例えば、ハングルには rkからなるシーケンスとrkrからなる
シーケンスがあるのですが rkrkと打鍵すると他のinput
methodではrkrの部分でコミットされるのですが、
ハングルではrkの部分がコミットされます。

んー、どういう状況なのかわからん。rk の時点で commit されるんなら、rkr はどうやったら入力できるのかな。それともこういうことか。

rk -> X, rkr -> Y となっていたとして (X, Y はハングル文字)

入力 preedit
r r
rk X
rkr Y
rkrk Yk

むしろこれは uim.fdo に放りこむべき内容だな。あと用語の定義があやふやで日本語入力とか何とかを使ったことのない人にはさっぱりわからんだろう。uim.fdo にちゃんとした用語の定義を書こうか。でもどうせ用語について project 間で合意は無いだろうから適当にでっちあげる事になるな…

追記

# YamaKenZ 『ついでに。ハングルの2ボル入力は「後ろから最長一致して余った先頭シーケンスを1文字のハングルとしてcommit」のように動きます。もうわかってるかもしれないですけど。』

わかってませんでした。なるほどこういうことね。

;; (commit string . preedit string)

ハングルでない場合
rkrk → ("rkr" . "k"), rkr → ("rkr" . ())
ハングルの場合
rkrk → ("rk" . "rk"), rkr → (() . "rkr")