ATOK と Anthy -- 文節単位で変換したらどうか?

連文節変換能力は ATOK の圧勝だったわけですが、そもそも連文節変換って本当に便利な機能でしょうか?
私は基本的に文節や単語単位で変換、確定をこまめに繰り返す入力をしています。その理由は

  • 文節区切りの解釈ミスを減らしたい
  • 解釈ミス時に文節を移動するコストを支払いたくない
  • 未確定状態の長いひらがなでは、ミスタイプを見逃しがち
  • ミスタイプに気づいた時に、そこまで戻るコストが高すぎる
  • そもそも未確定の文章を大量に溜め込むのが落ち着かない

といったところです。
長い文章を一気に変換しようとすると、当然文節の区切りの解釈をミスる場合が出てきます。この場合文節を移動して文節長を調整し、漢字に再変換するという手間が発生します。そもそも長い文章を一気に変換するというのは、変換キーを叩く回数を減らしたいという思いからだと思いますが、これでは結局全体の効率は落ちてしまいます。文節の解釈は正しくても漢字変換が違っていた場合も同様です。変換キーを何度か叩いて目的の候補を出すわけですが、その場合も該当する文節まで移動しなければなりません。連文節を一気に変換していても、文節単位で確定しているようでは全く意味がないのではないでしょうか。
変換する単位を文節ごとに分割すれば、文節の解釈ミスというのは極端に抑えることができます。プログラムの精度を上げるのではなく、運用側でミスをなくすよう心がけるというアプローチの正しさは SKK が証明しています。
未確定状態のひらがなを大量にバッファに溜め込んでいる状態というのは、非常に見づらいものです。ひらがなの羅列の中にタイプミスや漏れがあっても、その場ではつい見落としがちです。そして変換時にタイプミスに気づくのですが、修正するにはその場所までカーソルを移動させるというコストが発生します。文節単位で変換を行っていれば、仮に修正することがあったとしても「文節を移動する」という作業は発生しません。タイプミスの修正にしても、早い段階で気がつくのでカーソル移動にかかるコストを低く抑えることができます。
これらを踏まえた上で、文節単位での文章変換を比較してみました。例によって [] は変換キーを押した場所と回数を表しています。[0] は変換を行わず、エンターキーで直接確定したものです。文章は Ubuntu 行動規範日本語訳の最初の段落を使用しました。

Ubuntu[0]とは、[0]「他者への思いやり[2]」を[0]意味する[1]アフリカの[1]思想です。[1]これは[0]「[0]全人類を[1]つなぐ[0]普遍的な[1]絆の[8]存在を[1]信じること[1]」です。[0]Ubuntu[0]コミュニティ[1]での[0]協力にも[1]同じ考え方[1]が[0]貫かれています。[1]Ubuntu[0]コミュニティの[1]メンバーたちは[1]共同作業を[1]効果的に[1]行う[1]必要[1]があり、[0]この[0]行動規範[1]が[0]我々の[1]協力の[1]「[0]基本原則[1]」[0]となります。[0]

Ubuntu[0]とは、[0]「[0]他者[2]への[0]思いやり[1]」[0]を[0]意味する[1]アフリカの[1]思想[1]です。[0]これは「[0]全人類を[1]つなぐ[0]普遍的な[1]絆の[1]存在を[1]信じること[1]」です。[0]Ubuntu[0]コミュニティでの[1]協力にも[2]同じ[1]考え方[1]が[0]貫かれています。[1]Ubuntu[0]コミュニティの[1]メンバーたち[1]は[0]協同[1]作業[1]を[0]効果的に[1]行う[1]必要が[1]あり、[0]この[0]行動規範[1]が[0]我々の[1]協力の[1]「[0]基本原則[1]」[0]となります。[0]

変換キーを押す位置を厳密に決めているわけではないので多少の差はありますが、どちらも変換効率に殆ど差がないことが解るかと思います。どちらも文節の長さを変更した回数はゼロです。
使ってみた感触ですが、ATOK は単文節ではなく、前後いくつかの文節とまとめて変換したほうが、望みの漢字が優先的に出てくるように思えます。*1前後の単語から推測を行っているのでしょうか。
Anthy は文節ではなく、単語単位変換したほうがよいように思えます。名詞の後ろに助詞をつけて変換すると、境界を上手く見つけられないことがあるようです。
長文を一気に入力することのデメリットが大きいことを考えれば、ATOK の強みの一つである連文節変換精度はほとんど無視できます。ATOK が賢いのは間違いないのですが、運用スタイル次第では Anthy でも十分 ATOK と渡り合える……のではないかと思います。
Anthy は使い物にならない、ATOK がいい」と主張する人は、おそらく長文を連文節変換するような運用をしているのではないかと推測します。前述の通り、Anthy の長文変換能力はお世辞にも高いとは言えません。聞いた話では、昔からチャットで慣らしたような人は文節ごとに変換することを好み、ワードやエクセルから入った人は長文を変換したがるらしいです。信憑性はよくわかりませんが、確かにそんな気がしないこともありません。
辞書や入力支援ツールについてはまた今度。

*1:「絆の」だけ変換した場合に候補が 8 番目だったことに注目