目次 | 前へ | 次へ |
Wnn6 for Linux/BSD では、xwnmo 以外の Mule などのクライアント側の動作については一切サポートしておりません。また、xwnmo 以外のクライアントでは、ここで紹介している変換機能や学習機能の実現に制限を受ける場合があります。
これらの処理を通して、文節間の接続状態から最も使用頻度の
高い変換を行う機能をFI 変換といい、
次のような変換機能があります。
格係り受け変換、所有格変換、受身変換、使役変換、 合成語変換、修飾語変換、複文変換 |
FI 変換で新しく確定された文節間の関係規則を、
各ユーザの FI 関係辞書に登録し、ユーザごとに変換規則を
最適化する機能をFI 学習といいます。
また、FI 学習機能以外にも、次のような学習機能があります。
文節切り自動学習、無変換学習、接頭語学習、送りがな基準学習、 接尾語学習、数字学習、登録語自動反映、オフライン学習 |
xwnmo 以外のクライアントの使用時には、クライアントによっては、以上のWnn6(UNIX) のFI 変換・FI 学習の全機能をサポートすることができない場合があります。 また、クライアントに Mule / Emacs / kinput2 などを使用する場合は、各種変換・学習機能の設定方法が異なりますので、各クライアントのマニュアルなどでお確かめください。 |
Wnn6 の変換・学習機能の具体的な内容については、本章「概説」の後半に解説があります。 |
このように Wnn6 では、クライアント/サーバ方式の特徴を最大限に生かして、
辞書の一括管理を行っています。
また、サーバへアクセス可能なクライアント(ホスト名、ユーザ名を使って指定します)を制限することができ、システムのセキュリティにも配慮しています。
最大登録語数 | システムからの制限はありません。 ご使用のマシンのディスク容量によります。 |
登録読み文字数 | 256 文字 |
登録漢字文字数 | 256 文字 |
登録読み文字種 | 全文字種 |
登録漢字文字種 | 全文字種 |
システム辞書には、岩波国語辞典第四版をもとに、次のような独自の語彙を加えて収録しています。
Wnn4 の付属語ファイルを Wnn6 の jserver で使用した場合「古いバージョンの付属語ファイルが設定されています」というメッセージが表示されて、jserver が正常に動作しなくなる場合があります。 |
格係り受け変換 | 変換文字列中において、格情報を持つ文節と述語文節との接続関係を見ます。 |
が格 | 手が挙がる/株が騰がる/てんぷらが揚がる |
を格 | 身長を測る/時間を計る/暗殺を謀る |
に、には格 | 宿に泊まる/駅に停まる |
で格 | 汽車で帰る/貴社で会う |
へ格 | 京へ向かった/今日へ持ち越した |
より格 | 車より速い/予定より早い |
から格 | 敵から奪回する/会から脱会する |
まで格 | 誤解まで招いた/五階まで昇る |
所有格変換 | 変換文字列中において、所有格情報(の格)を持つ文節と対象文節との接続関係を見ます。 |
・かいとう → 会頭の回答 ・かいじょう → 会場の開場 |
受身変換 | 変換文字列中の述語文節に助動詞『れる』『られる』がついている場合、「受身」「可能」「自発」「尊敬」の効果を判別して、格係り受け接続関係を見ます。 |
FI 接続関係 変換可能文字列 受身 交通を ― 規制する 交通が規制される 可能 テレビを ― 見る テレビが[を]見られる 自発 故郷を ― 偲ぶ 故郷が偲ばれる 尊敬 社長が ― 読む 社長が読まれる |
使役変換 | 変換文字列中の述語文節に助動詞『せる』『させる』がついている場合、「使役」の効果を判別して、格係り受け接続関係を見ます。 |
FI 接続関係 変換可能文字列 使役 彼が ― 答える 彼に答えさせる |
合成語変換 | 変換文字列中において、2 種類の文節が接続して 1 つの意味を持つもの(複合語、人名)の接続関係を見ます。 |
・複合語 集団‐登校 会社‐訪問 ・人名 福沢‐諭吉 夏目‐漱石 |
修飾語変換 | 変換文字列中において、修飾を表す文節(形容詞、形容動詞、副詞、連体詞)と被修飾文節との接続関係を見ます。 |
形容詞 | あつい△△△ | 熱い湯/厚い本/暑い夏 |
形容動詞 | ていちょうな△△△ ふしんな△△△ | 丁重な挨拶/低調な作品 不審な人影/不振な成績 |
副詞 | ▲▲▲もる | ぽたぽた漏る/こんもり盛る |
連体詞 | ▲▲▲きのう | 小さな機能/楽しかった昨日 |
複文変換 | 変換文字列中において、[格情報文節+述語文節]の組合せが複数存在する場合、それぞれの接続状態を判別して、接続関係を見ます。 |
▽ ▼ ・家が建ち人が立つ |
郵便番号変換 | 郵便番号からその住所に変換します。 210-0005 ⇒ 神奈川県川崎市 |
電話番号変換 | 電話番号からその住所に変換します。 044 ⇒ 神奈川県川崎市 |
複合語変換 | 付属語を含まない候補を優先します とうきょうと ⇒ 「東京-と」より「東京都」を優先します。 |
最終使用最優先変換 | 同音異義語の中で、直前に使用した単語を、必ず先頭の候補に上げます。 |
異形字処理 | 新字⇔旧字、略字⇔正字の変換を行います。 渡辺 ⇔ 渡邊 |
連濁処理 | 連濁した読みを、発音通りに入力すると、正しい漢字に変換します。 |
揺らぎ処理 | 入力文字列が辞書に登録されていない場合、その文字列と表記は異っても、同じ発音になる別の単語が辞書に登録されていれば、その単語を候補として提示します。 |
文節切り自動学習 | 文節の切り直しを行って、変換文字列を確定した場合に、切り直した前後の文節を FI 学習機能で学習します。 |
無変換学習 | 辞書に登録されていない「ひらがな、カタカナ、ローマ字」の候補が確定された場合に、自動的に辞書へ登録します。 |
接頭語学習 | 接頭語に「お・ご」「御」のどれを使用するか、直後の名詞ごとに学習します。 |
送りがな基準学習 | 送りがな基準がある単語は、単語ごとに確定した規則(本則/おくる/おくらない)を学習して、直前に使用した規則を最優先します。 |
接尾語学習 | 単語ごとに確定した文字列の接尾語の規則(カナ/漢字(おくる)/漢字(おくらない))を学習して、直前に使用した規則を最優先します。 |
数字学習 | 確定された数字表記の種類(漢数字、半角、全角、カンマ付き)を学習し、直前に使用された種類を最優先します。 |
登録語自動反映 | 複数のユーザ辞書で登録されている同一単語を、マージ辞書に反映させます。 |
オフライン学習 | Wnn6 の変換効率の向上とディスク、メモリ資源の削減を目的に、オフラインで動作する機能をいいます。不必要な単語の削除や頻度の再配置を行い、登録語自動反映モジュールを起動させます。 |