以前書いた内容もそうなのですが、よく思う理由として思うことがあります。対話を行うということは、相手がこちらの発話意図を汲み取り、その意図に応じた内容を返す、ということ。となれば、意図がある程度解釈できる処理をしなければ、プログラムと会話なんて無理でしょう。となれば、ルールベースでいくにしても、キーが正規表現であるならば、満足に対応できる発話文なんて微々たるものです。入力となる文字列のパターンが、有限であるにしても無限に近いようなパターン数です。せめて、形態素ごとに区切ることができればパターンが削減されますが、それでも膨大なパターン数です。
加えて、形態素解析されるまえの文字列、形態素解析された結果得られる形態素集合。これらは意味情報の抽出が困難です。意味情報とは、誰が、誰にどうしたなどの意図や感情などです。意味を表す最小単位は文節ですから、文節で区切る情報がなければ、満足のいく対話なぞ不可能じゃないでしょうか。ルールベースに行くにしても、ものすごく膨大な数のルールであれば、理論上可能でしょうけど。
No comments:
Post a Comment