Monday, April 17, 2006

Laboratory::HowTo - 研究の仕方

現在修士課程の一年をやっていますが、去年、学部四年生の頃の研究の仕方と言えば、ただやりたいことをやりたいようにやっていただけでした。教授は学生を育てるというより、見守るという雰囲気が強いですし、助教授は私の研究とジャンルが違いますので、たまに助言を頂く程度です。

私のやっている感性情報処理では、文章から書き手や発話者の感情を推定することを目的としていますが、今年に入って色々思うところがあり、その思うところを形にしようとプログラミングをひたすら続けていたわけです。

その思うところというのは、日本語文の示す意味を正しく解析しようと思ったのです。意味解析のような、違うようなものです。一日10時間ほどプログラミングを行い、他4時間ちょっとはバイトに費やす、という日々を送っていました。疲労がたまり、寝ぼけて自宅のマシンに意味もなく電源を入れたりもしました。

こんな話を私にかわって友人が助教授に話してくれたのですが。そのときから、というかそれよりも前からかも知れませんが、色々と助教授にアドバイスを頂くときがありました。なんといいますか、研究の仕方を教わったような気がします。近頃は意味解析まがいなことをして勝手に喜んでいた感がありましたが、本当にそれが必要なのかをきちんと吟味していないことに気づかされました。現在有る、そして出来る技術を使って、どこまでできて何が出来ないのかを把握した上で、上のステップに行くべきだ、ということ。むやみやたらに難しいことを取り入れるのはよくない。先輩の研究にならって、私も文からの感情推定を行っているわけですが、先輩が形態素解析、構文解析、格フレーム解析などを行ってもなおうまく推定が行えないという現状がありましたので、意味解析までいかないといけない、と勝手に思っていたのかも知れません。

そんな考えに至り、また感性情報処理について、今どのような論文があるのかなどを調べ直して、アプローチをかえることにしました。とりあえず、ここ一年はC++で組んでいましたが、時間短縮のためにPerlを使う方向に変更。加えて構文解析や意味解析まがいなことはやめて、形態素解析でどこまでいけるのかを調べることにしました。ここ2日ほどで作った、超簡単なシステムは、私のサイトで公開している神久夜がやっていることの3、4段階ほどレベルをあげたような(適当な表現ですが)ことをやっています。神久夜がやっていることに加え、形態素解析が加わり、辞書検索の高速化や、感情推定内容の尤度的な値を算出する計算式などを定義するなどですが。

小規模なテスト(学習データが少量)でしたが、それなりに推定がうまく行きました。大規模なテストを行ったときにどうなるかが問題なわけですが。大規模テストで上手くいかなかった場合、次に何を取り入れるかは考えています。それでもだめならその次何を取り入れるか、も考えています。少し少し、既存技術を投入し、結果を見ながら評価していくべきなんだな、と最近思います。

No comments: