Thursday, March 29, 2007

Laboratory::Work - 意味不明なデータ作成方法

研究室のつながりで、とある会社からデータ作成のアルバイトを請け負っています。

どんなデータを作っているかというと、
ある単語にどんな疑問詞を用いて疑問文を作ることが出来るかを表すデータです。
このデータは縦軸が単語、横軸が疑問詞の表になっています。
例えば、「食べる」には「誰が」をもちいて、「誰が食べるの?」という疑問文が作れます。
だもんで、「食べる」と「誰が」が指すセルには1を入れます。

違和感のある疑問文(一般的に用いられにくい疑問文)が生成される場合は駄目でして、
例えば「誰に食べるの?」などの疑問文はアウト。
「誰に」は「食べる」には使えないことになる。
ですので「食べる」と「誰に」が指すセルには0を入れます。

こんなデータを作る意味なんかあるのか、と疑問に思うのです。
というのも、1、0をふる判断基準がきわめて主観的で、
データ入力者が違和感を感じなければ1になるわけですから。
そしてその出来上がったデータを評価するのも人の主観です。
こんなの、こちらが作成したデータを先方が見て、
納得のいく仕上がりになるかどうかなんて一目瞭然でしょう。
こちらと先方の主観評価結果は異なって当然なわけですから、
一生先方が納得のいくデータなんて作れるはずがないです。

偏見、差別かも知れませんが、依頼主が外国人の方なのです。
出来上がる疑問文が一般的に用いられるかどうかなんて、
私たちでも判断があやしいのに、あなたそんな判断できるんですか?
とはなはだ疑問です。

こういうデータ作成は言語学者に頼むのが一番だと思うのですが。
素人を起用するのであれば、
複数人が判断をくだし、多数決で0、1を決めるのが妥当だと思います。

お金もらっている以上ある程度言われたとおりにやりますが、
もういい加減怠さMaxなんで、
追加料金請求する也放棄する也対策を採らないと耐えられたものじゃありません。
入力データ数が半端じゃありませんから。

先方が無能なんだ!と決め込んでしまえば多少気が紛れますが、
蔑んで気を紛らわすのは腹黒くなって嫌ですけどね。

No comments: