work

終わらない

仕事が終わらない。土曜出勤ですかね。

イベント

なんというか、会社のイベントの仕事が降ってきたりして本来の仕事が全然進まない。どうにかして。

休日出勤

あー、休日出勤してしまった。

残業

なんか、同期入社で別のところで勤務している人は試用期間中だかなんだかで残業できないらしいけど、こちらは別にそんなことは言われない。 ということで、2日続けて残業。

会議

10時から17時まで会議。 しかし、会議の資料はあらかじめメールで配布して各自で印刷ってのがいいのではないかと思った。てか事前に読ませてほしい。

初仕事

なんか初仕事は VBA になる模様。さすがに工数は小さそうだけど。

配属

配属された。職場の説明を受けたりなんなり。 で、Thin Client をセットアップしたところでやることがない。しかたがないので、部内の仕事の規格的なものを読んだりしてすごす。

仮定法

仮定法は情報抽出の敵だと思う。

締め切り

論文の締め切りがやばすぎなんだけど。いや、やばいの締め切りじゃなくて、ぎりぎりになっている自分だな。 まぁ、Demo Session だからもう投稿してからまた少しがんばることになりそうな気もするが。

Evaluation

情報抽出(Information Extraction; IE)の結果を評価したり。 正解セットがないと結果からランダムに抽出して人手で評価するしかないんだよなぁ。面倒だ。 固有表現抽出(Named Entity Extraction)や情報検索(Information Retrieval)なら正解セットがあること…

stemming

なんか性能が悪いと思ったら、転置インデックスの単語が stemming されてねぇ。新聞記事なら過去形が多いんだからそりゃ駄目だ。 ってことで、stemming するようにしてインデックス作り直し。まぁ、YAML の設定ファイルに2行追加して実行しなおすだけなんだ…

autotools 化

辻井研究室のParserとPOS Taggerをコメント行をスキップするように改造するついでに autotools 化してみたり。

One day Proteus workshop

Proteus Group の連中みんなで大ボスであるところの Grishman 宅で自分のやっていることを発表しようというイベント。 10分ほど怪しい英語でしゃべってきた。 しかし、でかい庭だ。やっぱ、NYU の Professor って給料すごいのか?

なんでも System.out に出すひと

なんでも System.out にエラーを出力するなよとか思う。っていうか IOException を catch して false を返すとか、それいつの時代のプログラミングだよ。 あと、こんなん。 public class Foo { private allTags = false; public void setAllTags(boolean all…

やけに結果がいいと思ったら

CRFを使って固有表現抽出したらやたらと成績がいいと思ったら、テストデータから正解情報を削除するのを忘れてそのまま出力していた罠。帰りの地下鉄で気づいた自分はすごいアホだと思った。 一気に数字で評価を出すところまでやってたらすぐ気づいただろう…

結局MALLET

使う部分とそれに依存する部分だけ抜き出したらサイズが1/5くらいになって依存ライブラリがtroveだけになったので、結局MALLETで行こうということに。で Ralpha にメールを出して、まだ返事が来てないんだけど。 つうかねぇ、CRFのほうは Feature のつくりか…

MALLET vs CRF

CRFをやめてMALLET使おうという話になったと思ったら今日になって Ralph から MALLET は高機能過ぎる、 CRF で十分じゃない?的なメールが。さいですか。 はぁ。やっと MALLET での Training Data と Feature Generator の作り方がわかってきたところなのに…

やり直し

機械学習はほとんど素人なんですが、ここ1週間くらいCRFを使ったプログラムを書いていたら今日のミーティングでMALLET使おうということに。 またプログラム書き直しだなぁ。まぁコーパスのロード部分は流用できるからまだいいか。

今日中

朝、大学に来てメールを見たらカンファレンスにいっているボスから、「今日中、最悪でも月曜の朝まで」な仕事がアサインされていた。 さぁ、大急ぎで実装するとしますか。