2007-03-13から1日間の記事一覧

Java + Debian

個人的には,Java で書かれてるってのが非常に微妙なんだけど.別に Java が嫌いとかそういうんじゃなくて,単純に処理系のインストールが面倒というか.apt で入らないから (Java がオープンソースになったってことだけど,そのうち解決するのかね ?) あれ…

YouTube と NHK

例の ANA の飛行機が胴体着陸した NHK の中継を YouTube で見てたらちょうど NHK の中の人がやってきた。タイミングよすぎ。

文字列ソーティング #2

文字列ソーティングの速度比較にいくつかのアルゴリズムで Suffix Array を構築してみた。 対象データは 30 MBytes ほどの英文新聞記事データで、gcc 4.0 で -O2 でコンパイル。結果はこんな感じ。 algorithm time[sec] quicksort 97.33 multikey quicksort …

Google Corpus

NLP

ref:Google: 大規模日本語データ公開に関する特別セッション ref:Googleが大規模日本語データを公開するという話 おお。これはいいな。Web のデータなんだろうか。 と、思ったけど、もしかして Google の持っている大規模日本語データって、著作権者は Google…