2008-02-20から1日間の記事一覧

Problem 160

Hadoop はドキュメントが少なすぎ。ソフトウェア自体は良くできているっぽいのにもったいない。 まぁ、ということで、Project Euler の Problem 160 を解くプログラムでも。マジックナンバー多すぎだけど気にしない。まぁ、examples の PiEstimater でも読ん…

Project Euler

ref:http://projecteuler.net/ なんか Project Euler をやれといわれたのでやってみたんだけども、若い番号の問題がやたら簡単でびっくりした。 例えば Problem 5 とか Gauche なら (use srfi-1) (apply lcm (iota 20 1))で、Haskell なら foldl1 lcm [1..20…

Generics と template

ref:http://d.hatena.ne.jp/morchin/20080220#p1 Generics で Duck type は無理です。 基本的には kinaba さんが書かれている通りで。 Dのテンプレートは、仕組み的には C++ のそれと全く同じです。引数の違う実体は全部別のインスタンスとして、コンパイル…

TF-IDF

NLP

なんか Wikipedia の TF-IDF の項目がちょっとひどいな、これは。 普通、tf は「あるドキュメント中における」ある単語の出現頻度という意味で使うんじゃないかなぁ。 あとまぁ、一口に TF-IDF といっても、idf が 1 + log(N/df) だったり、tf の square roo…