共起頻度と階層構造
ただ、一般的な意味の包含(ほうがん?、ほうふくだと思ってたんだけど変換で出てこなかった・・・)関係にはなっていない。
例えば、javaという階層の下にプログラミング言語というタグがあったりするのだが、これは普通に考えるとおかしい。
このような点において、Kookleのディレクトリ構造はあまり良質なものではないと言える。
しかし使ってても違和感はあまり感じない。
これはつまり、はてブユーザの頭の中が一般的な階層構造とは違い、こういった階層構造になってて、それを写像した形になってるんじゃないか?と考える事ができないだろうか。
ちょ、そのごまかし方はすごいなぁ。
単に上位概念の単語にまとめて言及するかどうかという話だったりするんじゃないかなぁ。Javaの話題ならProgrammingの話題でもあるのは自明だし、JavaもRubyもPerlもPythonもまとめて検索したいモチベーションも無いからわざわざ両方書かないという話では。
同様のことは別にソーシャルブックマークに限った話でもなくて、東京と書いても関東という記述が無いことは普通なことのような気が。そういうのも真面目に取り扱いたければ共起する単語の分布から兄弟関係の推定までやれば精度があがるかも。もうやってるかな?というかそういう論文とかありそう。
まぁ、オリジナルアルゴリズムなのもいいけど、研究にするなら論文を(ry
しかし、ACな人は実装が早いなぁ。