2007-03-27 charset != character set Mozillaのエンコーディング判別ライブラリであるuniversalchardetを切り出して、Cライブラリ化してみた。さらにJavaにもポーティングしてみた。エンコーディング判別なのにcharacter set detectorとはこれいかに。 charset = character set + encoding ということでひとつ。 ref:odz buffer - charset と encoding #2