2007-06-20から1日間の記事一覧

単語数カウント

ref:http://www.nishiohirokazu.org/pwe2007/2007/06/post_1.html まじめにやろうとすると、sentence split して tokenize しないといけないんだけど、まぁ、さすがにその辺は手抜き。なので、U.S.A. だとか Mr. だとかはうまく処理できない。 しかし、filei…

Java で Suffix Array

なんか Java で Suffix Array なコードというリクエストがあったので簡単に。 とりあえず Suffix Array の構築だけ。効率とか一切無視で。 import java.io.IOException; import java.util.Arrays; import java.util.Comparator; import java.util.regex.Matc…