2007-03-01から1ヶ月間の記事一覧

エンコーディング達人判定

ふと、文字エンコーディングの問題に詳しい人間は'\'の ASCII コードを 0x5c だと即答できるんじゃなかろうかと思った。逆に言えば*1、即答できない人間は詳しくないだろうと思うわけだが、さてどうだろう。 あと、FULLWIDTH TILDE と WAVE DASH がなにか分…

アンダーバー

ref:void GraphicWizardsLair( void ); // 「_」のアンダースコアを「アンダーバー」と間違って呼ぶのは日本人だけみたい? ふーん、と思って「Underbar」で検索したら _summer - Wikipedia, the free encyclopedia が出てきて笑った。 そんでもって、Discus…

Byte Order

いまどきビッグエンディアンがデフォルトとは! どう、「いまどき」なのかよく分からないけど、Java の java.io.DataInput, java.io.DataInput は Big Endian と定められているし、ネットワークに流すときは Big Endian というのが標準ではないのかな。 そう…

RMS #2

Richard Stallman の講演を聴いてきたわけだが、とりたてて書くようなこともないかなぁ。 と思ったけどちょっとだけ書く。ちょっと自信がないが、こんなことを言っていたと思う。 GPL defends freedom. Non GPL open source license respects freedom, but d…

Unicode 正規化と文字種判定

この処理は、 もともと、Web page が英語なのかどうかを判定したいという目的があるのだが、 実際にこのメソッドで処理したら、 例えば、見た感じは全部英語っぽいのだが、 いわゆる全角空白が使われている、 というページが出てくる。 どう見ても英語なのだ…

言語判定

ref:裏表(Phinloda のもう裏だか表だか分からないページ) | Java で「英語で書かれたページ」を判定する方法は? 「日本語でない」でいいなら、Character.UnicodeBlock を使って、ひらがな、カタカナ、漢字がないかどうか調べればいいと思うけど、そうでない…

高速な log2 #2

C++

ということで、インラインアセンブリをフル活用するバージョン。移植性ってなんですか? Visual Studio 2005, gcc 3.4.4 on cygwin, gcc 4.1 on Linux(x86), gcc 3.4.6 on Linux(amd64) で動作確認済み。Borland C++ Compiler 5.5 にも対応しようと思ったけ…

やっぱりアセンブリ

C

RMQの件をメールしたら「インラインアセンブリで bsf と bsr を使えばもっと速いよ」(意訳)という回答が来てがっくりな今日このごろ。 ちなみにトータルで倍くらい速くなるようです。やっぱり 時代は Binary 2.0 か。

RMQ高速化

データ系列の任意区間から最小値(もしくはその位置)を取得する操作を Range Minimum Query というのだが、これは n 個のデータに対して O(n) の前処理をしておけば O(1) で計算できることが知られている。 で、その実装が九州大学の坂内さんのページで公開さ…

論争の弊害

ref:神様なんて信じない僕らのために - ユニコードがHotな件について抱いた感想 Isoparametric 『嘘情報は確かにやっかいですね。 ただ、だらだらと経過が書き連ねられて、あのコメント欄のように鬩ぎ合いに発展してしまうのは、 結局ノイズや無意味な(第三…

Java におけるハッシュテーブルの実装

主要プログラミング言語におけるハッシュテーブルの実装 JavaにおけるMap、HashMap、TreeMap、LinkedHashMap、Hashtable クラス(またはインタフェース) まて。Map は実装じゃないし、TreeMap はその名のとおり木だ。

Yahho

Yahho って河合研だったのか*1!だったら Haskell で書かれていたに違いない(河合先生は学部3年の Haskell を使う講義を担当しているらしい)。いや、ふつうに考えてそれはないけど。 しかし、学部3年で Haskell っつうものなんだかなぁ。MIT はいきなり Sche…

RMS

ref:更新履歴兼雑記 なにこの選択肢のなさは。 あー、そういや、今週の水曜日に Richard Stallman が "Free Software and Freedom: Free Software in Ethics and in Practice" というタイトルで NYU で講演するらしい。聞いてこようかなぁ。 Richard Stallma…

mixi が海外ユーザの登録を Ban

ref:mixiの新規登録時に携帯メールアドレスが必須に あー、つまり海外のユーザは登録できなくなったという理解でよろしいですか。まぁ、自分はとっくの昔に登録しているから問題ないといえば問題ないけど。 しかし、記事タイトルに「携帯メールアドレス」は…

高速な log2

C++

高速に floor(log2(n)) を計算するコード。無駄に template です。大量の計算のお供に。 #include <boost/concept_check.hpp> /** * returns floor of log i */ template<typename INT> inline int intlog2(INT i) { boost::function_requires< boost::UnsignedIntegerConcept<INT> >(); int n = 1; int d</int></typename></boost/concept_check.hpp>…

UTF-8 の BOM

向こうにもコメントしたんだけど。IKeJI さんのコメントから > Wikipedia の UTF-8 の項目に記してあるように、BOM の有無で、アプリによってはトラブルが起こる。 UTF-8でBOMがないのは間違いですよね。それはアプリのバグなのでなおしては? いやいや、UTF…

Unicode と UTF-X

えーと、なにやら某所から Unicode について解説しろとの圧力がかかったので軽く書いておく。 Unicode はなにかというと What is Unicode? にこう書いてある。 Unicode provides a unique number for every character, no matter what the platform, no matt…

触れてはいけないもの

あー、もしかして、南堂さんて関わり合いになってはいけない類の人なんだろうか。 まぁそもそも、別に論争したいわけではないんだけどね。ほうっておいてもそのうち UTF-8 に統一される気がするし。

文章記述能力

ref:Open ブログ: ◆ シフトJIS と unicode ref:Open ブログ: ◆ 文字使用の指針2 昨日の続き。 コメント欄が盛り上がっているようだが、なんだかなあぁ。あ、なんかだれかがここの URL を張ってますね。メチャクチャだというのならどうメチャクチャだという…

placement new

C++

ref:神様なんて信じない僕らのために - オレオレアロケータ いわゆる placement new ですね。 std::allocator と紛らわしいとかいう話は置いておくとしても、operator new/operator delete だけじゃなく、operator new[]/operator delete[] も定義したほうが…

反論?

下の Unicode の話は別に反論だとか、そういうつもりはないんだけど傍からは反論だとか揉め事に見えるんだろうか。最後の1文以外は、私自身の意見ではなく事実の指摘に終始しているつもりなんだけどなぁ。文体がアレだっつう話はあるけど。 まぁ、なんつうか…

意地でも Seasar とは書けないらしい

ref:ASIPの徒然なるままに(2007-03-17) 「Guiceで******2のinterceptorを使ってみた」ってどれだけ意地になっているんですか。 まぁ、Seasar には言及しないといった手前、プライドの問題もあるんでしょうけど、不毛だなぁ。名前出さなきゃいいというという…

Unicode に関する誤解の誤解

ref:Open ブログ: ◆ シフトJIS と unicode via:Matzにっき(2007-03-12) 初めにお断りしておくが、本項は、誰かを批判することが目的ではない。素人にありがちな誤解を正すことにある。 上記のサイトで、素人が間違いを犯しているからといって、素人を批判す…

Apache License と GPL の互換性

ref:ホワット・ア・ワンダフル・ワールド 僕が Mac を買わない 10 の (ry あー、なんかあろはさんのところのコメント欄が盛り上がってますね。(via arton さん) で、ちょっと気になったこと。 okuji さんのコメントから いいえ。辛いのは、不自由にしたい人…

zero based index

あれ、zero based index は「ゼロ基点」だっけ?それとも「ゼロ起点」だっけ?

Yakitori

もうすぐいなくなる人間が二人*1いるってことで数人で軽く食事にいこうという話になった。ちょうどセントパトリックデー(St Patrick's Day)ということで IRISH PUB にいけばグリーンビールが飲めるとかいうことで行ってみた。が、正確には明日(3/17)だから出…

大雪

やっと暖かくなってきたなぁ、と思ったら今日は大雪。歩きにくいよ。

excuse me

例の「悪いことをしたときは日本人のふりをするんだ」ってやつ、なんか英語字幕付きバージョンが出たみたいなんだけど、なんで「足を踏んだときは『すみません』って言うんだ」ってところの「すみません」に「Excuse me」をあてているんだろう。普通に考えて…

謎略語

某氏が使う謎略語+謎読み rootのパスワード = su pass str = スター su pass は分からなくもないけどな。password なのか passphrase なのかはたまた path なのか。すでに su = Super User でもないしな。 スターの方は完全に意味不明だったな。 略語とか専…

root のパスワード潰し

ref:rootのパスワードは潰さないほうがいいと思う件 - mputの日記。 (2007-03-15) あー、通常ユーザのパスワードを全部禁止して root のコンソールログインだけ許可ってのはいいな。しかし、ユーザがみんな公開鍵認証を理解しているとしたらうらやましい限り…