Computer

剰余

x86_64 なマシンで以下の剰余を求めるコードのアセンブリを吐き出してみる。 unsigned int umod3(unsigned int n) { return n % 3; } int mod3(int n) { return n % 3; } % gcc -O2 -S mod.cこんな感じ。 umod3: movl %edi, %eax movl $-1431655765, %edx mu…

SMP

SMP がうれしい場合って、Producer - Comsumer や Pipeline なんかのモデルかなぁ。よくわからないけど。 とりあえず、重いプロセスを2つパイプラインに並べるとそれぞれがCPUを占有する様子が見えてちょっと得した気分になったりする。

文字幅問題

rdic 動かない。=> sary + ncursesw で自作するか? => sary + DTK で簡単にでっち上げる。てなことをやっていた。 で、だ。なぜか screen 上だと表示が乱れる。terminfo 関係かと思いきや、CJK 文字の文字幅の曖昧性の問題っぽい。このへんのパッチを適用し…

ハードウェア乱数

昔,パソコンで光栄の「三國志」を遊んでいたときのこと,タイトル画面の後に「乱数の初期化をするから,少し待ってスペースキーを押せ」というような指示があったことを覚えている。わざわざそんな宣言をしなくても裏で勝手に初期化しておけばよいことなの…

四捨五入

ref:某日記(前期) - 四捨五入を疑え! えーと、ちょっと誤解を与えかねないような。 たとえば、1.25 と 1.15 を有効桁数2桁に四捨五入する場合、両方とも最後の桁が偶数になるように、1.2 に丸めるので正しいのだけど、JISなんかで定められている四捨五入では…

Ruby開発用のSVNマシン

なんか Ruby を開発するための Subversion サーバ用のマシンが Sun から提供されたとらしいのだが、スペックが CPU: Dual Core Opteron (2.6GHz) x 2 Memory: 8 GBytes とか。何その無駄にハイスペックマシンは。つうか Proteus Group の計算サーバ*1よりハ…

そこそこ巨大なDB

データ個数約2億4千万、データサイズ約 20 GBytes のデータを Java からさくっと検索できるようにしたいんだけど、何がいいだろう。Exact Match なハッシュデータベースでいいから DBM なライブラリの出番だと思うんだけど。 候補としては Bekeley DB か cdb…

n-gram

ref:スラッシュドット ジャパン | 全文検索エンジン「JiroSearch」がGPLで公開 ref:全文検索 JiroSearch | 全文検索 JiroSearch 方式としてはN-gram形式のインデックス生成型の全文検索として動作し、htmlパーサーの機能もある。 N-gram形式のインデックス生…

乱数の精度?

某所に「線形合同法の下位bitの精度は悪い」みたいなことが書かれたのでコメントしたんだが、乱数のランダム性を指して「精度」とは言わないよなぁ、普通。 自分だと「乱数の精度」とか言われると32biとか64bitといった生成乱数の分解能だと理解するな。

Safari と gzip 圧縮 JavaScript

ref:prototype.jsを10KBにする方法の続き(.htaccessをスマートに使う) : 亜細亜ノ蛾 - Weblog 検証の結果、やっぱり Safari は「.js.gz な JavaScript ファイル」は処理できないみたいです。 うげぇ、と思って確認用ページ見てみたらファイル名が prototyp…

Suffix Array

Suffix Array ということで、軽く言及。 もう一つの難点は、そろそろトウが立っていること。アルゴリズムというのは比較的経年変化の少ない分野ではあるけれども、それでもその後見つかった新たなアルゴリズムだって知りたい。たとえばSuffix Arrayとかは、…

ゲノムの検索ソフトがGPLで公開

ref: スラッシュドット ジャパン | 理化学研究所がゲノムデータベース検索ソフトをGPLで公開 ref: Genome-Phenome Superbrain Project - Home ゲノム関係のデータベースってすごい巨大だったりすると思うんだけど、どのくらいまでスケールするんだろう。まぁ…

レーザーマウス

なんか壊れたマウスの代わりに、レーザーマウス買えとの煽りを受けたので、コーヒー買うついでに近くのSTAPLEでMicrosoft Laser Mouse 5000を買ってきた。$50 なり。 AppleのMighty Mouseも良かったんだけど、Bluetooth対応のほうはWindows非対応とかふざけ…

カレーで検索してエスカレーターがヒットするのはユーザビリティの問題か #2

10/6のエントリにPhinlodaさんから反応が。 この場合なら、 そもそも「カレーライス」は「カレー・ライス」のように分離できる複合語であるし、 しかも、「カレー」で始まる言葉である。 だから、「カレー」でもヒットする必要があると思う。 「ライス」でヒ…

カレーで検索してエスカレーターがヒットするのはユーザビリティの問題か

現実的に「エスカレーター」を検索したい人が 「カレー」というキーワードを指定することは殆どあり得なくて、 カレーという言葉を入れたら検索したいのはカレーでエスカレーターではない、 というユーザビリティ視点の話は多分理解できないというか、 思い…

いまどきなら UTF-8 じゃね?

回答を見ていると、メモ帳でよいとかあるが……普通CGIってEUCだろ。 EUCってEUC-KRですか?ってボケはさておき。いまどきにスクリプト言語なら EUC-JP で書くより UTF-8 で書いたほうが得なことのが多いんじゃね? まぁ、サンデープログラマーな人が使うWebサ…

Consolas Font

Consolas Fontがmiyagawaさんお勧めらしいということで、インストールしてみた。欧文フォントなので、ARISAKA等幅にFontLinkを設定してPuTTY、Eclipseの表示フォントに設定。 おお、なかなかナイスだ。 参考リンク Piece of a Puzzle - Weblog - SSH クライ…

mksaryの-bオプションと-sオプション

sary付属のmksaryで800MBytesのファイルに2bytesごとにインデックスを割り当ててSuffix Arrayを作りたかったのだが、Perlのスクリプトでインデックスを割り当てておいて、 mksary -b -s fooとやると、Segmentation Faultで落ちた。 ソースを追いかけると、ど…