UCS/UTF
もっとも、内部コードをUTF-8に統一した、すなわちUCS(Unified Code Set)からこそあそこまで自然な統合が出来たというのも事実で、CSI(Code Set Independent)を標榜するrubyとしてはつらいところ。
は?UCS は Universal Character Set だろ、とか思ったけど良く読めば「統一された内部コード」以上の意味は無いんだろうな。紛らわしいことこの上無いけど。
で、なんか調べてみたら ISO/IEC 10646*1 の名前が Universal Multiple-Octet Coded Charactor Set で、これの acronym も UCS なんだな。UTF も Unicode 的には Unicode Transformation Format で、ISO/IEC 10646 的には UCS Transformation Format だとか。まぁ、どうでもいいといえばどうでもいい話。