UCS/UTF

もっとも、内部コードをUTF-8に統一した、すなわちUCS(Unified Code Set)からこそあそこまで自然な統合が出来たというのも事実で、CSI(Code Set Independent)を標榜するrubyとしてはつらいところ。

は?UCS は Universal Character Set だろ、とか思ったけど良く読めば「統一された内部コード」以上の意味は無いんだろうな。紛らわしいことこの上無いけど。
で、なんか調べてみたら ISO/IEC 10646*1 の名前が Universal Multiple-Octet Coded Charactor Set で、これの acronym も UCS なんだな。UTF も Unicode 的には Unicode Transformation Format で、ISO/IEC 10646 的には UCS Transformation Format だとか。まぁ、どうでもいいといえばどうでもいい話。

*1:Unicode ベースの符号化文字集合の規格