転置インデックス

そういや、以前誰かが、輪講で inverted index を「逆インデックス」って訳していて、それはないわ、と思ったけど。

転置インデックスには大きく分けて2通りの手法がある。転置ファイルインデックス(inverted file index)は単語と、その単語を含む全ての文書をリストとして備えている。完全な転置インデックス(full inverted index) は、単語を含む全ての文書の他に、その単語が文書中のどこに現れるかという位置情報まで含んでいる。
転置インデックスの実装手法にも幾通りかある。最も単純なものは全ての文書IDとその保存位置情報をペアで格納したものである。ディスク容量の節約にはなるが、その分、機能性も乏しいものとなってしまう。(普通検索エンジンで行うような)単語検索は可能だが、(検索クエリで引用符でくくるような)フレーズ検索は不可能だろう。

ちょ、最後の文がおかしい。単語出現位置の情報もあるならフレーズ検索できるよ。
多分、元になっている英文はコレだな。

There are two main variants of inverted indexes: An inverted file index contains for each word a list of references to all the documents in which it occurs. A full inverted index additionally contains information about where in the documents the words appear. This could be implemented in several ways. The simplest is perhaps a list of all pairs of document IDs and local positions. An inverted file index needs less space, but also has less functionality. You can do term search (what you usually do in a search engine), but not phrase search (what you usually get when you put quotes around your search query).

あー、後半から日本語訳の主語が変になっているねぇ。「This could be implemented」の This は full inverted index のことでそのあと、inverted file index の話になっているのに、訳で主語を省くから変なことになっている。
結論。超訳勘弁。つか、主語省くな。代名詞が何を指しているかぐらい理解してくれ。