ファイル圧縮前と圧縮後の複雑さ尺度ヒストグラムの変化

(KIT ステガノグラフィ研究グループ)


下図は "ファイルの複雑さ" についてのヒストグラムを示しています(ファイル中の8x8ビットデータを1つの画像ブロックと見なす)。黒い線で示している方が本来の(非圧縮の)ファイル、赤い線の方が圧縮処理後のファイルです。この場合の圧縮とは、(ZIP や LHA による) "可逆圧縮処理" のことです。

これらの例からも分かりますように、非圧縮ファイルは様々なヒストグラム形状を示しますが、圧縮すると、何れも「正規分布曲線」に近い形になります。ランダムデータファイルの場合は、(複雑さ尺度の)平均値=0.5、標準偏差=0.047 の正規分布曲線として近似されます。JPEGファイルはそれ自身が圧縮ファイルであり、ランダムファイルに似たヒストグラムを示します。

a TEXT file

(218KB)

a Word file

(280KB)

a PDF file

(211KB)

a JPEG file

(2,110KB)

BPCS-Steganographyでは、埋込みたいファイルを埋込みの前に圧縮します。こうすることによって、(見かけ上の)埋込量を増やすことになり、しかも、ビットプレーン上の「ランラム状の領域」を「ランダム化したファイルブロック」と、「下位のビットを優先させて置き換える」ので、埋込の痕跡があまり残りません。すなわち、「自然な埋込み」が実現されます。その結果、"(埋込み量が少ない)控えめな埋込み" は非常に安全(検知し難い)なものとなります。

(最終更新日: 2014, 03, 06  河口英二)