Home > Tags > Windows

Windows

ボツ. スペクトラム画像比較法

この記事は、書いている最中にボツにすることが決まりましたが、せっかくなので記念に残しておこうと思い、掲載してあります。今回の調査では、この方法による調査結果を一切使用しておりません。

スペクトラム画像

スペクトラム画像

前項で挙がった調査方法が持っている問題点を克服するためには、数学的な解析が有効です。しかしあいにく私は数学も物理も得意でない上に、そういった解析を行うプログラムを作成する能力もありません。一からそれらを勉強する余裕もありません。ですので、現在手元にあるツールを使って、できるだけ科学的な結果を示すことができないかと考えました。その結果考え付いたのが、スペクトラム画像比較法でした。

スペクトラム画像とは

周波数分析とスペクトラム画像の対比。黄色の点線部分の音波が周波数解析グラフ(Frequency Analysis)にあらわれていて、グラフが突出している部分の周波数が、スペクトラム画像でも明るい色で表示されていることがわかります

周波数分析とスペクトラム画像の対比。黄色の点線部分の音波が周波数分析グラフ(Frequency Analysis)にあらわれていて、グラフが突出している部分の周波数が、スペクトラム画像でも明るい色で表示されていることがわかります

スペクトラム画像(右上図参照)は上下二段に分かれていて、上が左チャンネル、下が右チャンネルです。前項で紹介した周波数分析グラフでは、特定の周波数の強さをグラフの高さで表わしていましたが、このスペクトラム画像では色の明るさで表わしています。周波数の違いは縦軸にとられ、画像の上部に行くほど周波数が高いことを示します。横軸には時間がとられています。

スペクトラム画像は要するに、周波数分析グラフを大量に敷き詰めたものです。曲全体を通して、どのタイミングにどの周波数が強く響いているかを知ることができます。周波数分析グラフとスペクトラムの相関関係がわかるよう、右に図を用意してみたのでご覧ください。周波数分析グラフでは曲中のとある瞬間に響いていた周波数を調べることしかできませんでしたが、今回使用したスペクトラム画像の場合、曲中の 1,022 箇所で響きを調べることができます。どのくらいの頻度で音質の劣化が起こっているか、その統計を取るのには役立つはずです。

このスペクトラム画像を音声の圧縮前と圧縮後に撮影し、それが合致しているかどうか画面上の 1 ピクセルごとに確認していけば、完璧とまではいえなくてもかなりの精度で音の類似度が判定できるのではないかと考えました。

どうやってピクセルを比較するか

まず、圧縮前の音声と、圧縮後の音声のスペクトラム画像を撮影します。

圧縮前の音声のスペクトラム画像

圧縮前の音声のスペクトラム画像

圧縮後の音声のスペクトラム画像

Windows Media Audio 10 Professional 128 kbps VBR にて圧縮後の音声のスペクトラム画像


次に、2 つのスペクトラム画像を「差の絶対値」を求める設定にして重ね合わせます。重ね合わせには、Paint Shop Pro 9 を使用しました。

2 つのスペクトラム画像の差の絶対値を表した画像

2 つのスペクトラム画像の差の絶対値を表した画像

高音域以外の音域がほぼ真黒になっているのは、圧縮前後のデータが出力する音の信号データが大変似ているためです。このままでは比較になりませんので、画像を処理しておよそ -120dB よりも大きな信号の差がある部分を明るく目立たせます。

信号に差がある部分が目立つよう加工したもの

信号に差がある部分が目立つよう加工したもの

この画像処理では、-120 dB 未満の信号の差となって表れている音の違いを切り捨ててしまいますが、それはどの程度の音なのでしょうか。-120 dB 前後(-130~-110 dB)の信号で記録された音のサンプルを用意してみました。

Audio clip: Adobe Flash Player (version 6 or above) is required to play this audio clip. You also need to have JavaScript enabled in your browser.

他の音がうっかりなってしまわないように気をつけて、あなたのオーディオ機器の音量を最高まで上げてみてください。かすかにボレロが聞こえるはずですが、それでも本当にわずかな音しか出ていないことがわかるはずです。これが -120 dB 前後の信号によって伝えられている音です。この程度の音の差であれば、違いがあってもなくても無視してよいと今回は判断しました。

この色のついたピクセルがどの程度あるかを数えて、もともとの音データのピクセル数で割ってやれば、音の再現率がわかるはずです。今回のスペクトラム画像比較法は、このように行われました。

関連する投稿

コーデック比較終了

コーデックの比較と、結果の点数化がようやく終了しました。今のところはまだ書きかけではありますが、こちらのページから調査結果をぼちぼち書き始めていますので、よろしければご覧ください。完成したときには、またこちらでご連絡いたします。

結局、Ogg Vorbis 192 kbps VBR が総合的な音質・圧縮比評価が最も高いコーデックだということがわかりました。次点が同じく Ogg Vorbis の 256 kbps VBR、3 位は Windows Media Audio 10 Professional の 128 kbps でした。

関連する投稿

音声圧縮比較中

2001 年~2005 年まで主力だった、Pentium III 800MHz 搭載の自作 PC。最近データ回収のため分解。ながらく予備の PC としてタンスのコヤシになっていましたが、そろそろ処分でしょうか

2001 年~2005 年まで主力だった、Pentium III 800MHz 搭載の自作 PC。最近データ回収のため分解。ながらく予備の PC としてタンスのコヤシになっていましたが、そろそろ処分でしょうか

音声の圧縮方式には、昔から様々なものがありました。mp3 をはじめ、RealAudio、WMA、Vorbis、そして AAC(m4a)。新しい方式ほど音の再現性は高いのですが、汎用性が低くなります。最終的に僕が mp3 で圧縮し続けることを決断したのは、やはりその汎用性の高さが決め手となったためでした。

mp3 エンコーダーが初めて世間に公表されたのは、1994 年の七夕のことでした。そして僕が初めて mp3 をエンコードしたのは 1995 年のこと。エンコーダーは AudioGrabber、CD はたぶんトルヴェール・クヮルテットの『イノセント・ドールズ』だったと思います。

当時僕が持っていた IBM Aptiva 770 のハードディスクは 1.6GB しか容量がありませんでした。そこに mp3 を格納していったら、たちまち容量不足に陥ってしまいます。ですから当時は圧縮したデータをフロッピーディスクに入れたこともありました。隔世の感があります :-)

これだけ進歩の速い情報技術の中にあって、mp3 が 10 年以上にわたって主力の座を保ち続けたということは驚異的なことだと思います。しかし iTunes が AAC を世に広めてはや数年、次第に身の回りには AAC 対応の機器が増えてきました。

それじゃあ AAC の実力とはどのぐらいのものなのか。今後の自分はどの圧縮方式を採用するべきなのか。Windows Mobile 機器が手に入り、あらゆるフォーマットをいつでもどこでも再生可能な今、Windows XP SP3 をインストールしなおしたこの機に、もう一度考え直す時期が来たのではないかと思うようになりました。

そういうわけで、この日は圧縮の出力結果の比較をし続けました。圧縮方式ごとに音の再現度が異なるメカニズムは何なのか、僕なりにいろいろ考察して比較してみました。そのうち、結果がまとまればレポートにまとめたいと思っています 8-)

関連する投稿

Windows Vista Home Premium の購入

彼女が Dynabook C7 を購入して以来、ずっと未開封だったこのパッケージ。中には Windows XP Home Edition の CD が入っているものとばっかり思い込んでいましたよ、残念

彼女が dynabook C7 を購入して以来、ずっと未開封だったこのパッケージ。中には Windows XP Home Edition の CD が入っているものとばっかり思い込んでいましたよ、残念

彼女の PC には dynabook C7 に付属している Windows Home Edition をインストールしようと思っていたのですが、どうにもインストール CD が見当たりません。インターネットで検索してみると、どうやらこれは C7 以外の PC にインストールできないライセンスのもののようです。なんてこったい。

仕方がないので、Windows Vista を購入しに行きました。使いやすいように、最も一般的なエディションである Home Premium を購入したいのですが、価格は約 30,000 円。PC 本体より高いじゃないか(笑)、というわけで DSP(Delivery Service Partner)版を購入することにしました。

DSP 版というのは、主に PC ショップで販売されているもので、Microsoft が個別のサポートを行わない代わりに、安価に提供するというものです。Microsoft へ電話で問い合わせをしたことがない、という方にはもってこいのライセンスです。

DSP 版は必ずハードウェアとセットで購入し、そのハードウェアで使用しなければならないことになっています。今回は SD カードなどを読み書きするマルチリーダ(内蔵タイプ)と一緒に購入しましたので、このマルチリーダとセットで使用すればライセンスには違反しません。

気になるお値段は約 18,000 円。新規パッケージより 12,000 円安くなっています。アップグレード版の価格も約 21,000 円ですから、それよりもさらに安くなります。優待版などもありますが、何があるかわからないので、価格と安心感のバランスがとれた DSP 版がふさわしいと思います。僕以外の人が使うわけですからね。

※ dynabook って、全部小文字で書くのが正しい表記だったようですね、初めて気付きました。

※ この日、2008-08-24 の一日 113 セッションを超える、一日 114 セッションを記録し、最高記録を更新いたしました。ご訪問まことにありがとうございます。

関連する投稿

Windows XP インストール

近所でハトがずっとポッポーと言っていました

近所でハトがずっとポッポーと言っていました

昨日組み立てた新しい PC には、就寝前に Windows XP のインストールを仕掛けておきました。まだ Vista にしないのかと言われそうですが、僕の持っているシンセサイザーが Vista でうまく動かないと評判なのです。まったく Vista には困ったものです。

起床後、仕掛けておいたインストールが終了していたので、さっそく使ってみました。特に異常はなさそうだと思い、マイコンピュータを開いたら驚きました。Windows XP が J ドライブにインストールされているではないですか。

原因は SD カード等のマルチリーダーだったようです。SD カードが C ドライブ、Smart Media が D ドライブ…と続き、その後が新しく買ってきたハードディスクになってしまっていました。USB 接続のマルチリーダーなのに、いったいなぜだろう?

Windows XP ではドライブの文字を変更する機能がありますが、Windows をインストールしたドライブだけは変更できません。いろいろ心配ですので、再インストール。今度はマルチリーダーの接続もはずしておいたからか、うまく C ドライブにインストールできました。

ところが、再びインストールをやり直す羽目になってしまいました。去年買ったハードディスクと、昨日新たに購入したハードディスクから 100GB ずつ出し合って、アプリケーションの高速起動用に 200GB のストライプ・ボリュームを作りたくなったからです。

Windows XP のディスク管理機能では、ボリュームのサイズを増やすことはできても、減らすことはできません(Vista 等ではできます)。GParted でも、ダイナミック・ボリュームのサイズは変更できませんでした。というわけで、残念ながらやり直しです。

しかし、おかげでストライプ・ボリュームにインストールされた Office やシンセサイザーはすこぶる快適です。今まで起動するたびに費やしてきた待ち時間がもったいなかったなと思いました。RAID 0 を組むには費用と安全性が問題になりますが、こうやってプログラム・ファイルだけをストライプに移す分には心配いりませんね。消えても問題ありませんし :-)

関連する投稿

Windows で msgfmt

WordPress のプラグイン YAK の日本語が少々おかしい。例えば、品切れのときに表示されるメッセージは「現在オンラインから、品切れである」う~ん、謎。こんな調子なので、日本語を修 正したいのです。日本語はプラグインのインストールフォルダ内の yak-ja.po に記述してあります。しかし、どんなに書き換えても、画面には全く反映されません。このファイルを msgfmt コマンドで .mo ファイルに変換しなければ、修正が反映されないのです。この msgfmt コマンドを Windows で使用するために、Python を導入しました。インストール後に、インストールフォルダ(デフォルトでは c:\python25、数字はバージョンによって違います。2.5 をインストールしたので 25)に目的の .po ファイル(今回は yak-ja.po)をコピーし、コマンド・プロンプトから
c:\Python25>python c:\python25\tools\i18n\msgfmt.py yak-ja.po
とすれば、.mo ファイルに変換することができます。

関連する投稿

Home > Tags > Windows

Search
Feeds
Meta

Return to page top