mp3 檔案壓縮:到底錯失了什麼

音樂、古典音樂、電影等,各種形式的音樂軟體討論。

版主: devilhades

mp3 檔案壓縮:到底錯失了什麼

文章tim.chnan 發表於 週三 3月 25, 2009 9:45 am

前一陣子發現可以把 音樂檔案放到自己常用的分析軟體中做一樣的分析
而且在聽 mp3, FLAC 的時候,總是疑神疑鬼,不知道聲音被搞成什麼德性
所以乾脆把音樂檔案放到軟體裡面,看音樂訊號的統計性質有沒有什麼差別

說穿了,就是視覺化的轉換,如果不確定聽起來怎樣,訊號看起來的差別也可以得到一些訊息

用的軟體 Matlab R2008a, Wavelet Toolbox
統計方法: Power Spectrum, Wavelet (morlet)
目標音樂檔案:Akiko Suwanai 的 Poeme 專輯第一首歌
不過因為做 Spectrum 的話,如果整首歌全做,不但訊號量太大,而且因為聲音訊號不是保持同樣頻率
所以做 spectrum 不太符合 periodic 的假設特性,因此我只讀其中兩秒 50-52 sec,來做分析


這次比較的是同一個音樂檔案,但是四種格式
*. WAV (很抱歉懶得找 CD 再轉一次,所以用 FLAC 轉成 WAV 代替,這個 FLAC 就是我自己從CD壓的)
這個代表參考訊號

以下三組是比較訊號
*. mp3 65 kbps (用 lame 3.98 beta6,從 FLAC 轉成mp3 再轉成 wav,以方便 Matlab 吃檔)
*. mp3 190 kbps (用 lame 3.98 beta6,從 FLAC 轉成mp3 再轉成 wav,以方便 Matlab 吃檔)
*. FLAC: 既然要比較 FLAC 而我這一次又沒有找原本的 WAV 檔案,所以我把 FLAC 轉成 WAV 再轉成 FLAC 反覆4次,最後存成 WAV 格式

首先看 power spectrum,這個方法簡單來說就是把訊號的 variance 分佈到三角函數的頻率上面,可以看到不同的訊號平均來說,再哪一個頻率上面擺幅/能量最大 (假設基本訊號是正弦波)。

比較 WAV 和 FLAC
原本的訊號可以看到(藍色代表wav 檔案/參考訊號,紅色代表 flac 檔案),兩者幾乎一樣,看不出來有什麼差別,再 600- 1100 Hz 中間有明顯的峰值。

這是 PSD (Power Spectral Density Function), 橫軸是 對數尺度 (log scale) 的頻率,縱軸是 對數尺度 (log scale) 的能量密度
圖檔
另一種畫法,Variance Preserving Spectrum
這種畫法基本上跟 PSD 差不多,不過 PSD 會有放大低頻訊號的感覺,這種 Variance Preserving Spectral 縱軸是線性尺度能量,而且積分代表頻率內的 variance。
圖檔
可以比較清楚看到峰值

而比較 190 kbps MP3 和 wav 檔案
基本上差別不太大,峰值的位置都差不多一樣,最低頻和最高頻的頻譜有點差別,不過都在人耳或器材的響應頻率之外,所以應該沒什麼差。BTW, 為了測試我的器材和耳朵的頻率範圍,我也用 sin 訊號產生了 wav 音訊檔,果然 20Hz 和 20 kHz 我都聽不到,50Hz 和 10 kHz 就都可以聽到了 (器材是NB 耳機輸出搭配 AKG K14P)。

圖檔
圖檔

而比較 65 kbps MP3 和 wav 檔案
可以說是天差地遠,峰值的位置都差很多,雜訊也整個冒出來,聽起來會很糊!? 假的訊號峰值還比原來的訊號強。

圖檔
圖檔
最後由 tim.chnan 於 週三 3月 25, 2009 10:31 am 編輯,總共編輯了 1 次。
{Raspberry-Pi,PC} / {RME UFX as DA/DSP X-over/Pre} / {Amp & Speakers: Dayton RS225, ScanSpeak D3004/604010, FaitalPro 10RP200}
Other Cans: Sennheiser HD800, Sony MDR Z7, Sennheiser Momentum Wireless 2
tim.chnan
SR125
SR125
 
文章: 348
註冊時間: 週一 9月 18, 2006 6:43 pm
來自: Hsinchu

Re: mp3 檔案壓縮:到底錯失了什麼

文章tim.chnan 發表於 週三 3月 25, 2009 10:00 am

第二部分,用 Wavelet 分析
頻譜是假設整段兩秒的訊號都有一樣均勻的統計性質,但是顯然不可能音樂兩秒都是一樣的聲音,所以這個假設不太正確。因此用 Wavelet,Wavelet 基本上只用一小段的基本波行來類比整個訊號的擺動特質,然後以不同的放大比例和函數平移參數,所以可以表示訊號在頻率 (其實是放大比例)和時間上的能量分佈。

簡單來說,x 軸是時間 (共兩秒),Y軸 是頻率,顏色代表能量分佈

這個圖示我用的 Wavelet (kernel function of the transform)
Morlet = exp(-x^2/2)*cos(5x)
圖檔

以下的 Wavelet 圖形,第一個子圖都是原本 WAV 參考訊號的 wavelet 圖形(參考),第二個子圖是比較的訊號(代表 FLAC, 65k MP3, 190k MP3 訊號),地三個子圖則是比較訊號以及原本 WAV 參考訊號算出來 Wavelet 的差值 (第二個子圖 減 第一個子圖,可以說是 Wavelet 的 Error)
WAV 和 FLAC 比較,基本上兩個差不多完全一樣,第三個子圖是兩個 wavelet 係數的差,內容數值都是零
圖檔

WAV 和 190 kbps MP3 比較,基本上整體圖形分佈差不多,但是在第三個子圖裡面還是可以看到一些差異。
圖檔

WAV 和 65 kbps MP3 比較,基本上整體圖形分佈已經完全不一樣,但是在第三個子圖裡面,兩組訊號的 wavelet 係數差異值大小,以經跟原本 wav 訊號的數值差不多了 (colorbar 數值一樣,代表 Error 跟原本訊號的數量級一樣)。
圖檔
最後由 tim.chnan 於 週三 3月 25, 2009 10:16 am 編輯,總共編輯了 1 次。
{Raspberry-Pi,PC} / {RME UFX as DA/DSP X-over/Pre} / {Amp & Speakers: Dayton RS225, ScanSpeak D3004/604010, FaitalPro 10RP200}
Other Cans: Sennheiser HD800, Sony MDR Z7, Sennheiser Momentum Wireless 2
tim.chnan
SR125
SR125
 
文章: 348
註冊時間: 週一 9月 18, 2006 6:43 pm
來自: Hsinchu

Re: mp3 檔案壓縮:到底錯失了什麼

文章tim.chnan 發表於 週三 3月 25, 2009 10:02 am

:haha: 這不是很專業的聲音訊號處理,請大家隨意看看,隨意給些意見 :bow: :bow:
看圖說故事的話

FLAC 和 WAV 轉換不會造成差別,至少訊號上看不出來。

190 kbps MP3, 基本上差異不大,訊號上統計性質一致。

65 kbps MP3, 面目全非
{Raspberry-Pi,PC} / {RME UFX as DA/DSP X-over/Pre} / {Amp & Speakers: Dayton RS225, ScanSpeak D3004/604010, FaitalPro 10RP200}
Other Cans: Sennheiser HD800, Sony MDR Z7, Sennheiser Momentum Wireless 2
tim.chnan
SR125
SR125
 
文章: 348
註冊時間: 週一 9月 18, 2006 6:43 pm
來自: Hsinchu

Re: mp3 檔案壓縮:到底錯失了什麼

文章Tommy Chang 發表於 週三 3月 25, 2009 12:15 pm

tim.chnan 寫::haha: 這不是很專業的聲音訊號處理,請大家隨意看看,隨意給些意見 :bow: :bow:
看圖說故事的話

FLAC 和 WAV 轉換不會造成差別,至少訊號上看不出來。

190 kbps MP3, 基本上差異不大,訊號上統計性質一致。

65 kbps MP3, 面目全非


所以依照 tim 兄的測試, 基本上只要是 FLAC 的格式 與 CD 是沒有什麼差異的 ?

也就是說, 如果能找到一部好的 DAC 再加上數位訊源 (如 PC) 基本上是可完全取代 CD player?
潛水中 ........
頭像
Tommy Chang
SR40
SR40
 
文章: 0
註冊時間: 週二 4月 17, 2007 7:46 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章tim.chnan 發表於 週三 3月 25, 2009 12:45 pm

Tommy Chang 寫:
tim.chnan 寫::haha: 這不是很專業的聲音訊號處理,請大家隨意看看,隨意給些意見 :bow: :bow:
看圖說故事的話

FLAC 和 WAV 轉換不會造成差別,至少訊號上看不出來。

190 kbps MP3, 基本上差異不大,訊號上統計性質一致。

65 kbps MP3, 面目全非


所以依照 tim 兄的測試, 基本上只要是 FLAC 的格式 與 CD 是沒有什麼差異的 ?

也就是說, 如果能找到一部好的 DAC 再加上數位訊源 (如 PC) 基本上是可完全取代 CD player?


不完全是,FLAC 和 CD或 WAV檔 頂多只能說 "在訊號上保持相同的資訊。在資訊儲存的角度來看,FLAC 沒有比較差"
但是播放的時候,牽涉到儲存媒體的讀取,訊號處理轉換,以及聲音訊號送出 (streaming)
所以數位訊源是否能取代 CD player,仍然看產品本身的設計,不同的產品有不同的訊號處理機制

另一方面來說,這種視覺化的比較有點一廂情願,我並不知道人耳聽覺可以察覺到什麼程度的細節
以 190 kbps MP3 檔案對比原來 WAV 訊號來說,一般視覺化看到這樣的頻譜或是 Wavelet 資料,大部分人會同意這兩組訊號性質一樣,但是對焼友來說,也許這些能量不大的訊號差異,正是造成 90分與95分 的巨大差異。

不過在這個小小的試驗當中,我學到了幾件事情。
(1). 20 Hz 和 20 kHz 我真的聽不到,50Hz 和 10 kHz 就沒問題了。所以別人說 20- 20kHz 的人耳頻率響應範圍,可能是真的。
(2). mp3 壓縮品質不好的話,聽到的不只是聲音品質差,而且聲音訊號根本不正確,不只是雜訊出現以及高低頻延展不好,主要訊號的頻率都會被改變。
(3). 從這樣的圖形比較,我心理上信任 FLAC 檔案。(當然實際上聽可能 WAV 還是略好,因為數位訊源不需要做 FLAC 解壓縮到 WAV 的動作)
{Raspberry-Pi,PC} / {RME UFX as DA/DSP X-over/Pre} / {Amp & Speakers: Dayton RS225, ScanSpeak D3004/604010, FaitalPro 10RP200}
Other Cans: Sennheiser HD800, Sony MDR Z7, Sennheiser Momentum Wireless 2
tim.chnan
SR125
SR125
 
文章: 348
註冊時間: 週一 9月 18, 2006 6:43 pm
來自: Hsinchu

Re: mp3 檔案壓縮:到底錯失了什麼

文章Tommy Chang 發表於 週三 3月 25, 2009 1:58 pm

謝謝 tim 兄的解說 , 我個人倒有一些淺見 ,可提供研究一下 !!

個人的認知 , 會影響 CD player 的表現, 主要有

1. 轉盤是否能讀取正確的資訊 (這可能又跟 laser讀取及Jitter 有關),
>> 除非片商能提供高品質的數位音訊檔 (最好是它們用來壓 CD 片的 :ho:), 否則還是得透過光碟機將音訊讀出來

2. DAC 能否能將 digital 的訊號完整的轉換成 analog 輸出 (這可能又牽涉到整個電源供給是否良好,乾淨),

3. 能否提供升頻 (如 192k Hz upsampling) !!
>> 這點雖非必備 , 但理論上有加分作用

所以在一般的數位訊源 (如 PC) ,扣除聲音壓縮所造成的 lost, 是否 CD player 所可能發生的問題, 也都應考慮進去,

才有機會體驗到高品質的數位音樂嗎? 這樣一來, 所投資的升級費用應該還是不小才對!!

不過優點是少了 CD片的媒介,倒不失為一個備份數位資料的好方法 :ho: !!
潛水中 ........
頭像
Tommy Chang
SR40
SR40
 
文章: 0
註冊時間: 週二 4月 17, 2007 7:46 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章TMNEXT 發表於 週三 3月 25, 2009 3:18 pm

小弟的一點心得分享

FLAC 是無損失(無失真)壓縮,也就是說和我們一般壓縮文件使用的 ZIP 壓縮一樣,
我們將 ZIP 檔案解碼以後,會得到和原來一樣的文件,
如果 ZIP 壓縮法解碼後的文件會和原來不一樣,
那麼我們大概也不敢用 ZIP 來壓縮和保存任何文件了 :P

FLAC 也是一樣,將 FLAC 解碼以後,比對解碼後的資料和原始的資料,
一個 bit 一個 bit 的比對,會得到完全一模一樣的資料。
所以如果比對 FLAC 和 WAV 解碼後的頻譜,不論是哪一個時間點的瞬時頻譜,
或者是一段時間內的統計頻譜,所得到的結果會是完全一樣,
因為 FLAC 解碼後的每一個 sample,都和原始 PCM 的每一個 sample 一模一樣。
所以驗證 FLAC 的資料,我們還不用轉換到頻率域上來做頻譜分析,
直接將解碼後的資料和原始 PCM 做 bit 比對,就可以得到完全一樣的結果。

至於大家擔心的 FLAC 播放需要做解碼,其實 WAV 播放也是需要 decode 的,
播放軟體要分析 WAV 的檔頭,資料格式,將 WAV 內的 PCM data 包裝起來,
對齊好以後通過記憶體匯流排傳送給音效卡,然後才能由 DAC 做數位類比的轉換。
FLAC 同樣也是經過這樣的 decode 動作,只是它的 data 封裝方法比較複雜,
解碼的手續過程比較多一點,不過最後對齊好傳送到音效卡上的資料,
和 WAV 都是同樣的 PCM data,兩者並無二致。

而 MP3 的話,是有損失的壓縮,當然做 bit 比對的話和原始資料一定不一樣。
MP3 的壓縮法即使不經過有損失壓縮的步驟,光是第一階段將資料轉換到頻率域
所使用的多相濾波組,將原始的 sample data 轉換成 32 組的次頻帶,
光是這個前置動作就是有損失的,經過這樣轉換後的頻譜資料
是無法無失真的再轉換回原始的資料的。
而在頻譜分析的表現上,它的頻譜首先會有很明顯的高頻損失,
視壓縮的流量,譬如說 128kbps 通常高頻的 cut off 會在 14~16KHz,
192kbps 以上高頻可以保留至 17~19KHz。
像 lame 這種比較聰明的 encoder,它的低通濾波截止點會動態變化,
當高頻訊號不太重要的時候,它的 cut off 會自動降低,
刪多一點高頻,保留較多的流量給比較重要的低頻來使用。
當高頻出現很重要的訊號的時候,例如說音樂當中的銅鈸敲響的瞬間,
銅鈸有很多的高頻泛音,這時高頻很重要,它的 cut off 會自動調高,
保留多一點的高頻以免聲音出現很明顯的缺陷。

如同 tim.chnan 大所述,這些特性從一段長時間內的統計資訊中是看不出來的,
所以聲音的訊號最好是觀察瞬時的頻譜,譬如說取 4096 個 sample point,
一邊聽聲音的同時一邊看當下對應的頻譜變化。
這樣不但可以掌握聲音瞬間的流動和變化,經過長久這樣的訓練以後,
我們會對聽到的每個聲音,它的組成和對應的頻率,在頻譜上能量分佈的比例和狀態,
會非常的熟悉與熟練,以後甚至不用看頻譜,光是聽到聲音就會自動在腦海中產生對應的圖形 :D
這樣跟別人描述聲音的時候,也不會模稜兩可,虛無飄渺,而可以很明確分析,
聽到的高頻帶給我們感到明亮具有穿透力的是那個頻率的聲音,
這段聲音之所以聽起來會有這樣的特性是因為頻譜是怎樣的分佈狀態...等等,
可以自然的將聲音和圖形連結起來,並且做很明確而精細的分析 :)

不過,我們聽到相當多的 MP3 的缺陷是從頻譜上不太看得出來的,
例如說前述的高頻損失,雖然 MP3 常常切掉 16KHz 以上的高頻,
但是在音樂中 16KHz 以上的高頻往往也不是非常重要,
而我們對於這樣的高頻的敏銳度也比較低,甚至有些人可能完全聽不到。
所以雖然我們從頻譜上看到很明顯的 MP3 切掉這些高頻,
我們也不見得聽得出來這些高頻損失的影響。
但是重點不是在損失的這些高頻,而是在切掉這些高頻後,會連帶影響相位的變化,
如果是用耳機,我們可能會覺得聲音不自然,變得比較沈悶,說不出來的怪;
如果是用喇叭,在音場表現正確的喇叭上,我們會很明顯注意到音像變得模糊了,
這是因為原本記錄的立體聲的相位資訊遭到破壞了。
但是這個一聽就很明顯的缺陷,我們最直接的感受,單獨從頻譜上是看不出來的。

另外一種 MP3 很明顯的壓縮瑕疵,也是不太容易從頻譜上觀察出來的,
就是高頻的壓縮瑕疵。
MP3 壓縮,一次會取一個 frame,這個 frame 的長度還蠻長的,
遇到那種瞬態巨大變動的訊號,這個就是它的罩門了,
這時壓縮瑕疵的雜訊會擴散到整個 frame,從時間軸上看起來,
就是不該有的雜訊訊號散佈在整個時間的區塊裡面,
我們會在真正的音樂訊號開始之前,就聽到一堆不是音樂訊號的雜音。
這種在時間軸上瀰漫散佈的雜訊,在敲擊樂器的高頻上最為明顯,
所以我們常常會聽到 MP3 的高頻聽起來悉悉刷刷的,
有時候聽起來像在敲破銅爛鐵,聲音變得很空洞;
有時候聽起來聲音一團雜亂,全部黏在一起,無法清楚的聽到每一個敲擊點。
這種高頻殘破的缺陷,是很明顯的 MP3 壓縮瑕疵,
但是我們從頻譜上看不太出來這個時間軸上的缺陷,
即使我們看的是瞬時的頻譜變化,也要很仔細的比對前後的頻譜變化,
才能確認這個時間軸上的缺陷。

因為上述的困難,所以大部分用頻譜方法比較 MP3 和 WAV 的實驗多半會遇到這樣的瓶頸,
只能看看高頻切割損失的情況,但是沒有辦法說明實際聽感聽到的壓縮瑕疵 :P
更可怕的是,有時候我們觀測到很大的訊號損失,但是實際上卻聽不出來,
因為聲音進入大腦以後,還要經過很複雜的心理聲學的處理,
所以物理上的重大瑕疵,心理卻不一定覺得那是個瑕疵 :mad:

所以聲音訊號的分析,要和實際聽覺作連結,真的是非常困難的一門學問.... :)
やヘネベメ失よ夢メ見サ 泣わスゎヘ起わペ アソ恐怖ゎ解ベネエろ?
頭像
TMNEXT
SR40
SR40
 
文章: 15
註冊時間: 週三 4月 17, 2002 3:35 am
來自: ,,

Re: mp3 檔案壓縮:到底錯失了什麼

文章class6 發表於 週三 3月 25, 2009 3:34 pm

不知TMNEXT兄有無興趣分析一下:
"不同的播放器/錄音程式 聲音不同的原因"

理論上.
播放器不會對WAV檔做任何事情不是嗎?
但聲音就是不一樣啊.....
圖檔
class6
SR40
SR40
 
文章: 19
註冊時間: 週四 12月 07, 2006 2:29 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章Mira 發表於 週三 3月 25, 2009 8:11 pm

class6 寫:不知TMNEXT兄有無興趣分析一下:
"不同的播放器/錄音程式 聲音不同的原因"

理論上.
播放器不會對WAV檔做任何事情不是嗎?
但聲音就是不一樣啊.....

自己的建議是,如果可以在公開公正有第三方人見證的情況下,盲測證明條件相同的播放器之間聲音可輕易分辨出不同、知道是何種播放器的聲音。那就可以作為確實的反證。不然無根據的個人感覺則只是空談就是了。
電腦播放軟體的聲音差異
If you believe that a codec(buffer,latency,audio player,etc) changes the sound, it is up to you to prove it, passing the test.
頭像
Mira
SR40
SR40
 
文章: 7
註冊時間: 週日 1月 07, 2007 2:16 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章class6 發表於 週三 3月 25, 2009 8:32 pm

關於盲測的看法.
個人的觀點 和這篇文章中提到的類似:
http://www.acanddc.com/dpage00.htm

盲測失敗......只能證明人類是一種沒有絕對聽感. 而且會聽覺疲勞的動物.


很多播放/錄音程式. 都可以免費的合法使用(播放).
您可以多試幾種.


CSAWStudio 最大的差異是低音.
找些低音鼓 電子低頻多的音樂.


Wavelab都覺得聽不出來.
我也不知道該說什麼了.
它和foobar的差異相當的大.

我可以接受有人說Wavelab比foobar棒很多.(雖然我認為它很爛).
喜好本來就是主觀的.

但是我沒辦法接受你說它們是一樣的.
明顯的不同是客觀的.
我會質疑您聆聽比較的環境和過程.
也許您真的是聽到 差異很小的聲音.
那代表在某些環節上 您和其他的人有相當關鍵的不同處.

不同.....並不代表哪邊就是對的或錯的.
只是代表 二方根本是在講不一樣的狀況.
圖檔
class6
SR40
SR40
 
文章: 19
註冊時間: 週四 12月 07, 2006 2:29 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章Mira 發表於 週三 3月 25, 2009 9:03 pm

其實這邊提到的播放器自己都有安裝、研究,也有找人進行盲測。但得到的結果都是不好的(無法分辨),與 AA 試用者的心得相差甚遠。Mira 自己更不用說了,連同時播放都聽不出差別,感覺真是糟透了。

音樂當然是自己喜歡就好。不過,一旦將範圍擴大,就不是一個人的標準可以通用到底。該文一句話說的不錯:「你可以不理會客觀標準的存在,但不能否定客觀標準的存在;更不能因自己條件不符,進而去蔑視客觀標準的存在。」

『在追求極致精確的微小差異前』一文中也說的很好:「那些所謂的調聲道具、調聲方法,都是在影響不大的細節上吹毛求疵,真的會對音質造成重大的影響嗎?如果會,為什麼那麼多正常人聽不出來差異?」、「其實任何正常人都可以聽得出來好壞差異,明顯優秀許多的聲音一定會瞬間得到你的認同。」沒有錯,他們都說的很對。但自己的周邊得不到與 AA 測試者相同的心得驗證。

同樣是音樂專門討論區,Hydrogenaudio 的方式就是屬於非常客觀的類型。它要求任何發表看法的人,必須為自己的言行負責,亦就是自己的理論必須要有相應的根據。所以常在觀察該討論區的使用者,也可以看見沒有任何人發表播放器音質差異的主題或見解。就算提到差異比較,也要求提問者自己先盲測之後再依照自己的答案進行選擇,其他主題參與者只提供客觀的看法。這種「理性看法」與中文討論區的「感性看法」有相當大的差異,也是自己比較認同的方式。感性的討論,容易淪為各說各話,沒有一定與確實的標準存在。

明顯巨大的差異,一定能得到客觀的認同。盲測這關過不了,就無法成為大眾普世公認的標準。
電腦播放軟體的聲音差異
If you believe that a codec(buffer,latency,audio player,etc) changes the sound, it is up to you to prove it, passing the test.
頭像
Mira
SR40
SR40
 
文章: 7
註冊時間: 週日 1月 07, 2007 2:16 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章class6 發表於 週三 3月 25, 2009 9:12 pm

我們做一個反向的盲測好了.

找二台.
不一樣. 但是很聲音很像的擴大機做盲測.

結果FAIL了.
A和B分不出來.

你相信
二台電路用料完全不一樣AMP的聲音. 會是一模一樣嗎?
圖檔
class6
SR40
SR40
 
文章: 19
註冊時間: 週四 12月 07, 2006 2:29 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章Mira 發表於 週三 3月 25, 2009 9:19 pm

class6 寫:我們做一個反向的盲測好了.

找二台.
不一樣. 但是很聲音很像的擴大機做盲測.

結果FAIL了.
A和B分不出來.

你相信
二台電路用料完全不一樣AMP的聲音. 會是一模一樣嗎?

這樣比較就有邏輯上的問題了,不能等而視之。

第一、材料不同。
第二、現在的討論是,在同一個機械上,不同軟體的聲音比較。兩者不能相提並論。

就好像是在兩個不同的電腦上比較軟體聲音一樣,沒有測試會這麼做的。
電腦播放軟體的聲音差異
If you believe that a codec(buffer,latency,audio player,etc) changes the sound, it is up to you to prove it, passing the test.
頭像
Mira
SR40
SR40
 
文章: 7
註冊時間: 週日 1月 07, 2007 2:16 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章class6 發表於 週三 3月 25, 2009 9:31 pm

再舉一個例子.

拿二張色卡
只差個1~2號. 顏色非常接近的色卡.
並排在你前面.
可以看出來二張些微的不同.

然後把它們收起來.
拿一張出來 要你分辨A和B.
結果分不出來了.

這代表之前
覺得二張色卡是不一樣的......是在唬爛嗎?


人可以同時比較二種很接近的顏色.
卻不能同時比較二種很接近的聲音.

所謂盲測
只是個感官上的陷阱.
圖檔
class6
SR40
SR40
 
文章: 19
註冊時間: 週四 12月 07, 2006 2:29 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章Mira 發表於 週三 3月 25, 2009 9:37 pm

以下這句話其實有些道理在。

我曾經在《交直流》第18期上寫過一篇文章:音響學的基礎是欺騙,當然也得到很多人認同。例如明明是中國大陸製造,卻在機背上印USA或Germany;而音響雜誌的主筆雖心 知肚明,卻完全不表現在文字上,寧願當幫凶─只要對方刊登廣告;反正有奶便是娘。

玩音響的最高境界是什麼?就是自己騙自己。


兩種硬體聽不出差異,除了喜好取向與沒有金耳朵的天生神力之外,就是兩種之間的差異幾乎可以忽略不計。那麼之前說有差異的人,可以將他歸類為以下兩種。

一、騙子。
二、通過盲測考驗確實可指證出來的金耳朵。

-----------
顏色的問題,還是留給實際測試的例子去證明。比起視覺的一目瞭然,聽覺更為抽象。
電腦播放軟體的聲音差異
If you believe that a codec(buffer,latency,audio player,etc) changes the sound, it is up to you to prove it, passing the test.
頭像
Mira
SR40
SR40
 
文章: 7
註冊時間: 週日 1月 07, 2007 2:16 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章class6 發表於 週三 3月 25, 2009 10:16 pm

Hydrogenaudio的做法.
可以當做是一種避免吵架的手段.

雖然您不太喜歡.
我還是用色卡的例子.
如果要PASS盲測.
可能色卡要差到5~6號.
然而我們都是在討論1~2號這樣差異的問題.

就像那篇文章說的. 3/5A 和DY的喇叭的差異.
我認為在音響盲測能PASS的差異.
會是 "大到沒有人會去認為還需要測的差異" .


我想您應該也爬過很多文.
看到很多人都說會不一樣.

您應該去檢視自己哪一個環節.
和別人"不同".
就我知道的一件事: 您用的是WINDOWS 7 就可能相當關鍵.
沒必要在這列什麼器材設定明細.
聲音的環節太多了.
圖檔
class6
SR40
SR40
 
文章: 19
註冊時間: 週四 12月 07, 2006 2:29 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章class6 發表於 週三 3月 25, 2009 10:55 pm

您有提到"騙子"這樣的字眼.

我不知道"Wavelab和foobar差異很大" .......能騙到您什麼東西?

就算"SAWStudio音質很好" 或 "Wavelab不是我的菜" 這種比較主觀的話.......又能騙到您什麼東西?

這些東西都是FREE的(DEMO版).
滑鼠按一按就能下來用.


還是說有聽到不同......就會變成"高級音響人"了?
WAV和 FLAC APE我就聽不出來啊.
有人說他聽的出來.....他系統調的好吧.
我也知道FLAC解出來會和WAV一模一樣.
但我相信 或許還有一些會造成不同的可能性.
他聽出來就聽出來了啊.
也許有一天 我也會聽出來.
也許他心裡有數 都是純屬虛構.

大家都接觸音響有段時間了.
不用還把這些事看得這麼重.
在網路聽人說 某某播放程式大勝foobar. 我也聽了有一年多了.
不是真的有要用錄音程式. 我大概現在還不會去TRY這些東西.
SAWStudio的確個人是覺得相當好.
但某些人形容成"垃圾"的foobar....我之後也還是會繼續用.
我可沒本事把500G的音樂全都弄成WAV檔.
至少也換過5~6台CD PLAYER了.
foobar是不是"垃圾".......不需要現在才能知道.

音響這種眉眉角角的東西太多了.
中國的音響網站 很多人說話都很嗆.
好像聽到什麼 就很了不起了. :x
最後由 class6 於 週三 3月 25, 2009 11:37 pm 編輯,總共編輯了 6 次。
圖檔
class6
SR40
SR40
 
文章: 19
註冊時間: 週四 12月 07, 2006 2:29 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章Mira 發表於 週三 3月 25, 2009 10:57 pm

如果有對系統音效運作原理進行深入研究,是不會將其納入影響的環節之中。
電腦播放軟體的聲音差異
If you believe that a codec(buffer,latency,audio player,etc) changes the sound, it is up to you to prove it, passing the test.
頭像
Mira
SR40
SR40
 
文章: 7
註冊時間: 週日 1月 07, 2007 2:16 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章tim.chnan 發表於 週三 3月 25, 2009 11:03 pm

Tommy Chang 寫:謝謝 tim 兄的解說 , 我個人倒有一些淺見 ,可提供研究一下 !!

個人的認知 , 會影響 CD player 的表現, 主要有

1. 轉盤是否能讀取正確的資訊 (這可能又跟 laser讀取及Jitter 有關),
>> 除非片商能提供高品質的數位音訊檔 (最好是它們用來壓 CD 片的 :ho:), 否則還是得透過光碟機將音訊讀出來

2. DAC 能否能將 digital 的訊號完整的轉換成 analog 輸出 (這可能又牽涉到整個電源供給是否良好,乾淨),

3. 能否提供升頻 (如 192k Hz upsampling) !!
>> 這點雖非必備 , 但理論上有加分作用

所以在一般的數位訊源 (如 PC) ,扣除聲音壓縮所造成的 lost, 是否 CD player 所可能發生的問題, 也都應考慮進去,

才有機會體驗到高品質的數位音樂嗎? 這樣一來, 所投資的升級費用應該還是不小才對!!

不過優點是少了 CD片的媒介,倒不失為一個備份數位資料的好方法 :ho: !!


要從訊號的觀點來看,那需要有儀器可以擷取不同時候的訊號,例如可以讀取 送進 DAC 前後的數位/類比訊號,然後來做訊號分析,這些量測硬體,目前沒有

昇頻,這個原理我瞭解甚少,通常昇頻降頻,除了取樣問題之外,還會有 filter 等手段和一些其他的考量,所以每家的昇頻技術可能會有不同,用耳朵來判斷的話,我覺得我手上的器材,昇頻不見得會比較好聽
{Raspberry-Pi,PC} / {RME UFX as DA/DSP X-over/Pre} / {Amp & Speakers: Dayton RS225, ScanSpeak D3004/604010, FaitalPro 10RP200}
Other Cans: Sennheiser HD800, Sony MDR Z7, Sennheiser Momentum Wireless 2
tim.chnan
SR125
SR125
 
文章: 348
註冊時間: 週一 9月 18, 2006 6:43 pm
來自: Hsinchu

Re: mp3 檔案壓縮:到底錯失了什麼

文章Mira 發表於 週三 3月 25, 2009 11:07 pm

class6 寫:您有提到"騙子"這樣的字眼.

我不知道"Wavelab和foobar差異很大" .......能騙到您什麼東西?


就算"SAWStudio音質很好" 或 "Wavelab不是我的菜" 這種比較主觀的話.......又能騙到您什麼東西?

這些東西都是FREE的(DEMO版).
滑鼠按一按就能下來用.


還是有聽到不同......就會變成"高級音響人"了?
WAV和 FLAC APE我就聽不出來啊.
有人說他聽的出來.....他系統調的好吧.
我也知道FLAC解出來會和WAV一模一樣.
但我相信 或許還有一些會造成不同的可能性.

大家都接觸音響有段時間了.

也許 class6 誤會了,自己想要表達的是按照梁中鍔話中之意來提出的話。誰說好誰說壞自己不是那麼在意,自己真正在意的是「誤導」,因為個人主觀扭曲了原先的真實,畢竟群眾是盲目的。再來,科學本就是一板一眼,0 就是 0,1 就是 1。光是相信而不對其進行了解,對真實沒有任何幫助。或許會以為 Mira 是站在對立方,但如果真的有辦法指出不同,也是自己所希望見到的。
電腦播放軟體的聲音差異
If you believe that a codec(buffer,latency,audio player,etc) changes the sound, it is up to you to prove it, passing the test.
頭像
Mira
SR40
SR40
 
文章: 7
註冊時間: 週日 1月 07, 2007 2:16 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章Mira 發表於 週三 3月 25, 2009 11:10 pm

tim.chnan 寫::haha: 這不是很專業的聲音訊號處理,請大家隨意看看,隨意給些意見 :bow: :bow:
看圖說故事的話

FLAC 和 WAV 轉換不會造成差別,至少訊號上看不出來。

190 kbps MP3, 基本上差異不大,訊號上統計性質一致。

65 kbps MP3, 面目全非

離題到現在才對本篇進行回覆真是抱歉,自己很喜歡這類視覺化的分析,這項測試讓自己大飽眼福。如果方便的話,是否也能進行其它格式的分析呢?
電腦播放軟體的聲音差異
If you believe that a codec(buffer,latency,audio player,etc) changes the sound, it is up to you to prove it, passing the test.
頭像
Mira
SR40
SR40
 
文章: 7
註冊時間: 週日 1月 07, 2007 2:16 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章tim.chnan 發表於 週四 3月 26, 2009 12:22 am

謝謝 TMNEXT 兄的指教 :bow:

TMNEXT 寫:小弟的一點心得分享

FLAC 是無損失(無失真)壓縮,也就是說和我們一般壓縮文件使用的 ZIP 壓縮一樣,
我們將 ZIP 檔案解碼以後,會得到和原來一樣的文件,
如果 ZIP 壓縮法解碼後的文件會和原來不一樣,
那麼我們大概也不敢用 ZIP 來壓縮和保存任何文件了 :P

FLAC 也是一樣,將 FLAC 解碼以後,比對解碼後的資料和原始的資料,
一個 bit 一個 bit 的比對,會得到完全一模一樣的資料。
所以如果比對 FLAC 和 WAV 解碼後的頻譜,不論是哪一個時間點的瞬時頻譜,
或者是一段時間內的統計頻譜,所得到的結果會是完全一樣,
因為 FLAC 解碼後的每一個 sample,都和原始 PCM 的每一個 sample 一模一樣。
所以驗證 FLAC 的資料,我們還不用轉換到頻率域上來做頻譜分析,
直接將解碼後的資料和原始 PCM 做 bit 比對,就可以得到完全一樣的結果。


bit-to-bit 比較,事實上是一種比較嚴苛的標準,通常提到的 "相同的資料" 有時候並不是只一模一樣的時間序列(數學上的等於,也就是每一個資料點的數值都相等),例如說有時候可能檔案存取會有不同的 lag ( f(t) => f(t+b) ),或是某個訊號被乘上一個常數因此其振幅 放大/縮小了 ( f(t) => c*f(t) ),這類情況下,可能訊號本身的擺動性質沒有改變,但是訊號的數值比較會有很大差異,在之前,我並不知道 FLAC 格式的轉換,有沒有影響到音樂訊號的數值大小,與其一個一個考慮訊號可能被平移/放大..等等,不如直接放到統計方法裡面看他 variation 的統計性質,這是我的粗略判斷邏輯,套用 Supra Cable 廣告裡面的話 "audio signals are nothing but variations",另一方面,在比較 mp3 訊號的時候,同樣的標準也可以一併套用。 說穿了,就是我懶惰,必較 bit-wise 是否相同,還不如用統計方法來看比較簡單。


TMNEXT 寫:小弟的一點心得分享

而 MP3 的話,是有損失的壓縮,當然做 bit 比對的話和原始資料一定不一樣。
MP3 的壓縮法即使不經過有損失壓縮的步驟,光是第一階段將資料轉換到頻率域
所使用的多相濾波組,將原始的 sample data 轉換成 32 組的次頻帶,
光是這個前置動作就是有損失的,經過這樣轉換後的頻譜資料
是無法無失真的再轉換回原始的資料的。
而在頻譜分析的表現上,它的頻譜首先會有很明顯的高頻損失,
視壓縮的流量,譬如說 128kbps 通常高頻的 cut off 會在 14~16KHz,
192kbps 以上高頻可以保留至 17~19KHz。
像 lame 這種比較聰明的 encoder,它的低通濾波截止點會動態變化,
當高頻訊號不太重要的時候,它的 cut off 會自動降低,
刪多一點高頻,保留較多的流量給比較重要的低頻來使用。
當高頻出現很重要的訊號的時候,例如說音樂當中的銅鈸敲響的瞬間,
銅鈸有很多的高頻泛音,這時高頻很重要,它的 cut off 會自動調高,
保留多一點的高頻以免聲音出現很明顯的缺陷。

如同 tim.chnan 大所述,這些特性從一段長時間內的統計資訊中是看不出來的,
所以聲音的訊號最好是觀察瞬時的頻譜,譬如說取 4096 個 sample point,
一邊聽聲音的同時一邊看當下對應的頻譜變化。
這樣不但可以掌握聲音瞬間的流動和變化,經過長久這樣的訓練以後,
我們會對聽到的每個聲音,它的組成和對應的頻率,在頻譜上能量分佈的比例和狀態,
會非常的熟悉與熟練,以後甚至不用看頻譜,光是聽到聲音就會自動在腦海中產生對應的圖形 :D
這樣跟別人描述聲音的時候,也不會模稜兩可,虛無飄渺,而可以很明確分析,
聽到的高頻帶給我們感到明亮具有穿透力的是那個頻率的聲音,
這段聲音之所以聽起來會有這樣的特性是因為頻譜是怎樣的分佈狀態...等等,
可以自然的將聲音和圖形連結起來,並且做很明確而精細的分析 :)



頻譜限制很大,所以一般常見的作法是看 短時間的頻譜 或稱 spectrograms
也就是如 TMNEXT 大所提到,取 4096 個 smple point 來做短時間的頻譜,這樣就是 spectrograms 和一般軟體如 foobar 常會有的視覺化表現,但是這樣做也有統計上的取捨,首先 4096 sample points 在 44.1 kHz 取樣下大約為 0.1 秒訊號長度,這樣的頻譜就代表最低只能表現 10 Hz 訊號,而且頻率解析度也只有 10 Hz,我不太確定人耳頻率解析度只有 10 Hz。所以我傾向用 Wavelet 小波轉換來視覺化。

小波轉換可以避開 "時間軸上的高解析度換來頻率軸的低解析度" 這種缺點,而且同樣也可以表現能量在頻率和時間上的分佈,小波轉換的缺點在於他對 Wavelt 函數本身的形狀比較敏感,我選擇 Morlet 形狀是因為我假設音樂訊號變動本身可以用 sin/cos 函數來表現。小波轉換的圖形,事實上可以用來探討 TMNEXT 大提到的問題,聲音在頻率與時間上的分佈,以及 mp3 破壞性壓縮對訊號的改變,都可以在圖上看得出來一些端倪,甚至 TMNEXT 大說到的問題,如 10 kHz 以上高頻訊號對聲音的重要性,應該也可以透過 小波轉換,先把 10kHz 以上的高頻訊號拿掉 (例如說做一次離散小波轉換,分離高頻和低頻訊號),然後來比較聽覺和視覺性的差別。

如同 TMNEXT 大說的,要具體化聽覺感受,是很難的一件事情,主要困難在對於心理聽覺的了解太少。

目前這幾張圖形,我的確得到一些訊息 ( take home messages) ,雖然大部分都是已經知道的廢話 (例如 FLAC 跟 wav 在資料上是同義的格式。 以及 mp3 的 kbps 參數對檔案音質影響很大),但是能自己見證一下這些差異,也是一見有趣的事情。我覺得有趣的是 128 kbps mp3(最常見的 mp3 檔案),到底在節省檔案大小的前提下,失去了那些訊號細節?

等一下來看看

=====
當做訊號的一些檔案,我轉成 FLAC 放在網路上
FLAC
WAV
65 kbps MP3
190 kbps MP3
{Raspberry-Pi,PC} / {RME UFX as DA/DSP X-over/Pre} / {Amp & Speakers: Dayton RS225, ScanSpeak D3004/604010, FaitalPro 10RP200}
Other Cans: Sennheiser HD800, Sony MDR Z7, Sennheiser Momentum Wireless 2
tim.chnan
SR125
SR125
 
文章: 348
註冊時間: 週一 9月 18, 2006 6:43 pm
來自: Hsinchu

Re: mp3 檔案壓縮:到底錯失了什麼

文章Rand 發表於 週四 3月 26, 2009 12:31 am

128kbps的mp3檔失真很明顯,尤其是弦樂器,聲音變形是聽得出來的
但是說真的,欣賞旋律其實也不會去計較那一點失真
Rand
SR40
SR40
 
文章: 7
註冊時間: 週五 10月 26, 2007 1:06 pm

Re: mp3 檔案壓縮:到底錯失了什麼

文章tim.chnan 發表於 週四 3月 26, 2009 1:16 am

Mira 寫:
tim.chnan 寫::haha: 這不是很專業的聲音訊號處理,請大家隨意看看,隨意給些意見 :bow: :bow:
看圖說故事的話

FLAC 和 WAV 轉換不會造成差別,至少訊號上看不出來。

190 kbps MP3, 基本上差異不大,訊號上統計性質一致。

65 kbps MP3, 面目全非

離題到現在才對本篇進行回覆真是抱歉,自己很喜歡這類視覺化的分析,這項測試讓自己大飽眼福。如果方便的話,是否也能進行其它格式的分析呢?


我的 Matlab 程式碼在這邊,如果有興趣,可以自己轉跟自己產生圖形
也可以改圖 (如畫圖的頻率範圍.....)
Matlab 程式和附屬的 Toolbox Wavelet 要自己想辦法了
Matlab 有免費的第三方函式可以讀寫 FLAC, mp3 等

如果想我轉的話,請先切好 (最好不要超過 5 秒),然後轉成 WAV 格式,放到 badongo 或 rapidshare 上面
(抱歉,有些網路硬碟網站也含有木馬,所以我不太喜歡用其他的檔案分享空間)
{Raspberry-Pi,PC} / {RME UFX as DA/DSP X-over/Pre} / {Amp & Speakers: Dayton RS225, ScanSpeak D3004/604010, FaitalPro 10RP200}
Other Cans: Sennheiser HD800, Sony MDR Z7, Sennheiser Momentum Wireless 2
tim.chnan
SR125
SR125
 
文章: 348
註冊時間: 週一 9月 18, 2006 6:43 pm
來自: Hsinchu


回到 新音樂、影音討論版

誰在線上

正在瀏覽這個版面的使用者:沒有註冊會員 和 67 位訪客