top of page

SMAART (1) - 基礎概念 (Part 1)

  • 作家相片: Alex Chen
    Alex Chen
  • 2024年3月13日
  • 讀畢需時 12 分鐘

已更新:2024年10月9日


引言

根據不同的應用情境,有效操作Smaart需要對系統測量概念和專業音響工程實踐有一定的了解。雖然本文件無法涵蓋所有這些概念,但本章突出了一些在理解Smaart v8的操作和應用方面非常有用的關鍵概念。希望深入了解這些以及與聲學測量和音響系統工程相關的其他主題的讀者,可以參考附錄A:適用標準和進一步閱讀,該附錄位於第196頁,提供了一些建議的閱讀資料,以便深入學習。

時域及頻域分析

對於充分發揮Smaart所呈現的測量功能,基本了解時域分析和頻域分析之間的相對優勢和差異至關重要。能夠從多個角度檢視測量結果對於分析信號或系統響應的過程非常有用。Smaart的主要操作模式(實時和脈沖響應)都包括時域和頻域測量和分析功能。(Magnitude vs Amplitude)


ree

圖形或信號的「領域 Domain」指的是獨立變數,通常顯示在圖形的水平軸上。舉例如音頻波形,它是一種時域信號,其中信號的電壓或數字振幅隨著時間變化。在這種情況下,時間是獨立變數,因此通常在波形圖的(水平)x軸上表示,振幅則在(垂直)y軸上表示。在頻域圖上,我們通常將頻率放在x軸上,振幅(或幅度)放在y軸上。


兩種情況下的例外是光譜圖(Spectrograph),它具有兩個獨立變數,因此我們會根據特定情境中最合適的方向來定位它。


在錄音應用中,音頻信號的時域圖提供了對波形的視覺呈現,這對於音頻編輯者來說是一個關鍵視角。在音響系統工程和室內聲學中,系統響應的時域視圖(脈沖響應)顯示了信號通過系統的傳播延遲以及後來到達的反射和混響,這些可能會成為潛在問題的因素。


對信號進行頻域分析提供了對其頻譜的視圖,當分析音調內容或尋找回饋時,這顯然是一組非常有用的信息。系統響應的頻域視圖(傳遞函數或頻率響應)提供了系統的音調響應以及按頻率的時間/相位響應的優秀展示。這對於評估系統的音質以及了解系統的頻率特性和時間/相位特性非常有幫助。


圖1提供了一個非常好的例子,展示了利用時域和頻域視圖來檢查系統響應的優勢。頻率響應測量顯示了幅度響應中一系列線性間隔的低谷和峰值(右下角)。然而,這種波紋只是一個問題的症狀,而不是實際的問題所在。波紋的原因在系統響應的時域視圖中可以清楚地識別為脈沖響應中的明顯第二個到達,這是由於突出的反射引起的。反射是直接聲音的複製品,在撞擊某個表面後,以較晚的時間到達。將兩個相同信號的複製品混合,它們之間有時間偏移,會導致我們在頻域視圖中看到的梳狀濾波器。

傅立葉轉換 (DFT/FFT and IFT)

傅立葉變換,以19世紀法國數學家和物理學家讓·巴普蒂斯特·約瑟夫·傅立葉(Jean-Baptiste Joseph Fourier)的名字命名,基於一個觀念,即複雜信號(例如語音或音樂)可以由不同振幅和相位關係的正弦波構成,或者可以被分解成這些正弦波傅立葉變換在音頻分析中被廣泛使用,用於找出時域信號的頻譜內容反傅立葉變換(IFTs)則從頻譜數據中重建時域信號


有幾種不同類型的傅立葉變換,但在Smaart中我們關注的是離散傅立葉變換(DFT),它用於有限長度的時域信號。快速傅立葉變換(FFT)這個術語指的是更有效地計算DFT的方法,最常見的情況是要分析的信號塊的長度必須是2的冪次方(2的n次方)樣本,例如4096(4K)、8192(8K)、16384(16K)...(2^12、2^13、2^14...)。所有的FFT都是DFT,但不是所有的DFT都是快速的。


在Smaart中,大多數DFT都是2的冪次方FFT(也稱為基數2 FFT或僅FFT)。我們對某些事情使用任意長度的DFT,特別是用於脈沖響應分析,但由於FFT通常執行速度更快,因此它們在實時操作特別是在不受時間記錄精確長度限制的應用中非常受歡迎。


ree

時間解析vs頻率解析

在使用離散傅立葉變換(DFT或FFT)進行工作時,一個重要的取捨關係是時間分辨率和頻率分辨率之間的反比關係 - 當其中一個提高時,另一個會變差。這兩者都是測量的“時間常數”(也稱為“時間窗口”的函數。時間常數簡單地是記錄足夠多樣本以進行給定大小的DFT,在給定採樣率下所需的時間。較長的時間窗口提供更緊密、更詳細的頻率分辨率(通常在高頻時更多),但卻以較少詳細的時間分辨率為代價。


時間分辨率可能不是你的主要擔憂,如果你是在對信號進行長時間平均或使用統計隨機信號(如粉紅噪聲)進行聲音系統的穩態測量時。然而,在分析動態信號(如語音或音樂)時,時間分辨率可能是一個重要因素,因為你可能需要看到非常接近時間間隔的信號特徵作為獨立事件。例如,如果在單個FFT的時間常數內發生了兩個鼓聲,則頻域中的結果譜將包含每個頻率上的兩個鼓聲的能量合併為單一數值。如果你需要將每個鼓聲視為獨立事件,則需要縮短時間窗口,這將導致頻率分bin之間更廣泛的間隔。


你可以通過將用於記錄時域信號的採樣率除以FFT的大小(以樣本數表示)來計算FFT的時間常數(以秒為單位)。例如,在Smaart中,用於頻譜測量的默認FFT大小為16K(16384個)樣本。在每秒48000個樣本的情況下,16K FFT的時間常數為0.341秒(16384/48000),或341毫秒。


𝑇𝑖𝑚𝑒 𝐶𝑜𝑛𝑠𝑡𝑎𝑛𝑡 =𝐹𝐹𝑇 𝑆𝑖𝑧𝑒 / 𝑆𝑎𝑚𝑝𝑙𝑒 𝑅𝑎𝑡𝑒 = 1 / 𝐹𝑟𝑒𝑞𝑢𝑒𝑛𝑐𝑦 𝑅𝑒𝑠𝑜𝑙𝑢𝑡𝑖𝑜𝑛


低頻率的周期比高頻率長,這當然是它們被稱為低頻率的原因,所以需要在更長的時間內觀察信號才能區分它們。事實上,FFT(或任何其他種類的DFT)可以清晰“看到”的最低頻率是1/T,其中T是FFT的時間常數(以秒為單位)。以48k採樣率的16K FFT的例子,該情況下的頻率分辨率為2.93 Hz(1/0.341)。


𝐹𝑟𝑒𝑞𝑢𝑒𝑛𝑐𝑦 𝑅𝑒𝑠𝑜𝑙𝑢𝑡𝑖𝑜𝑛 = 𝑆𝑎𝑚𝑝𝑙𝑒 𝑅𝑎𝑡𝑒 / 𝐹𝐹𝑇 𝑆𝑖𝑧𝑒 = 1 / 𝑇𝑖𝑚𝑒 𝐶𝑜𝑛𝑠𝑡𝑎𝑛𝑡


如果您熟悉正弦波中循環時間和頻率之間的倒數關係(f = 1/t和t = 1/f),您可能已經注意到這個事實,它反映了FFT中時間常數和頻率分辨率之間的關係。事實上,FFT的頻率分辨率等於在FFT時間窗口內精確循環一次的正弦波的頻率。所有其他頻率 bin 都是該基本頻率的整數倍(諧波),因此了解時間常數也告訴您頻率 bin 之間有多遠的間隔。


ree


在實際應用中,考慮到採樣率為44.1k或48k,Smaart的16K默認FFT大小用於頻譜測量提供了非常好的低頻分辨率,足以達到次低音頻範圍的下限,並且比分析粉紅噪聲等信號所需的時間分辨率大得多。至於更動態的信號,例如語音或音樂,如果我們以48k採樣率連續記錄16K FFTs一分鐘,那麼每分鐘就會有約176個離散幀(60 / 0.341 ≈ 176)。這傾向於滿足或超越大多數音樂流派的平均節奏,這意味著它提供足夠的時間分辨率來看到個別音符的頻譜內容。


就語音分析而言,母語為英語的人士的典型說話速率約為每分鐘140-180個單詞或約200-300個音節,因此16K FFT可以捕捉到單詞,但不能捕捉音節。將FFT大小降至8K將使時間分辨率加倍,約為每分鐘至少約352幀 - 可足以應對極快的音樂或區分典型說話速率下的個別音節 - 但這樣做會以某些低頻細節的損失為代價。


DFT或FFT的長度所涉及的另外一些取捨包括計算成本和當使用線性間隔的DFT數據在對數頻率尺度上繪製時,在高頻時出現過多的頻率分辨率的問題。在實時分析(RTA)測量中,使用分數倍頻帶有效地解決了過多的高頻分辨率問題,即使現在的低端計算機也可以相對輕鬆地使用16K甚至32K的FFT大小進行實時分析。


在傳遞函數測量中,通常情況下計算成本是一個更大的問題,Smaart的多時間窗(MTW)功能嘗試通過使用一系列小型FFT以逐漸降低的採樣率,以在低頻時提供約1 Hz的分辨率,同時避免在較高的八度中產生過高的分辨率。平滑傳遞函數還有助於清理高頻的過度分辨率,適用於MTW和僅使用單個FFT大小的測量。

單雙通道測量技術

在實時模式下,Smaart執行兩種基本類型的領域測量:單通道(信號分析)和雙通道(響應分析)。單通道頻譜測量是信號分析測量,因為它們只能告訴您信號的頻率內容和振幅。


實時頻譜分析儀(RTA)和光譜圖顯示基於單通道FFT分析。另一個例子是聲音水平測量,例如聲壓水平(SPL)或等效聲音水平(Leq)。當校準到絕對參考,例如SPL時,單通道測量提供給您直接可與其他絕對值進行比較的絕對值,並確切告訴您在給定頻率或跨越給定頻率範圍內聲音有多大聲。它們可以幫助回答問題,例如“該信號中有多少1 kHz的能量”,“該音調的頻率是多少”或“該場地中這個位置的SPL是多少”。


雙通道測量比較兩個信號,以找出它們之間的相似之處和差異之處。


在Smaart中,傳遞函數和脈沖響應測量是雙通道測量,它們比較了設備或系統的輸出與生成它的輸入信號之間的關係。因此,我們可以說我們正在測量系統對給定刺激的響應,由於兩個信號都是已知的,輸入信號的頻譜幾乎變得無關緊要。我們還能夠精確測量兩個信號之間的時間關係,從而能夠檢查相位關係並找到延遲時間。


ree

雙通道方法提供了相對的測量(輸入對輸出),可以幫助回答像“我們的系統的交叉頻率是多少”,“1 kHz時有多少提升或減弱”,或“主音箱系統的能量何時到達測量麥克風”的問題。


單通道和雙通道測量都可以是強大的工具,當你理解它們各自的優點和缺點,即它們正在測量的內容,以及同樣重要的是,它們不測量的內容。

然而,混淆或混合兩者可能會導致基於不完整或不正確信息的糟糕決策。因此,在使用這些測量方法時,理解它們的差異和應用場景非常重要。


線性及對數尺規

在聲學分析中反覆遇到的一個問題是,人類的知覺是以對數方式呈現的,並且涵蓋了相對廣泛的數值範圍。每個人的聽覺都略有不同,但一般來說,聽覺閾值和疼痛閾值之間的差異 - 我們可以聽到的最安靜的聲音和我們可以忍受的最大聲音 - 大約在120分貝(dB)左右。


這相當於六個小數量級的差異(例如,1和1百萬之間的差異)。就頻率而言,對於人類來說,可聽範圍通常被定義為20 Hz到20 kHz,這是四個對數的“decades”。誠然,許多人,或者也許大多數人,無法跨越整個範圍聽到聲音,但可以安全地說,大多數人至少可以聽到三個decades的範圍,例如,從80 Hz到8 kHz,這仍然是相當廣泛的數值範圍。


問題在於,在這兩種情況下,我們並不平等地感知所有這些數字之間的差異。對我們的感官來說,1和2之間的差異不同於2和3之間的差異,如果我們是線性感知世界的話,這將是相同的。對我們來說,1和2之間的差異(或聽起來,或看起來,或感覺起來)更像是2和4之間的差異,或4和8之間的差異,或8和16之間的差異...(你明白了)。


因此,在對數幅度(振幅)或頻率尺度上繪製音頻和聲學數據對我們來說具有兩個有用的作用;它有助於使我們聽覺所包含的廣泛數值範圍更易於管理,並且它以一種對人類感知更有意義的方式呈現數據。這並不是說線性尺度沒有用處,但在Smaart中我們所做的大多數事情中,對數尺度和單位(decades、八度和分貝)往往更能直觀地展示我們想要看到的內容。

線性和對數頻率尺規

當我們談論線性和對數頻率尺度(不要與分數八度帶混淆)時,我們實際上是在討論如何在圖表和圖形上繪製頻率。在線性頻率尺度上,例如每100赫茲(您可以選擇任何數字),每個頻率占據的圖表空間與其他每個頻率相同。在八度尺度上,每個八度的寬度都與其他八度相同,即使隨著頻率的升高,每個頻帶的線性頻率範圍也會加倍(125赫茲、250赫茲、500赫茲、1千赫茲、2千赫茲、4千赫茲...)。在對數decades尺度上,每個10赫茲的幂次(10、100、1000、10,000)的寬度都與其他相同。對數尺度對於任何基數都適用,但我們在Smaart中使用的基數是2和10(八度和十年)。



ree

我們通常使用八度或decade尺度來查看頻率,因為這些尺度更好地與我們對聲音的對數感知相關聯。然而,線性尺度對於某些事情也非常有用,有時與聲音和聲學的基本物理特性更相關。在線性尺度上繪製頻率可以使梳狀濾波器和諧波失真產品更清晰地突顯出來,因為其葉片或峰值是線性間隔的。另一個例子可能是與固定延遲相關的相位偏移,在線性頻率尺度上變成了一條直線斜坡。


請注意,當您在對數頻率尺度上查看來自聲學測量或其他噪聲信號的FFT數據時,迹象在較高頻率下看起來會更模糊。這不一定意味著HF中有更多噪聲。這是將越來越多的線性間隔的FFT點壓縮到較小的圖表空間中的自然結果。這也是如前所述MTW傳遞函數選項的原因之一。在傳遞函數測量中,平滑也有助於減少HF中的視覺噪聲,而在頻譜測量中,分數八度帶狀化也具有相同效果。


ree



線性震幅

線性震幅(Linear amplitude),如其名所示,是以線性刻度來顯示的震幅,例如伏特或基於數字整數的幅度單位。在Smaart中,您唯一會看到線性幅度的地方是線性時間域圖表,其中幅度以全規範化幅度的百分比來顯示。也就是說,來自具有一定位數的有符號整數(例如,每個樣本16位或24位)的最大正數和負數被縮放到介於1和-1之間的範圍內(包括1和-1),其間的分數值以百分比表示。


由於無法對負數取對數,所以在脈衝響應中查看相對極性的唯一方法是使用線性幅度尺度。此外,有些人喜歡使用線性幅度尺度來識別脈衝響應中的離散反射,它對查看其他類型的信號也有用。線性幅度尺度通常不太適合查看混響衰減或識別脈衝響應中低頻範圍的峰值結構,因為波形周期的長度在時間上被延長,以至於清晰的脈衝不容易辨別。


ree



分貝

"分貝"(decibel,簡稱dB)是一種常用的對數比例,用於表達振幅、電壓、聲壓、增益、衰減,當然還包括其他一些項目。這個詞的字面意思是一個Bel的十分之一。Bel是以亞歷山大·格拉漢姆·貝爾(Alexander Graham Bell)的名字命名的,他是電話的發明者之一(或者至少是其中之一)。為什麼他們稱之為"Bel"而不是"Bell",這個問題可能需要其他人來回答,但這可能解釋了為什麼"分貝"的縮寫寫作"dB"(B的首字母大寫)。儘管似乎沒有人多用"Bel",大多數人會說10 dB,但如果您考慮到一個Bel代表10:1的功率比的對數,而一個分貝是它的十分之一,那麼轉換到和從分貝的公式可能會顯得不那麼隨意。


牢記這個想法:


𝑑𝐵 = 10 ∙ log10(𝑃𝑜𝑤𝑒𝑟) = 20 ∙ log10(𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒)


𝑃𝑜𝑤𝑒𝑟 = 10(𝑑𝐵⁄10) = 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 平方


𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 = 10(𝑑𝐵⁄20) = √𝑃𝑜𝑤𝑒r


因為分貝表達的是一個比例,分貝值必須參照某個東西。如果沒有明確給出參考值,就像在前一頁的方程中一樣,則假定參考值為1,但它也可以是任何數字。要將分貝參照到除1以外的數字,您只需在取對數之前將要轉換為分貝的值除以參考值。


這樣的話:

𝑑𝐵 = 20 ∙ log10(𝑣⁄𝑣0)


因為分貝表達的是一個比例,分貝值必須參照某個東西。如果沒有明確給出參考值,就像在前一頁的方程中一樣,則假定參考值為1,但它也可以是任何數字。要將分貝參照到除1以外的數字,您只需在取對數之前將要轉換為分貝的值除以參考值。


其中,𝑣代表您想轉換為分貝的某個線性值,𝑣0是參考值。


在音頻應用中的一個常見例子是dBu,它將0 dB參照為0.775伏特。


另一個例子可能是AES關於dB FS(dB Full Scale)的標準,它基本上將0 dB參照為0.5的平方根(0.7071),因此,一個全幅、峰值到峰值的正弦波的RMS值為0 dB,而不是-3.01 dB。請注意,Smaart不使用AES的Full Scale標準。

八度和分數八度帶域(頻譜測量)

八度和分數八度帶域的譜線是調和我們聽覺與分析儀上所見的方式之一。在分帶的實時分析儀或頻譜圖顯示中,每個分數八度帶代表了該帶內所有頻率上的功率總和。這就是為什麼對粉紅噪音的分帶測量在分帶顯示中呈平坦狀態,但如果您觀察線性間隔的FFT數據,您會看到一個每八度下降3 dB或每十年下降10 dB的信號。隨著頻率升高,每個個別的FFT bin包含的能量越來越少,但每個八度帶包含了兩倍於前一個的頻率數,因此所有的帶域在總和上具有相等的分貝值(假設是一個完全粉紅信號)


如果您觀察白噪音信號,該信號在所有頻率上具有相等的能量(至少在名義上如此),您會看到它在未分帶的線性或對數頻譜顯示上呈平坦狀態,但在分帶顯示中以每八度上升3 dB的斜率上升。


ree

分頻譜顯示在幾個方面都很有用。特別是,它們可以與粉紅噪音一起使用,僅測量設備或系統頻率響應的振幅部分(僅振幅)。單通道頻譜測量不能告訴您有關定時或相位關係的任何信息,這兩者都是系統實際聽起來的重要因素,但在緊要關頭或作為已經對齊的系統的快速維護檢查時,它可能比什麼都不好。分頻也有用的另一種方式是作為平滑譜數據的一種方式。通過將FFT多個bin相加到每個帶中,您立即開始獲得比觀察個別bin跳動更平滑和更穩定的顯示。


分頻也具有心理聲學的維度。粉紅噪音,或者在物理學中稱為1/f噪音,似乎在自然界和各種複雜系統中都普遍存在,因此也許不足為奇,各種音樂,跨足各種流派和文化的長期平均頻譜往往類似於粉紅噪音的頻譜。因此,分頻譜顯示可能傾向於是觀察音樂和其他信號的頻譜內容的自然和直觀的方式。



最新文章

查看全部
理想的波束塑形---Renkus-Heinz OmniBeam 波束引導演算法

作者:PSW Staff 原始文章 波束引導揚聲器專家系列 第三章 你是否曾走進一間擁有高天花板、玻璃牆或其他硬質建築表面的房間,嘗試進行對話或電話會議? 那感覺就像在回音室裡說話。這是因為聲音由壓力波組成,會在地板、牆壁、天花板或任何其他反射表面上反彈,隨著時間逐漸損失能...

 
 
 

留言

評等為 0(最高為 5 顆星)。
暫無評等

新增評等

©2025 ALXC 版權所有。

bottom of page