7月15日
Smaart (9) - 分析脈衝響應數據
- Alex Chen
- 2024年3月30日
- 讀畢需時 0 分鐘
分頁
Smaart提供了一套強大的工具,用於分析脈衝響應數據的時間域和頻率域。時間域分析工具包括對數和線性時間域視圖、能量時間曲線、八度和1/3八度帶通濾波器、反向時間積分以及自動計算EDT、RT60和清晰度等常見聲學參數。頻率域分析工具包括任意時間範圍的頻譜分析和頻譜圖。
如果我們討論Smaart的實時測量和分析模式,我們幾乎必須在這一點暫停,以設置並開始積極測量某種聲源,以便有東西進行分析。但在IR模式中,測量和分析通常是兩個分開討論的事情。在IR模式下的數據分析是一個離線的、後處理的過程,無論我們是現場積極測量系統還是處理在.wav或.aiff文件中錄製的脈衝響應,都是相同的。既然我們剛剛在前一章討論了IR模式的用戶界面,那麼現在讓我們直接開始實際使用它。
圖125:對數(Log)時間域IR圖將時間顯示在x軸上,將幅度以分貝表示在y軸上。鎖定和可移動游標的組合使您能夠找到圖中任意兩點之間的時間和幅度差異。時間坐標可以選擇性地以等效距離顯示,如上所示。在框架頂部的游標讀數中,最左邊的一對坐標表示鎖定游標的位置,設置為IR中的最高峰值。中間的一對綠色坐標表示可移動游標的絕對位置,右邊的一對帶有括號的坐標表示第一對坐標之間的差異。
本章大部分的示例是使用一些.wav文件創建的,這些文件可以從Rational Acoustics網站上下載。在適用的地方,我們將告訴您使用了哪個文件以及如何複製我們的設置,這樣您就可以在我們進行時獲得一些實踐經驗。
要下載這些檔案,請訪問http://support.rationalacoustics.com/168699-Smaart-v8-Documentation,並從Smaart v8文檔部分中選擇Sample IR Wave Files,然後解壓縮內容到用於IR檔案的Smaart資料庫文件夾中。預設位置是位於您用戶帳戶的Documents文件夾中的Smaart v8文件夾中的名為Impulse的文件夾。然後,當您切換到IR模式時,這些檔案應該會顯示在Smaart的Data Bar資料庫窗格中。您可以通過點擊它們的顯示/隱藏圖標來顯示這些檔案。有關Smaart的Data Bar的更多信息,請參閱標題為The Data Bar的部分,從第43頁開始。
我們的第一個例子使用的是theater.wav,這是一個400座位的歷史性歌舞劇場的IR測量。這個測量是從主要的座位區域進行的,距離舞台約20英尺(6米),使用一個小型角落PA揚聲器作為舞台邊緣的激勵源。
時間域分析 - 對數時間域顯示
時間域 IR 顯示以對數 (Log) 振幅縮放可能對於經常查看聲學脈衝響應的人來說最為熟悉。在這個視圖中,您可以找到直接聲和早期反射的到達時間,並將 IR 的反向時間積分覆蓋,還有互動小工具可用於計算 EDT 和混響時間(僅在 Log 和 ETC 顯示中可用)。Smaart 提供了八度和 1/3 八度帶通濾波器,您可以用來即時濾波 IR,以查看混響衰減和其他特性隨頻率的變化。
時間領域顯示中的鎖定和自由游標的組合使您能夠找到圖表上任意兩點之間的相對到達時間和幅度差異。這兩者之間的差異顯示在游標讀數中。如果在一般選項頁面(選項菜單 > 一般)的游標時間讀數部分中選擇了毫秒和距離選項,Smaart還將根據當前音速設置為您提供時間坐標的等效距離。要將鎖定游標移動到圖表上的任意點,請按住鍵盤上的Ctrl鍵(Mac上的Cmd鍵),同時單擊鼠標指向您要標記的點。按下Ctrl/Cmd + “P”鍵可將鎖定游標重置為IR中的最高峰。
時間域分析 - 線性時間域顯示
一個線性(Lin)時間域圖表繪製與 Log IR 相同的數據,但是在一個歸一化的線性幅度尺度上,其中幅度值以數位全幅的百分比給出。這種視圖在一般聲學分析中通常用途有限,但在測量觀眾到場之前的空演廳時,它可以是一個非常好的工具來找出離散的反射。在這種情況下,使用線性 IR 視圖可以幫助您識別可能被對數顯示器上的擴散反射場所掩蓋的硬反射,一旦有觀眾到位並且混響水準下降,這些硬反射就會變得更加明顯和可聽(通常在舞台上,使歌劇演員感到困擾)
線性 IR 還能告訴您的另一件事是相對極性,而對數和 ETC 圖表則無法做到這一點。例如,您可以測量兩個中音驅動器或其他類似設備,並通過注意著重峰值指向的方向來確定它們是以相同還是不同的極性連接。圖 127 顯示了一個 2 階 Butterworth 帶通濾波器的線性(Lin)縮放脈衝響應的放大視圖,其中包括正向和反向極性。濾波器的截止頻率為 400 和 1600 Hz。很容易看出兩個 IR 中的峰值指向相對於彼此的不同方向。不幸的是,這並不能確定哪一個是正確的。但如果您測量了三個相似設備中的一個不同,您可能會合理地說多數決定。或者,如果您測量了兩個相似設備,發現了相反的極性,其中一個聽起來更好,那麼您可能找到了問題所在。線性視圖也可以用於查看除了脈衝響應之外的時間域中的其他類型的信號。
時間域分析 - 能量時間曲線
Energy Time Curve (ETC) 能量時間曲線
脈衝響應表示了一個三維事件的二維圖表:能量隨時間到達的幅度和相位。在垂直(y)軸上是幅度,水平(x)軸上是時間,相位最終被表示在z軸上,但在這個視圖中效果被忽略了。因此,在脈衝響應的線性和對數視圖中,能量到達如果發生90°或270°的移位,將顯示為零交叉,因此使得一個在時間和相位上分佈的單一到達看起來像是多個到達。
能量時間曲線,也稱為脈衝響應的包絡線,通過有效忽略相位信息來表示能量隨時間到達的幅度。它的教科書描述是將實際脈衝響應與其希爾伯特變換結合在一起 - 一個相位旋轉了90°的自身副本。實際上,這兩者的總和有助於填補在Log IR中看到的零交叉,產生一個比Log IR更容易查看的信號,因為它的波動更少。在較高頻率上,Log IR和ETC可能看起來非常相似 - 二者都是以對數幅度刻度繪製的 - 但ETC特別適用於評估低頻直接聲音的到達情況。
如果你放大 room.wav 的前 250 毫秒並切換到 125 Hz 的八度帶(如下所示),則 Log IR 和 ETC 之間的差異非常明顯(見圖 129)。要將您的顯示比例設置為類似圖 129 的方式,請按鍵盤上的加號 [+] 鍵幾次以放大幅度範圍,然後使用上/下箭頭鍵將範圍上下移動。
當使用峰值位置來找尋延遲時,請注意 ETC 可能會給出略微不同的答案,因為它在 IR 中有效地插值。如果您查看圖 129 中約在 124 毫秒處的 ETC 中的較小峰值,您會看到它落在 Log IR 中的兩個葉狀區域之間。我們發現 ETC 可能比 Log IR 工具更有效地找到低音炮的延遲時間。但最好是在實時模式下,在使用頻域傳遞函數顯示時,將 ETC 用於實時 IR,從而可以看到相位以及幅度,並且可以在調整處理器設置時實時觀察到變化。
時間域分析 - 帶通過濾
Bandpass Filtering
迄今為止,我們主要觀察了寬頻冲激響應(IR),但相當多的聲學分析通常使用八度音階,有時也使用1/3八度音階,特別是在我們探討混響時間和早晚能量比時。Smaart包括完整的八度音階和1/3八度音階帶通濾波器,適用於16 Hz至16 kHz之間的八度音階(假設採樣率為48k或更高,較低的採樣率會損失一些上限頻段)。在Smaart中,帶通濾波是以非破壞性方式,按需進行的。要查看經過濾波的IR的版本,請在濾波器選擇器上選擇要使用的濾波器組(八度音階或1/3八度音階),然後從帶列表中選擇要查看的帶。
Smaart的帶通濾波器具有線性相位響應,其幅度響應超過了IEC 61260和ANSI S1.11中指定的八度音階和1/3八度音階帶通濾波器的最嚴格(Class 1)公差,該公差是在2014年修訂的標準中規定的。如果您想查看帶通濾波器的幅度響應,可以加載wave文件1samplePulse.wav,並打開頻率圖,然後逐個步驟選擇帶列表以查看每個濾波器。帶通濾波應用於除直方圖圖表(已被過濾成帶)之外的所有主要顯示類型。它不影響導航窗格中的小圖表。請注意,對冲激響應進行過濾將清除頻譜圖顯示(如果存在),並需要重新計算(再次點擊計算按鈕)。
時間域分析 - 離散反射
Discrete Reflections
反射是一個複雜的主題,因為人類擅長處理它們。它們可能有益也可能有害,取決於它們相對於直接聲音的到達時間和音量(這兩個關鍵因素),它們的頻率內容甚至是它們到達的角度。離散的反射可能會導致聽覺問題,範圍從音色變化到圖像偏移再到可聽到的回聲。然而,試圖通過觀察電腦屏幕上的波浪線來確定哪些反射是友還是敵可能是一個棘手的問題。
短時間內在直接聲音後的前30毫秒左右到達並且音量相對較高的短反射,以其產生的梳狀濾波器而聞名,會干擾我們的實時頻率域分析;但事實上,人們發現它們有益,可以增強語音的可懂度和音樂的清晰度。 在早期整合窗口之外,反射仍然可以為主觀上的存在感、溫暖感、空間感等作出貢獻。然而,對於語音和音樂,這些規則有所不同。
來自於 95 毫秒以上的個別寬頻反射,可能會破壞語音的清晰度,並使演講者和表演者在它們到達舞台時面臨困難。這是強烈反射聲音被聽作為獨立事件(回聲)的閾值,對於試圖說話或唱歌的人來說可能會令人困惑。這正好是在第 171 頁顯示的 IR 測量中正在調查的問題,其中一個高強度反射大約在 160 毫秒左右到達,這接近於正常對話語音的平均音節速率。
低階、早期的反射可能在時域圖上顯示為直接聲音到達後的個別峰值。後期到達的反射則可能顯示為從混響衰減斜坡中突出的尖峰。在頻譜圖上,當您將動態範圍控制上下運行時,尤其是最大設置時,高水平的寬頻反射通常可以被識別為明顯的垂直條紋。它們在到達較長延遲時間和相對較高水平時,與漫反射混響場的水平相比時可能會出現最多問題。
一個相當不錯的經驗法則是,後來的回音抵達,它的音量需要越低,才會被認為是有益或中性的。另一個經驗法則是,我們對於回音和殘響的容忍度,對於音樂而言通常比對於語音更寬容。Smaart非常有用於識別問題性的回音;然而,你的耳朵可能仍然是評估它們相對重要性或嚴重性的最佳工具。
殘響時間 - Reverse Time Integration
混響時間(通常稱為 T60 或 RT60,較少見的稱為 T30、T20 或簡稱為 T)是指一個空間中的混響聲音能量從激發水平衰減 60 分貝所需的時間。它被認為是音樂表演空間以及教室、禮堂和電影院的聲學中一個重要的指標,用作粗略預測語言清晰度的指標。
混響時間是通過對已分成八度帶的脈衝響應進行逆向積分計算得出的。傳統上,評估的頻帶範圍是 125 Hz 到 4 kHz。逆時間積分也被稱為施羅德積分,以其創始人曼弗雷德·施羅德博士的名字命名。這個概念很簡單,但要做好卻有些微妙。
理論上,你只需從時間記錄的末端開始,逆向工作至起點,過程中對脈衝響應(IR)中每個樣本的平方進行累加。然而,一個常見的問題是,當混響衰減斜率遇到 IR 的噪聲底線時,積分會趨於平坦。這可能導致混響時間的過度估計,特別是如果 IR 的動態範圍有限,和/或有長的噪聲尾部。
解決這個問題最直接的方法是找到脈衝響應(IR)中衰減斜率遇到噪聲底線的點,有時這被稱為“鞍點”,並從這裡開始積分,而不是從一些任意點如錄音的末尾開始。然而,自動估計 IR 中鞍點的位置是出了名的困難。Smaart 8 使用一種專有算法來估計 IR 鞍點,大多數時候這個算法運作良好,但它不是完全萬無一失的。因此,檢查每個頻帶以確保你同意軟件所做的選擇總是一個好主意,特別是如果 IR 尾部有任何大的異常,如一個突出的峰值或在記錄末尾由掃頻信號堆積的失真產物。
圖 130:通過脈衝響應的逆向積分來估計混響時間。從“鞍點”(混響衰減斜率遇到測量噪聲底線的大致點)開始對 IR 進行逆向積分,可以非常好地估計混響衰減時間。如果從一個任意點,如文件的末尾開始逆向積分,可能會導致對衰減時間的過度估計。
殘響時間 - Evaluation Ranges (EDT, T20, T30)
由於在聲學系統中很少能夠測量到完整的 60 分貝的混響衰減,混響時間通常在更小的範圍內評估。起點始終是在逆向積分曲線上從直達聲到達點下降 5 分貝的位置。範圍的終點是從起點沿曲線下降 30 分貝的位置,前提是該點至少比噪聲底線高出 10 分貝——如果不是,則可以使用 20 分貝的範圍。在任何情況下,測量的衰減時間都會外推到等效的 60 分貝衰減時間。在 ISO 3382 的術語中,這些被稱為 T20 或 T30。早期衰減時間(EDT)通常從直達聲到達後下降到比它低 10 分貝的點在積分曲線上測量。像混響時間一樣,EDT 也被標準化到 60 分貝的衰減時間。
注意圖 131 中圖表上顯示的五個水平標記小工具。如果你對那些神秘的標籤感到好奇,每個標記的默認位置及其解碼器如下所示。
Ld = 直達聲水平。這個標記放置在逆向積分曲線上,對應直達聲到達的時間點。
Le = 早期衰減(Early Decay)水平。這個標記自動放置在逆向積分曲線上,從 Ld 標記向下 10 分貝的位置。Ld 和 Le 之間的斜率用來計算 EDT。
Lr1 = 混響水平 1。這個標記指定混響衰減範圍的頂部,從 Ld 標記沿積分曲線向下 5 分貝。所有的水平標記都可以由用戶調整,但這三個標記的位置相對明確。你很少需要調整它們。
Lr2 = 混響水平 2。這個標記指定混響衰減斜率的終點。如果動態範圍足夠,它應該放置在 Lr1 下方 30 分貝的逆向積分曲線上。如果不夠,20 分貝也可以。Lr2 是你可能有時需要手動調整的兩個標記之一;另一個是 Ln(如下)。
Ln = 噪聲水平。就放置而言,這通常是五個標記中最主觀的一個。時間位置決定了逆向時間積分曲線的起點,這是定位所有其他標記的基礎。理想情況下,這應該大致對應於脈衝響應中的鞍點。幅度坐標用來估計測量的噪聲底線水平,Lr2 標記需要至少比該水平高出 10 分貝。
圖 131:帶有全部功能的對數脈衝響應(IR)顯示。這裡顯示的脈衝響應是 theater.wav 的 500 Hz 八度帶。點擊 Schroeder 和 RT60 按鈕會顯示逆時間積分曲線,以及 EDT 和 RT60 評估範圍的起始和終點,在對數或 ETC 圖表上。所有水平標記(Ld, Le, Lr1, Lr2 和 Ln)的位置都可以由用戶調整,但如果 Ln 標記定位正確,通常前四個標記不應該需要調整。
Ln 標記的幅度坐標是固定的,基於對測量環境噪聲底線的內部估計。請注意,當在脈衝響應選項中啟用「優化圖表」功能(參見第 154 頁的通用設置)時,Ln 的幅度水平通常會低於對數 IR 或 ETC 軌跡中噪聲尾部的明顯水平。這是因為噪聲底線估計基於 RMS 水平,而優化圖表功能使用峰值水平。你可以通過用鼠標點擊並拖動 Ln 標記向左或向右來調整其時間坐標。
當混響時間的水平標記小工具顯示時,圖表右上角會出現一塊重要統計信息。這些信息包括 60 分貝的混響和早期衰減時間(RT60 和 EDT)以及三對標記之間的時間和水平差異。
移動 Ln 標記將自動重新計算其他四個水平標記的位置並更新顯示的值。當 Ld、Le、Lr1 和 Lr2 標記被自動定位時,早期衰減和混響時間的顯示值基於每個評估範圍內逆時間積分斜率的線性回歸(也稱為“最小二乘法擬合線”)。計算出的斜率不會顯示。然而,Ld、Le、Lr1 和 Lr2 標記是可以自由移動的,移動這些標記中的任何一個都將根據連接線的斜率重新計算相關的衰減斜率(EDT 或 RT60),所以你看到的就是你得到的。移動 Ln 標記或僅僅點擊它將恢復其他四個標記到自動計算的位置並切換回衰減斜率的回歸分析。
當手動移動 Ld、Le、Lr1 或 Lr2 標記時,相關的水平差值(Ld-Le 或 Lr1-Lr2)會實時更新。一般來說,當手動估計混響時間時,如果動態範圍足夠,使用 30 分貝的評估範圍(Lr1-Lr2)仍然是一個好的做法;如果不夠,則使用 20 分貝。對於 EDT 的最佳評估範圍,人們可能意見不一。ISO 3382 為 EDT 指定了 10 分貝的範圍,15 分貝的範圍也並非罕見,一些聲音系統設計師則偏好 5 分貝的範圍。
Ld-Ln 差值提供了整體動態範圍的估計。D/R 代表直達/混響比例。這是一個早期到晚期能量比,其分割時間來自 Le 標記的時間坐標。
Saving your work
如果你手動調整了任何水平標記的位置,可以通過點擊數據欄上的保存按鈕,將調整後的位置保存到脈衝響應(IR).wav 文件頭中。在之前版本的 Smaart 7 和 8 中用於存儲 IR 水平標記位置的配套 .csv 文件不再需要,但如果你希望導入存儲在舊版 .csv 文件中的標記位置,你可以點擊數據欄上的信息按鈕,然後在追踪信息對話框中點擊導入按鈕來訪問該文件。
殘響時間 - Reporting Results for Reverberation Time
理想情況下,應該在房間的多個位置測量混響時間,並將每個測量位置的結果逐個八度帶平均,以得到每個八度的平均衰減時間。Smaart 不會自動完成這部分工作,但「所有頻帶」表格確實便於將每次測量的數據導入到電子表格中。
Frequency Ranges
混響時間的標準評估範圍是從 125 Hz 到 4 kHz 的六個單八度帶。每個八度帶的平均時間可以在表格或圖表中呈現。在圖表上呈現混響時間時,圖表的頻率軸應標明 IEC 標準的名義八度帶中心頻率。圖表的 y 軸原點應為 0,並以秒為單位標記。無論在表格還是在圖表上,都應註明使用的是 T20 還是 T30。ISO 3382-1 指出,如果呈現圖表,則應該是線圖,並有標準化的長寬比,即每秒 2.5 厘米、每八度 1.5 厘米。ISO 3382-2 則沒有這麼嚴格,它只是說“一個圖表”。
125 Hz 和 250 Hz 頻帶的混響時間可以平均起來得到 TLow(低頻混響時間)數值。500 Hz 和 1 kHz 頻帶的平均值稱為 TMid(中頻混響時間)。當給出混響時間的單一數字時,除非另有說明,否則假設該數字為 TMid。Smaart 會自動為你計算這些值,並在「所有頻帶」表中顯示它們。
將 TLow 除以 TMid 可得到低音比率(Bass Ratio)。低音比率量化了場地中聲音的“溫暖度”,對於音樂廳來說是一個特別重要的參數。這裡的“低音”指的是聲樂或樂器的低音區域,不應與 PA 類的次低音頻率混淆。可接受的值取決於預期。對於混響時間較長的音樂廳(RT 60 大於 1.8 秒),低音比率在 1.1 到 1.25 之間被認為是好的,但對於混響較小的空間,上限數值可以增加到 1.45。
偏好的混響時間根據房間的大小、用途和呈現的節目類型而變化。較短的混響時間——理想情況下,小型房間為 0.4-0.5 秒,大型房間為 0.8 至 1.2 秒——適用於語言清晰度是主要關注點的禮堂、教室、劇院和電影院。歌劇院和多功能表演空間,在這些地方語言清晰度和音樂欣賞同等重要,通常目標為 1.2 到 1.8 秒範圍的低端。旨在進行交響樂和管風琴音樂演出的空間,混響時間可以從約 1.8 秒延伸到三秒或更長,在非常大的廳堂中尤其如此。
對於大多數用途而言,各頻率的混響時間大致相等通常是較理想的。例外情況包括合唱、管風琴和浪漫派古典音樂,這些情況下可能更偏好低頻較重的混響時間曲線。高頻比低頻衰減得更快是相當正常的,但你不希望看到鄰近八度帶中的時間相差極大。然而,一般來說,要有效解決你可能發現的問題,通常需要進行聲學處理和/或對音響系統進行物理改變。
前後期能量比 - 引言
早期到晚期能量比是另一種客觀描述房間混響特性的方式。對於任何音響系統作為聲學方程式一部分的場所,這些比率可以說是比混響時間更好的衡量指標。它們易於自動計算,且不受那些可能使混響時間測量帶有某些主觀性的複雜因素的影響,但它們是較新的創新,可能不如 RT60 那麼廣為人知。
前後期能量比 - Clarity Ratios (C35, C50, C80)
清晰度指數是早期到晚期能量比,比較直達聲到達後最初 n 毫秒內(包括)到達的能量積分與其餘混響衰減期間的能量。最常用的兩種是 C50 和 C80,它們分別以 50 毫秒或 80 毫秒作為分割時間。比較的結果以分貝比率表示。
更短的分割時間,如 35 毫秒或 50 毫秒,被認為是語言清晰度的更好預測指標。C80 對音樂更有用。關於應該尋找哪些數字,Gerald Marshall 在 1996 年的 AES 期刊文章《基於早期到晚期聲能比的房間聲學和音響放大系統分析程序》中提供了圖 132 中顯示的表格。
對於語言清晰度量表,Marshall 使用了 500 Hz 到 4 kHz 八度帶的加權平均值,每個頻帶的加權如下:500 Hz 佔 15%,1 kHz 佔 25%,2 kHz 佔 35%,4 kHz 佔 25%。其他人使用了語音清晰度指數(Articulation Index)、STI 和他們自己設計的量表進行加權,得到了類似的結果。對於音樂,他使用了 500 Hz、1 kHz 和 2 kHz 八度帶的簡單平均值。我們不知道這個指標有適用的標準,有人建議將 Marshall 使用的頻率範圍對於語言擴展到更高一個八度,對於音樂擴展到更高兩個八度可能會有用,但希望這個例子為評估提供了一個有用的起點。
The Histogram Display 直方圖展示
選擇直方圖作為脈衝響應(IR)模式圖的顯示類型,可以繪製一個圖表,展示所有八度帶或三分之一八度帶的混響時間或早期到晚期能量比。直方圖顯示的數據類型和分辨率可以通過圖表右上角的列表控制進行選擇。你可以通過打開脈衝響應選項頁面(選項菜單 > 脈衝響應)並在直方圖設置中選擇「作為線圖繪製」來將直方圖更改為線圖。
The All Bands Table 全通表格
在脈衝模式下點擊“所有頻帶”按鈕會打開一個報告窗口,其中包含 Smaart 可以從 IR 自動計算的幾乎每個聲學量,適用於每個八度帶和三分之一八度帶(參見圖 133)。語音清晰度指標(STI 和 ALCons)也會顯示在這裡,連同低音比率、TMid 和TLow,這些是根據 125 Hz 到 1 kHz 八度帶的混響時間計算得出的。
在這個窗口中點擊“複製”按鈕會以適合粘貼到電子表格或任何接受 ASCII 文本的其他程序的制表符分隔的 ASCII 格式將整個表格複製到操作系統的剪貼板上。你也可以通過點擊“保存”按鈕將其保存到文本文件中。
Frequency Domain Analysis 頻率域分析
在主圖區域選擇頻率作為你的圖表類型會自動將 IR 轉換到頻域,以顯示其頻譜。頻率圖的 x 軸(水平軸)表示赫茲(Hertz)單位的頻率,y 軸(垂直軸)表示分貝(decibels)單位的幅度。頻率圖右上角的平滑控制功能與實時傳輸函數顯示上的平滑功能完全相同。
Smaart 可以在 IR 模式下計算任意長度的離散傅立葉變換(DFT),從而提供你想要放大查看的 IR 時間記錄的任何子集的頻譜。時間域和頻域顯示是聯動的,所以放大時間域圖(線性、對數或 ETC)會自動調整頻率顯示以匹配。當選擇整個時間記錄時,會假設你在分析在 Smaart 中測量的雙 FFT IR,因此在該情況下計算頻譜時不會使用數據窗。
圖 133:直方圖圖表和所有頻帶表。Smaart 中的所有頻帶表收集了所有八度帶和三分之一八度帶的混響時間和早期到晚期能量比於一個表格中。語音清晰度指標(STI 和 ALCons)也在此顯示。直方圖表可以將所有頻帶表的任何一列數據作為條形圖或線圖在八度或三分之一八度分辨率下繪製。
Smaart 在轉換時間記錄的任何子集時自動使用減弱的數據窗口,因此如果你正在分析來自其他來源的 IR 文件或已被裁剪至少於原始長度的文件,你可能會看到如果在時間域中稍微放大,結果會更好。減弱的數據窗口會在選定時間範圍的邊緣顯著衰減數據——許多數據窗口直至 0——因此你通常希望將要檢查的任何峰值定位在選定範圍的中心附近。如果它們靠近範圍邊緣以至於無法居中,則可以使用導航窗格中的“時間 0”滑塊將峰值結構移動到時間窗口的中心附近。在導航的右邊界點擊可以清除時間放大。
如果你對著IR進行極大放大並選擇一個非常狹窄的時間範圍,將其設定在直接聲音到達的時間點上,你可以看到揚聲器的幅度響應,至少在高頻時是如此。在實際應用中,這種策略的有效性可能取決於揚聲器和麥克風距離最近反射表面的距離有多遠。DFT的頻率響應受其時間常數的限制,因此你可能會發現,當你把時間窗口壓縮到足以擺脫一次反射時,你在頻域中無法看到太多細節。但在大多數專業揚聲器的實驗室測量吸音響應數據變得普遍可用之前的日子裡,這是人們經常做的事情。
Figure 134:移動時間0點並選擇顯示的時間範圍。在導航窗格中選擇的時間範圍適用於頻率圖以及時間域圖(Lin、Log或ETC)。請注意,Smaart在轉換完整IR時間範圍的任何子集時使用漸變數據窗口。我們在上圖的“結果”部分的導航窗格上用紅色繪製了漢窗的輪廓,以幫助可視化此過程。
The Spectrograph 光譜儀 - 引言
Smaart的脈衝響應模式中的頻譜圖顯示基本上與實時頻譜圖顯示相同。如果你理解其中一個,那麼你就理解了另一個——如果你兩者都不理解,你可能需要參考第103頁的頻譜圖基礎知識。兩者之間的主要區別在於IR模式的頻譜圖相對於實時版本旋轉了90度,將時間放在x軸上而不是頻率上。在Smaart的實時模式中,我們希望將頻譜圖與其他頻域圖形關聯起來,但在IR模式下,我們最常希望將其放在其他時域圖形的上下文中查看。另一個主要區別是IR模式頻譜圖中的“切片”數量是由你選擇的FFT大小和間隔參數確定的。
為了在IR模式下呈現頻譜圖,請點擊主圖窗口左上角的圖表選擇器,然後選擇"頻譜圖"。頻譜圖最初是使用正在分析的測量或文件的整個時間範圍進行計算的。如果您不需要呈現整個時間記錄,可以點擊圖表右上角的"持續時間"值,然後將其設置為較小的數字。
更改導航窗格中的時間範圍選擇不會影響頻譜圖,就像它會影響IR模式中的其他時間域(Lin、Log和ETC)和頻率圖一樣,但是平移或裁剪時間記錄或篩選IR將清除頻譜圖並需要點擊計算按鈕來重新繪製它。您可以調整頻譜圖的大小並移動其範圍,使用[+]、[-]和箭頭鍵,或者右鍵單擊並拖動圖表以放大所選範圍。在放大後單擊圖表的左邊緣將清除縮放並將圖表恢復為其默認的x/y範圍。
圖135:FFT大小作為時間和頻率分辨率的函數。比較了從512個樣本到4K個樣本的FFT大小,間隔大小大致等於完整FFT時間常數(即≈0%重疊)。隨著FFT大小的增加,頻率分辨率提高,但IR的峰值在更廣的時間範圍內模糊。請注意,每個圖的x軸是時間(以毫秒為單位),y軸是頻率(以赫茲為單位)
The Spectrograph 光譜儀 - Spectrograph Time and Frequency Resolution 頻譜時間及頻率解析
每個IR模式光譜圖中的垂直條紋代表一個FFT,這意味著在最簡單的形式中(在我們討論頻率帶和時間軸重疊之前),FFT大小決定了顯示的時間和頻率分辨率。較大的FFT提供了更多的頻率軸細節,但可能會遮蔽時間軸上的瞬態事件,因此這是一種權衡。出現在Calc按鈕下方的FFT和間隔控制器決定了光譜圖顯示的時間和頻率分辨率。
Figure 135展示了這種關係是如何工作的。它使用了示例.wav文件中的文件6dbOctImpulse.wav(有關下載說明請參見第157頁),這是一個線性相位低通濾波器的冲激響應,每個八度下降6 dB。為每個FFT大小選擇的間隔大小代表了最接近毫秒的完整FFT時間常數,因此“條紋”之間基本上沒有重疊。
這個冲激響應中最尖銳的部分,即大部分的高頻能量所在之處,可能只有幾毫秒寬,但請注意,它的能量在每個情況下都分佈在完整的FFT時間常數上。在512個點時,時間解析度(FFT時間常數)為10.7毫秒,但FFT頻率箱之間間隔為94 Hz。將FFT大小增加到4K個點可以獲得12 Hz的頻率解析度,但會將IR中的峰值模糊到85毫秒的時間範圍內。
圖 136:FFT 重疊。在 0% 重疊時,每個 FFT 都是根據獨特的數據計算的。在 50% 重疊時,較暗的陰影區域由連續的 FFT 共享。(我們的 "FFT" 被繪製成扁平的半圓形,以暗示錐形 FFT 數據窗口。)
Figure 137: The 2K FFT example from Figure 135, with approximately 50%, 75% and 90% overlap (left to right)
對於谱图觀察到的時間解析度的另一個影響因素是間隔設置。在圖 135 中,谱图的每個連續的 FFT “切片”都是從幾乎獨特的時間域數據計算出來的,每個連續的時間切片的開始位置大約是上一個時間切片的結束位置。
當間隔設置小於所選 FFT 尺寸的完整時間常數時,每個連續的 FFT 框架都與先前的框架共享一部分數據(參見圖 136)。FFT 時間常數仍然是 FFT 時間常數,但隨著 FFT 尺寸的增加,更多的重疊有時可以暗示,如果不是精確地恢復一些遺失的時間軸細節,至少也可以在時間軸上產生更平滑的混合效果,正如您在圖 137 中所看到的。
在 IR 模式的頻譜圖顯示的右上角的分半音控制應用於頻率軸上的分半音帶,減少了明顯的頻率解析度,特別是在高頻端。這在壓制不必要的細節以便更容易看到較大特徵時非常有用。
The Spectrograph 光譜儀 - Spectrograph Analysis of an Acoustical Impulse Response
長期使用 Smaart 軟件的用戶可能會認出圖 139 中的脈衝響應測量,這是早期版本的 Smaart 軟件隨附的 room.wav 文件。該測量是在一個能容納 6000 個座位的表演空間的舞台上錄製的,使用了頂部 PA 聚集系統作為激勵源。它展示了一個非常突出的混響累積階段,以及在直接聲音之後約 160 毫秒到達的問題性晚期反射能量。
這是一個很好的文件,可以用來進行實驗,看看改變 FFT 和間隔大小、分帶和動態範圍如何揭示 IR 的不同方面。您可以看到我們將導航窗格的圖表類型設置為 ETC,並將時間 0 移動到大約 100 毫秒。FFT 大小為 2K,重疊率為 95%,動態範圍為 -20 到 -60 dB。

圖 139:房間脈衝響應的寬頻等效時間曲線(ETC)和頻譜圖,顯示了一個問題性的後牆反射。頻譜圖對於檢查 IR 中的特徵(如混響累積和離散反射)的水平和頻率內容非常有用。
STI and STIPA - 引言
我們已討論了早期與後期能量比率作為主觀語音可懂性的良好預測指標,以及 RT60 作為可能稍粗略的衡量標準。還有一些專門設計用於預測語音可懂性的測量指標。其中,近年來已成為衡量聲學系統中語音可懂性的客觀估計指標的語音傳輸指數(STI)備受矚目。STI 是聲音傳輸指數(AI)的相對應,後者基於廣泛頻率範圍內的語音對噪聲比。但不像 AI(及其後繼者 SII),STI 也能有效估計混響環境中的可懂性,除了電子通訊系統。
與基於直接到反射或信噪比的智能度估算不同,STI從將語音視為載波波形的概念出發(即來自我們聲帶的聲音),該波形被非常低頻的波動所調制,當說話者的嘴巴和舌頭移動並改變形狀以形成詞語時(或者更精確地說,是形成口語詞語的音素時),這些波動會發生變化。看看第140圖,一段真實的人類語音,不難理解為何有人會得出這個結論。
這個基本理念是說,語音中大部分的信息都是由這些低頻調製所承載的,任何減少調製深度的因素都必然會對語音的可辨識性產生負面影響。這種方法的真正優勢在於,STI 最終會對於任何一個會降低聲音系統和/或房間內語音可辨識性的因素都敏感,包括噪音(環境或電子的)、過度的混響、失真以及聽得到的回音。
The Speech Transmission Index (STI)的計算基礎是調製轉移函數(MTF),該函數量化接收信號在指定頻率下的調製深度相對於發射信號。調製轉移函數可以直接使用專門的“類似語音”的測試信號進行測量,也可以從系統測試的脈衝響應或ETC(等時光程)間接計算。無論哪種情況,都是在七個八度範圍內進行測量,從125 Hz到8 kHz,在每個頻帶中有14個調製頻率。調製頻率在1/3八度間隔內從0.63 Hz到12.5 Hz不等。
STI的使用需要注意的一般事項是,它對強烈波動的背景噪音敏感,這可能導致對低智能系統的過度估計或高端得分的低估。在存在波動背景噪音的情況下進行測量時,應該進行至少三次測量,然後將其結果取平均以減少測量不確定性。此外,如果語音源和突出的干擾背景噪音源之間的距離很大,STI可能會低估可懂度,因為人類聽覺在這方面可能比機器更聰明。STI還對傳輸通道中的剪切或幅度壓縮敏感,但在我們的情況下,這些操作也會違反傳輸函數測量的線性時不變系統規則。所以不要這樣做。
圖141:STI通過調制損耗的函數估計語音可懂度。在上面的圖中,黑色線代表傳輸信號的調制信號。紅線代表接收傳輸的調制信號。這兩者之間的差異(調制轉移函數或MTF),量化了由於混響和噪音等因素導致的調制損耗。
STIPA
歷史上,直接測量STI的一個問題是它非常耗時。調製頻率之間的間隔非常緊密,每個頻率都必須單獨測量,總共有98個調製頻率(14 x 7)。因此,完整的直接測量通常需要大約15分鐘。為了解決這個問題,STI for Public Address systems(STIPA)被開發出來作為一種解決方案。
STIPA基本上與STI相同,但使用其調製頻率的子集;每個八度兩個頻率,總共14個。STIPA通常是直接測量的,使用一個特殊的測試信號同時激發所有14個頻率,因此測量可以在單次通過中完成。STIPA測量可以在幾秒鐘內完成,並且已被發現與更嚴格的完整STI非常相關。STIPA目前僅驗證適用於男性發言者。
在 Smaart 中,我們當然是間接從脈衝響應中測量 STI,而完整的 STI 測量所需的時間與典型的 STIPA 直接測量一樣長。Smaart 確實提供了 STI 和 STIPA 的數據,但在我們的情況下,STIPA 更正確地稱為 STIPA(IR),因為它基於 IR 數據而不是直接測量。它提供了信息目的,例如,便於與手持 STIPA 米計的讀數進行比較,而且它實際上只是完整 STI 測量的一個子集,使用完全相同的測量數據計算。
Qualitative Thresholds for STI and STIPA
在評估 STI 時,要注意的具體水平是,0.75 或更高被認為是母語人士的語言表達的優秀水平。0.60 到 0.74 的分數為“良好”,0.45 到 0.59 為“一般”,0.30 到 0.44 為“差”,小於 0.30 的分數則是極差的。IEC 標準中的某些版本包括了用於估算男性和女性語音智能的不同標準,然而在 2020 年版標準中,女性語音的 STI 標準被省略了。一般認為女性語音比男性語音更易懂,因此男性語音作為最壞情況的基準,更適合評估系統準確重現語音的整體能力。STIPA 始終只適用於男性語音。
STI and STIPA - Analyzing STI with Smaart
分析Smaart中的STI非常簡單,但在測量IR進行STI分析時,必須考慮幾個因素才能獲得有意義的結果。間接STI分析的測量和分析程序是如此緊密相連,以至於討論其中一個而不涉及另一個是毫無意義的。由於我們尚未討論在Smaart中進行脈衝響應測量,我們將在下一章中涵蓋這兩個主題。如果您已經熟悉在Smaart中執行雙通道IR測量的基礎知識,可以直接跳到從第190頁開始的“用於STI分析的脈衝響應測量”部分。
ALCons
ALCons,有時稱為%ALCons,因為它被表示為百分比,代表輔音的清晰度損失。輔音聲音對於語音清晰度至關重要,因為它們持續時間短,往往比長時間發聲且總能量更大的元音聲音更容易消失。
ALCons最初是基於聽者與聲源的距離、房間體積和混響來估計的,通常稱為“建築”形式的ALCons。後來的形式使用了早期與晚期能量比,取代了房間體積和聽者距離,理論上使ALCons可以直接從脈衝響應中測量。早期與晚期能量比通常在以2 kHz為中心的1/3倍頻帶中測量,分割時間通常在10-20毫秒的範圍內。
值得注意的是,從脈衝響應直接測量ALCons從未標準化,可能仍具有一定爭議性。儘管如此,兩種形式的直接ALCons計算方式出現在許多聲學測量和分析平台中,包括Smaart。這兩種形式中較早的一種未考慮背景噪音,因此不適用於噪音對語音可懂性產生顯著影響的情況。稍後的版本添加了噪音調整,非正式地稱為“長形式”ALCons,以區別於較早的“短形式”計算。
Qualitative Thresholds for ALCons
ALCons相對於其他可懂度指標是上下顛倒的。較小的數字表示較好的分數。任何低於5%的數字都被認為是優秀的。在5-10%之間被評為“良好”,10-15%被評為“一般”,而超過15%的數字則存在問題。

































































![[Adam Audio] 空間補償技術:拆解解析 (第1部分)](https://static.wixstatic.com/media/28913d_38bf2787445948c5a26ddac4dc22053d~mv2.png/v1/fill/w_250,h_250,fp_0.50_0.50,q_35,blur_30,enc_avif,quality_auto/28913d_38bf2787445948c5a26ddac4dc22053d~mv2.webp)
![[Adam Audio] 空間補償技術:拆解解析 (第1部分)](https://static.wixstatic.com/media/28913d_38bf2787445948c5a26ddac4dc22053d~mv2.png/v1/fill/w_64,h_64,fp_0.50_0.50,q_95,enc_avif,quality_auto/28913d_38bf2787445948c5a26ddac4dc22053d~mv2.webp)



















![[Valhalla系列] 您越了解:Valhalla 模式 = 算法!](https://static.wixstatic.com/media/28913d_2ea9d5ecbe964cbd96f0ab8139729985~mv2.png/v1/fill/w_250,h_250,fp_0.50_0.50,q_35,blur_30,enc_avif,quality_auto/28913d_2ea9d5ecbe964cbd96f0ab8139729985~mv2.webp)
![[Valhalla系列] 您越了解:Valhalla 模式 = 算法!](https://static.wixstatic.com/media/28913d_2ea9d5ecbe964cbd96f0ab8139729985~mv2.png/v1/fill/w_64,h_64,fp_0.50_0.50,q_95,enc_avif,quality_auto/28913d_2ea9d5ecbe964cbd96f0ab8139729985~mv2.webp)
![[Valhalla系列] 開始混響設計 , 第四部分 : 最佳書籍](https://static.wixstatic.com/media/28913d_7caf1993197349efb876c62a513ff933~mv2.png/v1/fill/w_250,h_250,fp_0.50_0.50,q_35,blur_30,enc_avif,quality_auto/28913d_7caf1993197349efb876c62a513ff933~mv2.webp)
![[Valhalla系列] 開始混響設計 , 第四部分 : 最佳書籍](https://static.wixstatic.com/media/28913d_7caf1993197349efb876c62a513ff933~mv2.png/v1/fill/w_64,h_64,fp_0.50_0.50,q_95,enc_avif,quality_auto/28913d_7caf1993197349efb876c62a513ff933~mv2.webp)
![[Valhalla系列] 開始混響設計 , 第三部分 : 網路資源](https://static.wixstatic.com/media/28913d_f78d92d5888d43449ce3046ad865d163~mv2.png/v1/fill/w_250,h_250,fp_0.50_0.50,q_35,blur_30,enc_avif,quality_auto/28913d_f78d92d5888d43449ce3046ad865d163~mv2.webp)
![[Valhalla系列] 開始混響設計 , 第三部分 : 網路資源](https://static.wixstatic.com/media/28913d_f78d92d5888d43449ce3046ad865d163~mv2.png/v1/fill/w_64,h_64,fp_0.50_0.50,q_95,enc_avif,quality_auto/28913d_f78d92d5888d43449ce3046ad865d163~mv2.webp)
![[Valhalla系列] 開始混響設計 , 第二部分 : 最佳論文](https://static.wixstatic.com/media/28913d_2660019b612c4a34bba13f166fcaa6cf~mv2.png/v1/fill/w_250,h_250,fp_0.50_0.50,q_35,blur_30,enc_avif,quality_auto/28913d_2660019b612c4a34bba13f166fcaa6cf~mv2.webp)
![[Valhalla系列] 開始混響設計 , 第二部分 : 最佳論文](https://static.wixstatic.com/media/28913d_2660019b612c4a34bba13f166fcaa6cf~mv2.png/v1/fill/w_64,h_64,fp_0.50_0.50,q_95,enc_avif,quality_auto/28913d_2660019b612c4a34bba13f166fcaa6cf~mv2.webp)
![[Valhalla系列]開始設計混響效果,第一部分:開發環境](https://static.wixstatic.com/media/28913d_424806b245e642edab70a4b2bcfd2e40~mv2.png/v1/fill/w_250,h_250,fp_0.50_0.50,q_35,blur_30,enc_avif,quality_auto/28913d_424806b245e642edab70a4b2bcfd2e40~mv2.webp)
![[Valhalla系列]開始設計混響效果,第一部分:開發環境](https://static.wixstatic.com/media/28913d_424806b245e642edab70a4b2bcfd2e40~mv2.png/v1/fill/w_64,h_64,fp_0.50_0.50,q_95,enc_avif,quality_auto/28913d_424806b245e642edab70a4b2bcfd2e40~mv2.webp)











留言