數(shù)字音頻技術(shù)發(fā)展的方向
一、模擬與數(shù)字音頻技術(shù)的關(guān)系和互補性
把握數(shù)字音頻技術(shù)發(fā)展的方向,我們必須對數(shù)字音頻與模擬音頻技術(shù)之間有一個科學(xué)的認識,并清楚這樣一個概念:數(shù)字化是一種手段,但我們始終離不開這個模擬的世界,所以我們要清楚模擬與數(shù)字音頻技術(shù)的優(yōu)勢和弱點。
對音頻的質(zhì)量上來說,數(shù)字音頻通過模數(shù)/數(shù)模轉(zhuǎn)換后,越接近模擬音質(zhì)就越好。但是,數(shù)字化技術(shù)在音頻的編輯、合成、效果處理,存儲、傳輸和網(wǎng)絡(luò)化,以及在價格等方面,有極大的優(yōu)勢。半導(dǎo)體技術(shù)高速發(fā)展的今天,在專業(yè)音頻領(lǐng)域,為了得到溫暖的模擬音質(zhì),仍舊需要采用電子管器件,如電子管話筒、電子管前置放大器和壓縮器,以及功率放大器。為了與數(shù)字化音頻系統(tǒng)配合使用,不少最新的音頻專業(yè)電子管產(chǎn)品帶有了數(shù)字接口。所以,數(shù)字化時代的音頻技術(shù),并不是棄模變數(shù),而是兩者有機的結(jié)合,取長補短,用數(shù)字化技術(shù)去追求模擬的音質(zhì),用數(shù)字化手段來彌補傳統(tǒng)音頻設(shè)備的弱點。
目前世界上公認音質(zhì)最好的調(diào)音臺,如AMEK 9098和SSL 9000J 系列,就是模擬數(shù)控臺,即模擬信號流,數(shù)字化的控制系統(tǒng),另外還配置了模數(shù)轉(zhuǎn)換接口,這就是模擬音頻技術(shù)與數(shù)字技術(shù)結(jié)合的實例。
電腦技術(shù)已將人們帶入了一個虛擬世界。音頻領(lǐng)域也不例外,音頻工作站的發(fā)展已越來越成熟,人們已稱它為虛擬錄音棚。虛擬音頻制作系統(tǒng)中,包括了錄音機、調(diào)音臺、周邊信號發(fā)生器、非線性編輯和數(shù)據(jù)庫等。這種虛擬系統(tǒng)不僅有價格的優(yōu)勢,而且功能齊全,符合數(shù)字化,網(wǎng)絡(luò)化發(fā)展的要求,其音頻的質(zhì)量可與一些高級傳統(tǒng)音頻設(shè)備抗衡。它符合數(shù)字化、網(wǎng)絡(luò)化的要求,其價格與傳統(tǒng)設(shè)備相比,則更有優(yōu)勢。
近年來,虛擬音頻制作系統(tǒng)對界面的外控操作上,正逐步向傳統(tǒng)設(shè)備的操作概念發(fā)展。還與傳統(tǒng)調(diào)音臺有機結(jié)合。除Protools音頻工作站已有了Pro Controls外控操作臺外,索尼公司已將DMX-100調(diào)音臺與Pyramix虛擬音頻制作系統(tǒng)結(jié)合,DMX-100調(diào)音臺的48路數(shù)字音頻通道可通過MADI模數(shù)/數(shù)模轉(zhuǎn)換器與Pyramix連接,Pyramix可通過DMX-100的24個電動馬達推子實現(xiàn)外部自動化控制。另外SSL 9000J 系列高級模擬數(shù)控臺也可與Pyramix虛擬音頻制作系統(tǒng)配合使用,音頻信號可通過PCM/MADI轉(zhuǎn)換器或DSD轉(zhuǎn)換器與Pyramix連接,SSL 9000J 系列調(diào)音臺上的控制鍵鈕和推子可通過索尼422協(xié)議與Pyramix連接。
上述種種可以看到,數(shù)字時代音頻的發(fā)展,從音質(zhì)上講,數(shù)字與模擬的追求是一致的;從數(shù)字技術(shù)在音頻領(lǐng)域的應(yīng)用來看,它仍然依托著傳統(tǒng)的模擬設(shè)備而向前發(fā)展。
“自從數(shù)字技術(shù)發(fā)明以來,它是最接近于事物模擬的……”
二、數(shù)字音頻格式PCM和DSD的發(fā)展狀況
PCM脈碼調(diào)制數(shù)字音頻格式是70年代末發(fā)展起來的,記錄媒體之一的CD,80年代初由飛利浦和索尼公司共同推出。PCM的音頻格式也被DVD-A所采用,它支持立體聲和5.1環(huán)繞聲,1999年由DVD討論會發(fā)布和推出的。
PCM的比特率,從14-bit發(fā)展到16-bit、18-bit、20-bit直到24-bit;采樣頻率從44.1kHz發(fā)展到192kHz。到目前為止PCM這項技術(shù)可以改善和提高的方面則越來越來小。只是簡單的增加PCM比特率和采樣率,不能根本的改善它的根本問題。其原因是PCM的主要問題在于: 1)任何PCM數(shù)字音頻系統(tǒng)需要在其輸入端設(shè)置急劇升降的濾波器,僅讓20 Hz - 22.05 kHz的頻率通過(高端22.05 kHz是由于CD 44.1 kHz的一半頻率而確定),這是一項非常困難的任務(wù)。2)在錄音時采用多級或者串聯(lián)抽選的數(shù)字濾波器(減低采樣率),在重放時采用多級的內(nèi)插的數(shù)字濾波器(提高采樣率),為了控制小信號在編碼時的失真,兩者又都需要加入重復(fù)定量噪聲。這樣就限制了PCM技術(shù)在音頻還原時的保真度。
為了全面改善PCM 數(shù)字音頻技術(shù),獲得更好的聲音質(zhì)量,就需要有新的技術(shù)來替換。近年來飛利浦和索尼公司再次聯(lián)手,共同推出一種稱為直接流數(shù)字編碼技術(shù)DSD的格式, 其記錄媒體為超級音頻CD即SACD,支持立體聲和5.1環(huán)繞聲。
DSD音頻格式簡化了信號流程,去掉了PCM使用的多級濾波器,將模擬音頻直接以2.8224MHz的高采樣頻率,按1-bit的數(shù)字脈沖來記錄。雖然DSD格式表示的聲音信號是數(shù)字化數(shù)據(jù),但是它又與真正的聲波非常接近,可完整的記錄當(dāng)今最佳模擬系統(tǒng)的信息。最好的30ips半英寸模擬錄音機能記錄的頻率能超過50KHz,而DSD格式的頻率響應(yīng)指標為從DC到100KHz。能覆蓋高級模擬調(diào)音臺的動態(tài)范圍,通過其音頻頻段的剩余噪聲功率,保持在-120dB。DSD的頻率響應(yīng)和動態(tài)范圍,是任何數(shù)字和模擬的錄音系統(tǒng)無法與之比擬的。從聲音的質(zhì)量上來說, 數(shù)字音頻技術(shù)是為了接近模擬聲音的質(zhì)量。DSD音頻格式的發(fā)展將更有利的與模擬音頻系統(tǒng)配合。
三、為何DSD音頻格式是最好的數(shù)字音頻格式
2001年AES 110年會的報告指出DSD是最好的音頻格式選擇。環(huán)球, EMI和Virgin也新加入了索尼和飛利浦的SACD/DSD的行列,除了華納之外,幾乎所有大唱片公司都支持SACD/DSD的格式。
當(dāng)前還沒有真正的直接24/192kHz錄音,僅僅是從24/48kHz錄音轉(zhuǎn)換的。真正的DVD-A出版非常少,目前還沒有這種格式的市場。而在北美已超過400多版的SACD的出版,并且繼續(xù)在發(fā)展。 按照Stereophile(在北美高檔音頻雜志)的最新統(tǒng)計指出有高達30%的讀者表示將在2001年底加入SACD的行列,或者在明年初有31%的讀者加入此行列。而DVD-A的百分比是12%。當(dāng)問及讀者支持哪一種格式時,回答是SACD。
幾乎所有主要的DVD-A與SACD格式的試聽評價中,都由SACD取勝。這包括Stereophile、 Absoulte Sound 、Surround Sound Review和Widescreen Review音頻發(fā)燒雜志以及如Bob Ludwig那樣的,對錄音工業(yè)有非常影響的專業(yè)工程師。 在今后若干月有幾個發(fā)展動向,將會有新的芯片出現(xiàn)可同時播放SACD和DVD-A格式,這將被用到新的DVD播放機中。主要的問題是這種多功能的芯片要兼容多格式對解碼的音頻質(zhì)量不會太好。
除了音質(zhì)方面的改善外,SACD的另一個關(guān)鍵要點是有完善的防盜版保護方式,在SACD上同時有可見和不可見的水印,SACD播放機要讀到水印才能工作。SACD具有SACD和CD兩層,仍舊可以汽車里的CD中播放,而DVD-A則不行。對音樂存儲媒體來說,74分鐘的容量是十分重要的。4.7 GB 的SACD能存儲74分鐘DSD 8個通道( 2通道立體聲和DSD 6通道的環(huán)繞聲)。 采用了一種被稱為直接流數(shù)字轉(zhuǎn)換( Direct Stream Transfer)無損編碼方式的飛利浦技術(shù)。這種無損編碼可節(jié)省50%的存儲空間。 DVD-A采用的是一種被稱為MLP無損包裝(Meridian Lossless Packing )的編碼技術(shù)。4.7 GB 的DVD-A 能存儲55分鐘20 bit,192kHz PCM 6通道的環(huán)繞聲。這種無損編碼可節(jié)省35%-50%的存儲空間。
四、DSD的應(yīng)用范圍
DSD的脈沖序列可以直接下轉(zhuǎn)為傳統(tǒng)的PCM數(shù)字音頻。目前在PCM和DSD共存的期,采用DSD下轉(zhuǎn)運算技術(shù),可以盡量保證音頻信號的質(zhì)量,消除內(nèi)部重復(fù)量化錯誤,抑制波動,將混淆誤差控制在最小。將DSD比特流下轉(zhuǎn)為16-bit/44.1 kHz數(shù)字音頻,直接記錄在普通的CD上,可使16-bit的數(shù)字音頻接近20到24-bit的精度,使得16-bit的CD盡可能的保持DSD的音質(zhì)。
DSD選取2.8224 MHz高采樣頻率,其優(yōu)勢是可高精度的按整數(shù)的乘法和除法下轉(zhuǎn)當(dāng)前所有PCM采樣頻率。以DSD格式記錄既能保證音頻質(zhì)量,又能通過下轉(zhuǎn)滿足不同的應(yīng)用和要求。除了用于音樂錄音外,也適用于影視的音頻制作,最終合成的節(jié)目可通過下轉(zhuǎn),用來傳輸或記錄在媒體上,如5.1的節(jié)目需要進行AC-3或DTS的編碼。DSD音頻格式與現(xiàn)有的音頻設(shè)備配合,不僅僅可以改善當(dāng)前節(jié)目的音頻質(zhì)量,而且對高清晰數(shù)字電影和高清晰數(shù)字電視的音頻是一個極大的支持。
DSD是理想的節(jié)目素材存儲格式,用于母版的保存或數(shù)據(jù)庫的建立。DSD的采樣頻率是CD的64倍即2,822,400 Hz。但是DSD每個采樣僅占用1 bit,因此每個通道每秒的比特率為1 x 2,822,400 Hz或 2,822,400 bits。而CD每個采樣占用16 bits,因此每個通道每秒的比特率為16 x 44,100 Hz或705,600 bits。實際上,DSD總的數(shù)據(jù)流只大于普通CD的4倍,數(shù)據(jù)量可以被當(dāng)前的磁帶和硬盤容納。
DSD也是保存節(jié)目的理想格式。各國音響資料館都面臨著一個共同的問題,磁帶只有30年的保存期,而每種版權(quán)則有100年的保護。選擇哪種方案可將原始資料較理想的保存下來?這個問題一直得不到解決的方案,而資料越積越多,部分老化的資料已無法恢復(fù)。直到SACD的出現(xiàn),美國國會所屬的國家檔案館首先決定采用。
DSD的錄音制作與傳統(tǒng)的錄音制作,對設(shè)備和技術(shù)上沒有重要的區(qū)別。需要增加的是DSD的模數(shù)/數(shù)模轉(zhuǎn)換器和DSD錄音編輯工作站,不少錄音棚已經(jīng)采用高級模擬調(diào)音臺和現(xiàn)存的PCM錄音設(shè)備成功的進行了DSD的錄音。飛利浦發(fā)展了一種DSD錄音技術(shù)的P3D的轉(zhuǎn)換格式,即可以將64 DSD bits描述成3 x 24-bit AES-EBU數(shù)字節(jié),有可能將一臺24軌/24-bit 44.1 kHz PCM錄音機改變成為一臺8路的DSD錄音機。
五、Pyramix4.3版本虛擬音頻制作系統(tǒng)
目前SACD和DVD-A都在推廣之中,PCM與DSD兩種數(shù)字音頻格式需要一段共存期。 我們必須考慮PCM/DSD的兼容和轉(zhuǎn)換。因此Pyramix 虛擬音頻制作系統(tǒng)有很大的優(yōu)勢,它是當(dāng)前僅有一個完善系統(tǒng)可同時完成DVD-A (24/192kHz)和SACD/DSD (1bit/2.8Mhz)的音頻制作系統(tǒng)。上述文章已經(jīng)提到索尼公司已將DMX-100調(diào)音臺與Pyramix虛擬音頻制作系統(tǒng)結(jié)合,另外,世界數(shù)字和模擬音頻設(shè)計大師Ed Meitner也為Pyramix配置了當(dāng)今世界最好的8路模數(shù)/數(shù)模轉(zhuǎn)換器,支持DSD和PCM兩種格式。
Pyramix在功能上的綜合優(yōu)勢有:兼容PCM與DSD兩種數(shù)字音頻格式;基于高度穩(wěn)定的Win2000專業(yè)工作平臺,可單系統(tǒng)獨立使用,也符合多系統(tǒng)網(wǎng)絡(luò)化建設(shè);其DSD編碼格式有利與高級模擬音頻系統(tǒng)配合;包括5.1環(huán)繞聲的AC-3和DTS合成和編碼;具有全套的不丟幀同步能力,支持電視、電影以及目前市場上唯一支持高清晰電視HDTV Trilevel的聲音同步。再加上所有的 VITC 及LTC設(shè)置,可鎖定于任何視頻或音頻設(shè)備。
Pyramix 4.3除了它的全新的、全面的編輯功能、全實時的專業(yè)效果器組合、全部可自行配置及自動化控制的虛擬調(diào)音臺之外,Pyramix 4.3還添加了:
1.DSD 1bit, 2.8Mhz (SACD) 錄音、制作及母版制作功能
2.支持192kHz 到 384kHz高采樣頻率錄音、制作及母版制作功能
3.特別為工作于96kHz 到 384kHz 及 DSD 采樣頻率而特別設(shè)計的實時效果器
4.不需要轉(zhuǎn)換地直接支持OMF (Avid) 及 SD2 (Protools)的音頻格式
5.新的效果器包括:
·實時大型、全部可自行配置的VU表指示系統(tǒng)
·實時相位表 (可配置為多聲道顯示)
·實時錄音用通路工具組件
·為母版制作及環(huán)繞聲制作使用的實時總線工具組件
·新式強化的實時全自動化聲像移位器,可用于雙聲道立體聲素材及單聲道素材
6.為多聲道音樂錄音、編輯及母版制作而強化的工具,包括節(jié)拍器軌。按照節(jié)奏及拍子的多種變化而自動調(diào)整時間線,按節(jié)奏軌自動調(diào)整時間線及節(jié)拍。
7. 通過最多可支持8塊DSP卡,要增加Pyramix的能力,只要添加Mykerinos DSP卡
8. 支持DIRECTX插件及ASIO,可與其它專業(yè)音頻效果器及應(yīng)用程序相連
9. 使用不同控制協(xié)議,可通過多種控制介面控制多種外部設(shè)備
10. 直接支持新式的Sony DMX-R100 (MADI I/O 接口)調(diào)音臺
Pyramix虛擬音頻制作系統(tǒng),是經(jīng)索尼和飛利浦和公司證的DSD系統(tǒng),也是世界上唯一的系統(tǒng),可以有以下DSD的功能:
1. 2-24 聲道DSD錄制及還放
2. 為DSD的多聲道編輯,加上實時淡出/淡入及聲音漸變效果。
3. PCM到DSD 轉(zhuǎn)換
4. 實時高采樣率效果器,包括混響也是基于DSD模式的
5. 可制作DSD環(huán)繞聲
6. 為SACD 完整的D及E表指示,紅皮書標準
7. DSD特有的高采頻樣濾波器
在廣播影視領(lǐng)域大規(guī)模數(shù)字化進程中,我們已感受到音頻制作手段的快速更新,工作效率大大提高,但對數(shù)字化后的音頻質(zhì)量,還須有更高的追求,高清晰度電視和數(shù)字電影更需要有與之相適應(yīng)的高質(zhì)量音頻。飛利浦和索尼公司計劃告別他們的多比特PCM格式,全面推廣DSD格式。這不是一個偶然的,它關(guān)系到數(shù)字化音頻發(fā)展的趨勢,因此在數(shù)字化規(guī)劃中,應(yīng)當(dāng)逐步將DSD技術(shù)應(yīng)用于實際,真正走在廣播影視數(shù)字化進程的前列。
文章中所提及DSD (Direct Stream Digital) 直接流數(shù)字技術(shù)和SACD (Super Audio Compact Disc)超級音頻CD的理論基于和忠實于飛利浦公司和索尼公司的版權(quán)
| 【打印此頁】【返回首頁】 |
