[转帖]声音波形采样详细介绍

内核编译和嵌入式产品的设计与开发
回复
兰晓成
帖子: 28
注册时间: 2007-05-09 19:59
送出感谢: 0
接收感谢: 0
联系:

[转帖]声音波形采样详细介绍

#1

帖子 兰晓成 » 2007-09-12 8:50

声音是表达思想和感情的一种必不可少的媒体。但是,无论是人们的语音还是乐器演奏的乐曲都是连续变化的模拟信号,而计算机处理的是数字信号。因此,音频处理设备既要能把模拟音频信号转换成数字信号,输入给计算机,又要能把计算机输出的数字信号转换成模拟音频信号,送音响设备。目前,进行这种转换的技术主要有两种,一种是对声音波形采样处理;另一种是乐器演奏数字化处。


1.声音波形采样处理
在电子技术中,把模拟电信号转换成数字信号的过程称为模/数(A/D)转换;把数字信号转换成模拟电信号的过程称为数/模(D/A)转换。在音频信号输入时,首先由话筒或录音机把声音信号转换成模拟电信号,再由模/数(A/D)转换器转换成数字信号,送计算机处理,这一过程称为采样或数据采集。音频信号输出时,计算机输出的数字信号由数/模(D/A)转换器转换成模拟电信号,再经音频放大器放大整型后送音响设备,这一过程称为播出或播放。


(1)采样与采样频率
采样就是采集模拟的音频信号。声音是连续的模拟信号,是时间的函数。而进行一次数据采集需要一定的时间,因此不能连续进行。但是,采样的次数越多,越接近真实的声音信号。通常把这一特征用采样频率来表征,即每秒钟采样的次数。
目前常用的采样频率有11.025kHz、22.05kHz、44.1kHz等。CD唱盘多采用44.1kHz,因此可得到高品质的效果。

(2)量化
提高采样频率可以弥补采样不连续而造成的声音损失,而声音的大小(即响度)则是表现在波幅上。波幅越高,声音越大;反之,声音就小。A/D转换是用数字表示波幅,不同高度的波幅对应于不同大小的数字。这种用数字表示波幅的过程称为量化。在计算机中,数字的位数是固定的。若以8位数据表示,可把最大幅度分成256等份,每一等份称为一个量化级,也称为分辨率。若以16位数据表示,可有65536个量化级。显然位数多,量化级差小,分辨率高。在数据采样中,常以二进制数的位数表示量化精度,目前使用较多的是16位,也称为16位分辨率。


(3)编码
采样量化后得到的二进制音频数据需要按照一定的方式进行编码,以利于计算机存储和处理。最简单的方法是直接对采集到的数据求补,以补码的形式表示,称为脉冲编码调制(PCM,Pulse Code Modulation)。

(4)声道:声道是传输音频信号的路径。如果仅对一路信号进行数据采集,称为单声道。为了获得良好的音色,常对高频音和低频音分开采集,这样就有两路音频数据信号传送。这种采用两路音频数据信号传送与播放的形式称为双声道,也称为立体声采集与播放。如今高质量的声音传送多采用双声道技术。
(5)WAV文件
通过对声波采样后可得到一系列数据,这些数据以文件的形式存储,文件扩展名为.WAV。由于声音波形采样处理是直接对模拟的声音信号进行采集,因此当采样频率和量化精度高时数据量就会很大,而且与时间成正比,可用下式计算:
存储量(字节/秒)= 采样频率×量化精度×声道数/8
例如一段一分钟单声道声音片段,若采样频率为44.1kHz、16为量化精度,则需要的存储空间为5.292MB。
为了便于存储,常对声音文件进行压缩处理。目前采取的压缩技术有两种,一种是无损压缩,另一种是有损压缩。采用有损压缩,恢复的声音会有一定的失真。由于声音不象图形图像有大量的空白或相同色彩,它除了少量语音间歇外都是连续的声音信号。要做无损压缩比较困难,因此一般不如图形图像的压缩效果好,压缩比仅为2:1或4:1 。


2.乐器演奏数字化处理MIDI
MIDI是乐器数字化接口(Musical Instrument Digital Interface)的缩写,也是一种通信标准。它不采样,而是利用合成技术产生音乐。它通过指令描述乐曲的音调、音长和音符等信息,一系列指令可表示一段乐曲,也就是一个MIDI文件,扩展名为.MID。
一般声卡上设有MIDI接口,可连接MIDI设备,构成以计算机为核心的个人音乐作曲和演奏平台。乐曲录制时,由MIDI合成器把乐器输入的乐曲转换成MIDI文件;乐曲播放时,MIDI文件送MIDI合成器,经模拟混合后送扬声器播出。由于MIDI文件是一系列指令,因此相同时间的MIDI乐曲文件要比WAV文件小得多。


3.声音合成
普通声音具有音调、音色和响度三个要素。而对于电子音乐,还有一个持续时间,称为时值,也就是音乐颤动的时间。因此,音调、音色、响度和时值是构成电子音乐的四种要素。这四种要素合理配合,可产生优美动听的旋律。目前采取的合成技术主要有两种,一种是调频合成技术FM(Frequency Modulation);另一种是波表合成技术WT(Wave Table)。
(1)调频合成技术FM:是根据傅立叶变换,由电子线路把声音信号分解成基波和一系列谐波。通过调谐不同频率的正弦波,达到模拟不同声音的效果。
(2)波表合成技术WT:是对乐器发出的声音采样,然后转换成相应的数字音频信号,存入ROM或硬盘中,构成波形表。存入ROM中的样本称为硬波表,存入硬盘中的样本称为波表。声音合成时,把波表中的波形数据输出播放,从而得到良好的播放效果。但是,各波形文件要保存真实音乐的记录,因此占据的存储空间较大,需要采用压缩。
头像
zhuqin_83
帖子: 10606
注册时间: 2006-05-13 4:02
送出感谢: 0
接收感谢: 7 次
联系:

#2

帖子 zhuqin_83 » 2007-09-12 9:02

只能算科普知识,很浅。
HP Pavilion DV6-2064CA: AMD Turion II Ultra Dual-Core Mobile M640, HD4650, 2GBx2 DDR2-800, Seagate 500GB 7200RPM SATA, BD-ROM
DELL UltraSharp 2209WA
Arch64, Testing repo
回复

回到 “内核及嵌入式开发”