VoIP是指通过IP网络传输电话呼叫的一种方式。VoIP允许通过已有的IP数据网络传输电话呼叫,从而帮助企业降低通信成本。同时VoIP技术在企业市场的应用使数据通信产品厂商进入了语音市场,激烈的竞争催生了很多新的应用。在诸多新的应用中,IP电话与企业数据以及桌面应用的集成已成为一个热点,企业级IP电话的语音质量对于整个融合解决方案的质量至关重要。
影响语音质量的因素
VoIP是以一种新技术的角色进入市场,与传统的PSTN网络进行竞争。作为替代技术,其语音质量应该能够与PSTN的语音质量一致或者更好。但是因为IP网络原本不是为传递语音数据而设计的,相对传统电话系统,一些技术难点需要克服,设计者必须面对由此而带来的挑战。常见的问题有网络时延、抖动、丢包和声学回声。
1. 网络时延
在传统的PSTN网络,洲际长话或者卫星长话的回路时延大约在500~600ms,这时候,当一方说话后要过一段时间对方才会听到说话并反应,双方通话脱节。在ITU的标准中建议电话系统的回路延时应该不大于300ms。在IP电话系统中,回路的时延包括语音报文打包时长、语音编解码所引入的延时以及处理网络抖动所引入的延时等。系统设计者必须均衡考虑各方面因素,使系统的回路时延尽可能小,使通话自然流畅。
2. 抖动
IP报文在网络上传递时,每个报文传输的路由都有可能不一样,在每个节点上传递转发的时间也可能不一样。在一个VoIP通话中,每个语音数据报文在网络中的传输时间都不一样。一些报文会比预计到达的时间晚到或者早到接收方,而在回放解码IP语音报文时,解码器以固定间隔回放语音数据。晚到的语音包会导致在一段时间内解码器没有数据可解,而早到的数据报文有可能被丢弃。所以系统中需要引入报文缓存区以去除网络抖动,平滑网络抖动所造成的影响。但是引入过深的缓存区,会使回路时延相应增大,需要选择合适的缓存区大小,在能去除网络抖动的同时,不过多增大回路延时。
3. 丢包
理想的网络情况是所有发送的语音报文都能够被接收端正常接收。但是IP报文在网络上传递时,网络的个别处理节点可能会出现处理能力不够或者带宽受限制的情况,部分报文可能会被丢掉。虽然IP网络上有一些机制可以在报文丢失的时候重传丢失报文,但是对实时性要求很高的话音数据并不能使用这些机制。
部分语音编解码方式有内置的丢包补偿算法,在丢包比率不高的时候,可以使用插值的方法做补偿,让接听方感觉不到语音信息丢失。但是在丢包率较高的网络,必须采用其它方法来控制网络丢包对语音质量的影响。
4. 声学回声
在电话二四线转换系统中通常存在两种回声:线路回声和声学回声。
线路回声是由于二四线转换的时候阻抗不匹配引起。在这种情况下,通话者的声音传递到远端的二四线转换时反射,同对方的说话送回到通话者的耳中。如果回路延时比较小(<50ms),通话者很难察觉到回声的存在,但是当回路时延比较大的时候,通话者就能听到自己的说话。IP通话的回路时延一般比较大,所以在有二四现转换的节点必须有回声抑制单元。
声学回声是由于在电话侧的播放和接听之间存在声学耦合,喇叭播放出的声音经过在空间中的一次或者多次反射以后回馈到听筒或麦克风而引起(如图1所示)。

在企业级IP电话的设计中,因为IP电话中没有二四线转换,所以线路回声的影响不需要考虑。声学回声的影响,特别是免提模式下的声学回声是系统设计者需要考虑的难点和主要问题。
市场上推广的很多解决方案宣称能够做到全双工免提。但是事实上,大部分算法都只能支持半双工免提通话。当全双工电话工作在免提模式下,通话的双方即使同时说话也能听到对方的声音。如果是只能支持半双工免提通话,当双方同时说话的时候,一方的声音被压制消除,不能被另一方听到。甚至在本地的背景噪声比较大的时候,对方的说话声音被压制,而听不到任何声音。