|
Возможность передачи голосовых сообщений через сеть с пакетной коммутацией впервые была реализована в 1993 году. Данная технология получила название VoIP (Voice over IP). Одним из частных приложений данной технологии является IP-телефония— услуга по передаче телефонных разговоров абонентов по протоколу IP.
Основными преимуществами технологии VoIP является сокращение требуемой полосы пропускания, что обеспечивается учётом статистических характеристик речевого трафика:
- блокировкой передачи пауз (диалоговых, слоговых, смысловых и др.), которые могут составлять до 40-50 % времени занятия канала передачи;
- высокой избыточностью речевого сигнала и его сжатием (без потери качества при восстановлении) до уровня 20-40 % исходного сигнала.
Трафик VoIP критичен к задержкам пакетов в сети, но обладает толерантностью (устойчивостью) к потерям отдельных пакетов. Так, потеря до 5 % пакетов не приводит к ухудшению разборчивости речи.
При передаче телефонного трафика по технологии VoIP должны учитываться жёсткие требования стандарта ISO 9000 к качеству услуг, характеризующие:
- качество установления соединения, определяемое в основном быстротой установления соединения
- качество соединения, показателем которого являются сквозные (воспринимаемые пользователем) задержки и качество воспринимаемой речи.
Трафик VoIP критичен к задержкам пакетов в сети, но обладает толерантностью (устойчивостью) к потерям отдельных пакетов. Так, потеря до 5 % пакетов не приводит к ухудшению разборчивости речи.
При передаче телефонного трафика по технологии VoIP должны учитываться жёсткие требования стандарта ISO 9000 к качеству услуг, характеризующие:
- качество установления соединения, определяемое в основном быстротой установления соединения
- качество соединения, показателем которого являются сквозные (воспринимаемые пользователем) задержки и качество воспринимаемой речи.
Уровень QoS качества передачи речи можно соотнести с одним из четырёх классов :
|
Показатели качества |
Классы качества услуги |
|
Лучшее |
Высокое |
Среднее |
Низкое |
|
Время установления соединения |
прямая IP-адресация |
< 1.5 сек |
< 4 сек |
< 7 сек |
— |
|
перевод номера
E.164
в IP-адрес |
< 2 сек |
< 5 сек |
< 10 сек |
— |
|
перевод номера
E.164
в IP-адрес
через расчётную организацию |
< 3 сек |
< 8 сек |
< 15 сек |
— |
|
перевод имени
e-mail в
IP-адрес |
< 4 сек |
< 13 сек |
< 25 сек |
— |
|
Сквозные задержки |
по стандарту ETSI TS101329 |
< 150 мс |
< 250 мс |
< 350 мс |
< 450 мс |
|
по рекомендации ITU-T
G.114 |
< 150 мс |
< 260 мс |
< 400 мс |
> 400 мс |
|
Качество воспринимаемой речи |
ETSI |
Не хуже G.711 |
Не хуже G.726 для 32 кбит/сек |
Не хуже GSM-FR |
С максимальными усилиями |
|
Баллы MOS |
> 4.5 |
4.0 — 4.5 |
3.5 — 4.0 |
3.5 — 3.0 |
В результате для обеспечения требований QoS при передаче телефонного трафика по технологии VoIP (особенно в условиях ограниченной пропускной способности сети, характерной для сетей специальной связи) необходимо использовать ряд дополнительных механизмов, не существующих в классических IP-сетях. К этим механизмам относятся:
- использование специфических вокодеров;
- уменьшение задержек при передаче пакетов по сети;
- использование специализированных декодеров, устойчивых к потерям пакетов.
Кодирование речевой информации
Источником информационных данных является речевой сигнал, возможной моделью которого является нестационарный случайный процесс. В первом приближении можно выделить следующие типы сигнальных фрагментов: вокализированные, невокализированные, переходные и паузы. При передаче речи в цифровой форме каждый тип сигнала при одной и той же длительности и одинаковом качестве требует различного числа бит для кодирования и передачи. Следовательно, скорость передачи разных типов сигнала также может быть различной, что обусловливает применение кодеков с переменной скоростью. В результате передача речевых данных в каждом направлении дуплексного канала рассматривается как передача асинхронных логически самостоятельных фрагментов цифровых последовательностей (транзакций) с датаграммной синхронизацией внутри транзакции, наполненной блоками различной длины.
В основе кодека речи с переменной скоростью лежит классификатор входного сигнала, определяющий степень его информативности и, таким образом, задающий метод кодирования и скорость передачи речевых данных. Наиболее простым классификатором речевого сигнала является VAD (англ. Voice Activity Detector, детектор речевой активности), который выделяет во входном речевом сигнале активную речь и паузы. Фрагменты сигнала, классифицируемые как активная речь, кодируются каким-либо из известных алгоритмов (как правило, на базе метода Code Excited Linear Prediction — CELP) с базовой скоростью 4 — 8 кбит/с. Фрагменты, классифицированные как паузы, кодируются и передаются с низкой скоростью порядка 0.1 — 0.2 Кбит/с, либо не передаются вообще. Когда срабатывает VAD, на приемной стороне может автоматически генерироваться так называемый «комфортный шум» чтобы у собеседника не возникало ощущение пропадания связи. При этом передача минимальной информации о фрагментах пауз предпочтительна. Данная стратегия позволяет оптимизировать скорость кодирования до 2 — 4 кбит/с при достаточном качестве синтезируемой речи. При этом для особо критичных фрагментов речевого сигнала выделяется большая скорость передачи, для менее ответственных — меньшая.
Вокодер вносит дополнительную задержку порядка 15 — 45 мс, возникающую по следующим причинам:
- использование буфера для накопления сигнала и учёта статистики последующих отсчётов (алгоритмическая задержка);
- математические преобразования, выполняемые над речевым сигналом, требуют процессорного времени (вычислительная задержка).
Данную задержку необходимо учитывать при расчёте сквозных задержек (табл. 1). Проведённый в различных исследовательских группах анализ качества передачи речевых данных через сеть Интернет показывает, что основным источником возникновения искажений, снижения качества и разборчивости синтезированной речи является прерывание потока речевых данных, вызванное:
- потерями пакетов при передаче по сети связи;
- превышением допустимого времени доставки пакета с речевыми данными.
Это требует решения задачи оптимизации задержек в сети и создание алгоритмов компрессии речи устойчивых к потерям пакетов (восстановления потерянных пакетов).
|