научная статья по теме ОСЛАБЛЕНИЕ АКУСТИЧЕСКОЙ ОБРАТНОЙ СВЯЗИ МЕТОДОМ ТРАНСПОНИРОВАНИЯ СПЕКТРА СИГНАЛА Энергетика

Текст научной статьи на тему «ОСЛАБЛЕНИЕ АКУСТИЧЕСКОЙ ОБРАТНОЙ СВЯЗИ МЕТОДОМ ТРАНСПОНИРОВАНИЯ СПЕКТРА СИГНАЛА»

УДК 621.317/615.471

ОСЛАБЛЕНИЕ АКУСТИЧЕСКОЙ ОБРАТНОЙ СВЯЗИ МЕТОДОМ ТРАНСПОНИРОВАНИЯ СПЕКТРА СИГНАЛА

А.Л. Галиев

Рассмотрен способ ослабления паразитной акустической обратной связи методом транспонирования спектра речевого сигнала. Способ позволяет полностью устранить самовозбуждение акустической системы на частотах выше 1500 Гц.

Ослабление действия акустической паразитной обратной связи (АПОС) в локальных электроакустических системах, в частности, в слуховых аппаратах является актуальной задачей [1]. Исследования и практика эксплуатации слуховых аппаратов показали, что в локальных электроакустических системах самовозбуждение возникает на частотах 1,5...2,5 кГц. Введение в тракт усиления заградительных фильтров с целью устранения самовозбуждения приводит, при соответствующем увеличении выигрыша в усилении речевого сигнала, к смещению частоты сигнала паразитной генерации в область более низких частот. Если "вырезать" из спектра речевого сигнала полосу частот 1000...2500 Гц, выигрыш по мощности достигает ~15 дБ. Однако ощутимо ухудшается разборчивость речевого сигнала.

Практически, вся звуковая информация сосредоточена в основном тоне звука, частота которого находится в пределах 100...600 Гц. Речевой тракт в первом приближении представляет собой совокупность резонаторов, резонансные частоты и декременты затухания которых изменяются в процессе речи. Гармоники основного тона образуют форманты, формирующие речевой сигнал. Распределение частот формант и их число определяются качеством и источником сигнала. Для формирования разборчивого речевого сигнала достаточно участие трех формант. Диапазон первой форманты ограничен частотами 200...850 Гц, второй форманты — 850...2300 Гц и третьей форманты — 2100...3000 Гц, центральная частота четвертой форманты около 3500 Гц [2].

Исследования методов сжатия частотного диапазона речевого сигнала показывают, что высшие гармоники спектра речевого сигнала определяют разборчивость, т. е. четкость звуков. При сжатии частотно-

го диапазона до 1200 Гц слоговая разборчивость падает до 30^40%. Путем добавления высших гармоник, полученных транспонированием спектра основного тона, можно достичь значений разборчивости 60...75%. Учитывая, что сужение спектра речевого сигнала в тракте усиления локальной электроакустической системы осуществляется с целью ослабления АПОС, можно частично или полностью сохранить третью форманту, тем самым дополнительно повысить разборчивость речевого сигнала.

В основу рассматриваемого способа ослабления акустической обратной связи положено транспонирование спектра первой форманты речевого сигнала в область второй форманты. Система ослабления АПОС (рис. 1, а) содержит управляемый компрессор УК, фильтры нижних и верхних частот ФНЧ и ФВЧ, детектор огибающей ДО, транспозитор спектра ТС, линейный сумматор ЛС и управляемый экспандер УЭ. На входе системы, после предварительного сжатия динамического диапазона сигнала с помощью блока УК. фильтрами нижних и верхних частот "вырезается" полоса спектра речевого сигнала 1 ...2,5 кГц (где наблюдается наибольшая неустойчивость электроакустической системы), а на выходе этот пробел "заполняется" высшими гармоническими составляющими основного тона, соответствующими гармоникам второй форманты, вырабатываемыми транспозитором спектра. Восстановление исходного спектра сигнала, т. е. сложение спектров трех формант, происходит в линейном сумматоре (рис. 1, б).

Для получения исходного качества речевого сигнала, после восстановления его спектра, очевидно, потребуется и восстановление исходной формы огибающей сигнала. С этой целью систему ослабления

АПОС введены детектор огибающей ДО и управляемый экспандер УЭ. Подобное решение задачи восстановления физической огибающей сигнала не противоречит методу преобразований Гильберта, согласно которому огибающая и мгновенная частоты сигнала жестко связаны друг с другом и не могут выбираться произвольно. Действительно, огибающая Us(t) произвольного сигнала связана с амплитудами синфазной и квадратурной составляющих, и зависит от вкладов как частотных параметров, так и амплитуд соответствующих гармоник:

Us(t) = ¡A^+B^f),

где As(t) и Bs(t) — амплитуды синфазной и квадратурной составляющих сигнала s(t).

Мгновенная частота ms(t) определяется как производная от полной фазы по времени, т. е.

N

^ 1/п$тпШ = J^arctg-i^J-.

^ Uпсо%nClt п = 1

Приведенная формула при соответствующих допущениях позволяет оценить смещение частот высших гармоник, вызванное некоторым расхождением спектра транспози-тора от спектра исходных формант.

Высшие гармоники спектра речевого сигнала формируются в транспозиторе с помощью устройства с нелинейной характеристикой, фазового модулятора или цифровых умножителей частоты. В качестве нелинейного устройства можно

о-

Вход

0

УК

до

ФНЧ

ФВЧ

®

О)

а)

тс

лс

лз

© Спектр исходного сигнала

_ Рнс © Р ' вс

<&РНС РфН

© р ее

„ &нтс Рвтс Восстановленный спектр / сигнала на выходе линейного сумматора ^ / I I \ _

б)

Рее Р

УЭ

Выход

Рис. 1. Структурная схема (а) системы ослабления акустической паразитной обратной связи и характерные формы спектра сигнала на выходах соответствующих

узлов (б)

взять устройство с квадратичной характеристикой

м„,у(/) = Ьи1(Г), (1)

где ин у(7) и ис(1) — напряжения на выходе и входе нелинейного устройства; Ь — постоянный коэффициент.

На входе нелинейного устройства речевой сигнал можно представить суммой гармоник основного тона (без учета постоянной составляющей):

N

ис = ^ апсо%пС11, (2)

я= 1

где ап — амплитуда я-ой гармоники); С) — частота основного тона речевого сигнала; я — порядковый номер гармоники.

После подстановки выражения (2) в формулу (1) и несложных преобразований можно убедиться, что напряжение на выходе нелинейного устройства содержит высшие гармоники входного речевого сигнала. Ограничив спектр выходного напряжения полосовым фильтром в пределах 1000...2500 Гц и сложив его с входным, сжатым по спектру, речевым сигналом, можно получить речевой сигнал шириной спектра 200...3500 Гц. Однако спектр такого сигнала в области верхних частот имеет неравномерное энергетическое распределение, "выровнять" которое простыми аппаратными средствами не всегда удается. Поэтому для обогащения спектра основного тона речевого сигнала целесообразно применять более сложные устройства, например, цифровые умножители частоты, фазовые модуляторы и др.

Для реализации рассматриваемого способа был применен транс-позитор спектра, в основе работы которого лежит принцип изменения спектральной плотности сигнала при изменении масштаба измерения времени.

Из теоремы об изменении масштаба следует, что при изменении масштаба времени в а раз масштаб частот для спектра меняется в \/а раз без изменения его характера, т.е.

^со

где 1\= Ш — независимая переменная, играющая роль времени 5а((о) — спектр сигнала в новом масштабе времени 1]. Масштаб а изменения времени определяет номер гармоники на выходе преобразователя — транспозитора спектра.

Транспозитор спектра (рис. 2), реализующий подобную операцию, содержит дельта-модулятор ДМ [3], тактовый генератор Тг; делитель частоты на три ДЗ; счетчик числа битов, записанных в регистр сдвига Сч\ электронные ключи К1...К6; регистры сдвига РГ1 и РГ2\ полосовой фильтр ПФ.

Устройство работает следующим образом. В блоке ДМ аналоговый сигнал, соответствующий первой форманте речевого сигнала, преобразуется в дельта-модулиро-ванный (ДМ) код. Допустимая частота, пригодная для цифровой об-

работки сигналов с равномерным шагом дискретизации определена из условия идеальной аппроксимации входного сигнала сигналом дельта-модулятора [4]:

/дм =

где и ит — верхняя рабочая частота и амплитуда (максимальная) модулируемого сигнала; А ¿/дм — шаг квантования. Дельта-модулятор управляется импульсами, поступающими с выхода делителя частоты с частотой /¡щ = 16 кГц. Эти имульсы используются также для управления процессом записи ДМ кода в регистры сдвига РГ1 и РГ2.

Частота импульсов /уг тактового генератора выбрана из условия оптимального преобразования верхних частот в речевого сигнала

Датчики и Системы • № 9.2001

25

Рис. 2. Структурная схема цифрового транспозитора спектра

(составляющих второй и третьей формант)

кг = 2я/7с, вит/А1/т = 48 кГц.

Импульсы тактового генератора используются для формирования сигналов чтения (сдвига) с регистров РГ1 и РГ2. Таким образом, скорость считывания ДМ сигналов с регистров в три раза больше скорости записи информации в них. Очевидно, эти импульсы могут служить для тактирования ДМ преобразователей в других узлах электроакустической системы.

Для счета числа битов, записываемых в регистры, и управления процессами записи и чтения служит счетчик Си. Модуль М счета выбирается из условия эффективной генерации третьей гармоники основного тона. Для эффективной генерации высших гармоник сигнала необходимо, чтобы время записи битов в регистр (длительность одного цикла) было больше (или равно) периода Тс н сигнала наименьшей частоты, т. е. Тзп > Тсн. Из этого условия определяется модуль счета счетчика М > Тзп /¡щ = 256. Число разрядов регистров соответствует модулю счета: Мр = М = 256. Процессами записи и чтения счетчик управляет посредством электронных ключей К!...Кб. Ключ К1 поочередно подключает выход дельта-модулятора к регистрам сдвига для записи ДМ сигналов. Когда происходит запись, например, в регистр РП. из регистра Расчитывается информация. Так как скорость считывания в три раза больше скорости записи, то за один цикл записи производится три цикла чтения,

следовательно, частота сигнала на выходе регистра утраивается. После цикла записи регистры меняются ролями: информация записывается во второй регистр, а считывается с первого.

Очевидно, что в результате несоответствия начальных и конечных значений фаз преобразуемого сигнала на отрезке масштабного времени, в спектре сигнала транс-позистора помимо третьей гармоники будут иметь место также гармоники, обусловленные частотой переключения цикла считывания, т. е. З/*^ + Ширину главного

максимума относительной спектральной плотности можно оцен

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком