bigpo.ru
добавить свой файл
1 2 ... 6 7

Обработка сигналов в системах телекоммуникаций




Суммируя сказанное, можно заключить, что предложенный способ полосовой фильтрации логарифмического спектра целесообразно использовать в составе средств предварительной обработки речевого сигнала, обеспечивающих формирование робастного описания сигнала в частотной области. Можно полагать, что подобная фильтрация спектра реализуется в слуховом анализаторе вследствие процесса латерального торможения [4,5].

Литература

  1. Колоколов А.С. Предварительная обработка сигнала для распознавания речи // Автоматика и телемеханика. 2002. № 3. С.190-198.

  2. Колоколов А.С. Обработка спектра речевого сигнала // DSPA-2006. 2006. с.164-166.

  3. Traunmüller H. Analytical expressions for the tonotopic sensory scale. // J. Acoust. Soc. Amer. 1990. V.88. No.1. P.97-100.

  4. Чистович Л.А., Венцов А.В., Гранстрем М.П. и др. Физиология речи. Восприятие речи человеком. / В серии «Руководство по физиологии».- Л., Наука, 1976.

  5. Любинский И.А., Позин Н.В., Яхно В.П. Анализ моделей однородного нейронного слоя с латеральными связями // Автоматика и Телемеханика. 1967. №10. С.168-181.


A METHOD OF SPEECH SIGNAL SPECTRUM PROCESSING

Kolokolov A.

Institute of Control Sciences of Russian Academy of Sciences.


A method of speech signal front-end processing is proposed. It is based on short-time logarithmic amplitude spectrum envelope bandpass filtering with odd puls-response filter characteristic as function of frequency. As a result of the processing there is selection of spectrum envelope nonuniformities those are the rapid spectrum slopes. To all appearance such a spectrum processing take a place in the auditory analyzer due to lateral inhibition process.

Asset of the proposed processing consists in that its result is low sensitivity to speech signal frequency distortions and additive noises, when the frequency characteristic of the distorting filter and spectral density of additive noise rather slowly change with frequency. So it allows to form more stable description of speech signal in the frequency domain in comparison with usual spectral representation.

The method was tested on the real speech examples, when short time spectrum was estimated on the base of filer bank. The filter bank characteristics were selected in such a way as to reproduce in general way frequency analysis of sounds in the hearing system.

The results of testing allowed to conclude that the proposed method of logarithmic spectrum bandpass filtering should be used to form a robust description of the speech signal in the frequency domain.




Об одном методе очистки речи от шумов на основе применения фильтрующей субполосной матрицы


Жиляков Е.Г., Курлов А.В., Эсауленко А.В., Котович Н.В.


Белгородский государственный университет, г. Белгород, Россия


Речевые сообщения являются одной из наиболее часто используемых естественных для человека форм информационного обмена. В области цифровой обработки речевых сигналов особое внимание уделяется задачам, связанным с шумоочисткой и повышением разборчивости речевых сообщений, полученных в неблагоприятной помеховой обстановке. Примером могут быть диктофонные записи в условиях определенных помех или же записи речевого сигнала, полученные по каналам связи низкого качества.

В связи с этим, создание методов и алгоритмов обработки речевых данных, позволяющих улучшить разборчивость и очистить от шумов речевые сообщения является актуальной задачей.

В основе метода очистки речи от шумов используется тот факт, что энергия звуков речи сосредоточенна в малом количестве частотных интервалах. Поэтому необходимо определять информационные частотные интервалы, где сосредоточенна подавляющая доля энергий, для этого в работе, используется представление[1]: , (1)

где субполосная матрица с элементами вида: (2)

,;.

 - вектор значений анализируемых отчетов отрезка обрабатываемого входного речевого сигнала, которые соответствуют значениям аргумента iDt, т.е. ; - значение длительности обрабатываемого отрезка речевого сигнала; , -границы частотного интервала. Ось частот от 0 до π разбивается на R частотных интервалов одинаковой ширины, равной , в каждом интервале определяются доли энергии.

Для ускорения вычислений долей энергии для обрабатываемого отрезка речевого сигнала в заданных частотных интервалах используется выражение , , (3)

где  - собственные числа субполосной матрицы ,  - скалярные произведения анализируемого вектора и соответствующего ортогонального собственного вектора , .

Количество элементов в выражении (3) определяется из условия , (4)

где, N - длительность анализируемого отрезка речевого сигнала.

Оценить характеристику сосредоточенности энергии звуков русской речи в малом количестве достаточно узких частотных интервалах позволяет выражение вида[1] , (5)

где  - минимальное количество частотных интервалов (частотная концентрация), в которых сосредоточена заданная доля энергии звукового отрезка. . (6)

Здесь для правых частей выполняется неравенство , (7)

где - задаваемая доля общей энергии, которая должна быть сосредоточена в указанном минимальном количестве частотных интервалов.

Верхний индекс t обозначает один из звуков русской речи, индекс в скобках у слагаемых суммы слева соотношения (7) означает, что доли энергий упорядочиваются по убыванию:

, (8)

Частотная концентрация энергий звуков речи гораздо выше, чем у шумов. В частности для всех звуков речи выполняется неравенство , (9)

тогда как в случае отрезков, порождённых только шумами, имеет место . (10)

Данное свойство концентрации заданного количества энергии сигналов, порождаемых звуками русской речи, в малой доле частотной полосы, использовано для построения процедуры определения информационных и не информационных частотных компонент.

Под информационными компонентами будем понимать компоненты, попадающие в частотные интервалы, сумма долей энергий которых составляет 0,92 от общей доли энергии содержащейся во всех частотных интервалах. Остальные компоненты, считаются неинформационными.

Вычисленные на основании выражения (3) доли энергии для каждого частотного интервала, ранжируются по убыванию (8), номера частотных интервалов запоминаются.

Те частотные интервалы, сумма долей энергий которых составляет значение m=0.92 от общей доли энергии содержащейся во всех частотных интервалах, принимаются за информационные, при этом учитываются номера частотных интервалов. Частотные интервалы, не входящие в эту сумму долей энергий, принимаются за неинформационные. В результате данной процедуры определяются номера частотных интервалов , отнесенных к информационным.

Процедура фильтрации осуществляется в соответствии с принципом минимизации погрешности приближения к случаю: , (11)

(12)

, (13)

где  - трансформанта Фурье исходного сигнала,  - трансформанта Фурье отфильтрованного сигнала.

Таким образом фильтрация информационных частотных интервалов определяется выражением:

, (14), где  - вектор значений выходного отфильтрованного речевого сигнала,  - вектор значений анализируемого речевого сигнала, - информационные частотные интервалы.

С целью проверки работоспособности предложенного алгоритма было проведено компьютерное моделирование.

Для анализа были взяты речевые сигналы, порождаемые звуками «а» и «ч», вырезанные из незашумленного фрагмента сигнала с частотой дискретизации 8000 Гц и разрядностью 16 бит. Звуки выбраны исходя из того, что у звука «а» подавляющая доля энергии сосредоточена в низкочастотной области а у звука «ч» в высокочастотной. Трансформанты Фурье исходных отрезков речевых сигналов, соответствующих звуку «а» и звуку «ч» показаны соответственно на рис. 1 а и 1 б.



а) б)

Рис. 1—Трансформанты Фурье исходных отрезков речевых сигналов: а) соответствующие звуку «а»; б) - звуку «ч»



а) б)

Рис. 2—Трансформанты Фурье отрезков речевых сигналов: а) соответствующие зашумленному звуку «а»; б) - зашумленному звуку «ч»



а) б)

Рис. 3—Трансформанты Фурье отрезков речевых сигналов: а) соответствующие обработанному звуку «а»; б) - обработанному звуку «ч»

Далее к фрагментам речевого сигнала был добавлен псевдослучайный белый шум с равномерным распределением. Отношение шум /сигнал по амплитуде составляет 0.6 раза. Трансформанты Фурье отрезков речевых сигналов соответствующие зашумленному звуку «а» и звуку «ч», показаны на рис. 2 а и 2 б соответственно.

Затем, к зашумленным фрагментам сигналов применялась процедура, определяемая соотношением (14).

Трансформанты Фурье отрезков речевых сигналов, соответствующие звуку «а» и звуку «ч» после обработки показаны на рисунке 3 а и 3 б соответственно.

Анализ результатов моделирования показывает, что после обработки зашумленного отрезка речевого сигнала с помощью предложенного метода удается в значительной степени снизить уровень малоэнергетических составляющих частотных компонент в высокочастотной (рисунок 3 а) и низкочастотной (рисунок 3 б) области спектра, соответствующих неинформационным компонентам сигнала. При этом частотные компоненты полезного сигнала, принимаемые как информационные, остаются без изменения.

Не зависимо от частотного диапазона, в котором сосредоточены информационные компоненты, достигается эффект шумоочистки, что позволяет говорить об адекватности использования предлагаемого метода в задаче очистки речевых сигналов от шумов.

Литература

  1. Жиляков Е.Г. Вариационные методы анализа и построения функций по эмпирическим данным: монография. Белгород: Изд-во БелГУ, 2007. – 160 с.


About one method clearing of speech from noise on the basis of application of a filtering substrip matrix


Zhilyakov E., Kurlov A., Esaulenko A. Kotovich N.


Belgorod State University, Belgorod, Russia


Voice messages are one of the most frequently used natural for human forms of information exchange. In the field of digital speech signal processing focuses on problems associated with noise reduction and an increase in intelligibility of voice messages received in an unfavorable noise conditions. An example might be a recording in a certain noise or recording of the speech signal received via the communication channels of low quality.

The method of treatment of speech from noise we use the fact that the energy of speech sounds is concentrated in a small number of frequency intervals. To determine the information on frequency, where the overwhelming proportion of the energy is concentrated in the work, using mathematical tools substrip matrices [1], which allows sufficiently accurate to calculate the proportion of energy in specified frequency ranges

Axis of frequencies from 0 to π divided by R frequency intervals of equal width. Calculated the proportion of energy for each frequency range (3), are ranked in descending order (8), number of frequency intervals are stored Frequency intervals, the amount of shares of the energies of which is the value of m=0.92 of the total share of energy contained in all frequency ranges, are accepted for the information , this takes into account number of frequency intervals. Frequency intervals which are not included in this amount of shares energies are taken as non-information. 

Filtration procedure is carried out in accordance with the principle of minimizing the error of approximation to the case: .

, where ,  - limits the frequency range, - Fourier transform of the original signal,  - Fourier transform of the filtered signal.

Filtering of information on frequency is given by , where  - vector of the filtered output of the speech signal,  - vector of the analyzed speech signal,  - filtering substrip matrix,  - information frequency intervals.

Analysis of simulation results shows that after treatment with a noisy segment of the speech signal using the proposed method can significantly reduce the level of low-energy components of the frequency components in the high-and low-frequency region of the spectrum, corresponding to non-information component of the signal. In this case, frequency components of the desired signal, taken as the information remain unchanged.

Regardless of the frequency range in which the focus information components, achieved the effect of noise reduction that allows us to speak about the adequacy of the proposed method in the problem of clean speech signals from noise.



Аппаратная реализация приемника гидроакустической телекоммуникационной системы


Бурдинский И.Н., Карабанов И.В., Линник М.А., Миронов А.С.


Тихоокеанский Государственный Университет

Институт проблем морских технологий ДВО РАН


В течение последних десятилетий наблюдается постоянный рост интереса к созданию систем гидроакустической телекоммуникации и навигации. Применение этих систем весьма обширно в области морских исследований, океанографии, в нефтедобывающей промышленности, в оборонном секторе и других [1]. К гидроакустическим системам выдвигаются такие требования как большая надежность, низкое энергопотребление и высокая производительность.

Целью данной работы является разработка методов и средств повышения качества гидроакустического телекоммуникационного и навигационного обеспечения подводных автономных систем.

Для передачи информации в работе используются шумоподобные сигналы (ШПС) представленные фазоманипулированными М-последовательностями и последовательностями Голда [2]. Основным методом детектирования ШПС является корреляция. Для систем цифровой обработки сигналов операция корреляционной обработки в общем виде выражается как: где uk – последовательность входных отчетов; mi – сформированный массив отчетов маски; N – размер обрабатываемого окна.

В [3] представлена схема модифицированного коррелятора, реализованного на базе параллельно-конвейерной схемы. Функциональная схема данного коррелятора для одного канала обработки представлена на рис. 1. Использование параллельно-конвейерной схемы позволяет посчитать в один момент времени сразу несколько значений корреляционной функции, что увеличивает скорость выполнения данной операции и точность детектирования длинных ШПС [3].



Рис. 1 – Схема коррелятора с конвейерной структурой

Недостатками данного метода для реализации в автономных подводных системах является: большой объем используемой памяти (в памяти храниться маска всего сигнала) и большое число многоразрядных умножителей и накоплением, которые возрастают пропорционально числу каналов обработки.

В работе предлагается улучшенный метод корреляционной обработки фазоманипулированных ШПС, названный как посимвольная корреляция. Данный метод состоит из четырех операций. Сначала происходит последовательное перемножение значений Mj и sj для одного символа сигнала: ,

где , mj – маска символа фазоманипулированного сигнала, sj – цифровое представление сигнала в канале, CS - количество отсчетов или периодов частоты дискретизации, приходящихся на длительность символа, k - номер символа фазоманипулированного сигнала, представленного двоичной последовательностью

Затем происходит определение бинарных символов по знаку полученной суммы Bk. Если Bk<0, то значение бинарного символа принимается, как uk=-1. А если Bk0, то uk=1.

Далее происходит следующая операция с бинарной маской псевдослучайной последовательности PN и определенной последовательностью u: , где NS – количество бинарных символов в ожидаемом сигнале, PNkk-ый символ псевдослучайной последовательности PN, i – номер отсчета (периода частоты дискретизации).

Далее по заданному порогу происходит определение наличия сигнала в канале. Если значение Ri больше заданного порога h (Ri>h), то имеет место быть наличие сигнала в канале. Порог h выбирается в зависимости от длины используемой последовательности.

На рис. 2 представлена структурная схема приемного устройства на основе посимвольной корреляции.



Рис. 2 – Посимвольный коррелятор

Полученное устройство в отличие от обычного коррелятора дополнительно содержит память бинарной маски (MC), блок определения символов и бинарный коррелятор. Причем маска сигнала (М) уменьшилась до маски одно символа, уменьшилась разрядность блока умножения с накоплением. Данный алгоритм имеет ряд преимуществ по сравнению с обычной корреляционной обработкой, а именно: требуется меньше аппаратных ресурсов (умножителей, памяти и логических блоков) для своей организации, причем число занимаемых ресурсов не увеличивается пропорционально числу каналов; в памяти храниться только маска одного символа; позволяет организовать асинхронный прием без использования дополнительных алгоритмов обработки [4]; позволяет вести оценку качества и процент потерь при приеме в реальном масштабе времени; дает возможность организации многоабонентской системы с разделением каналов без каких либо дополнительных блоков; позволяет фильтровать импульсные помехи.

В качестве базы для реализации приемника телекоммуникационной системы было решено использовать технологию FPGA. Это позволило провести полнофункциональную реализацию разработанных алгоритмов на современной элементной базе, характеристики которой удовлетворяют требованиям надежности и энергопотребления. Использование технологии FPGA позволит распараллелить несколько процессов внутри одного устройства, что было бы невозможно при использовании DSP процессоров, как альтернативной технологии для цифровой обработки сигналов.

В данной работе представлена аппаратная реализация приемника телекоммуникационной на базе отладочный стендов Xilinx ML402, которые имеют на своем борту матрицу FPGA Virtex-4 XC4VSX35, ЦАП и АЦП на базе кодека AC97, интерфейсы приема-передачи, такие как Ethernet, RS-232 и другие. Использование ПЛИС позволяет проектировать реконфигурируемую систему, которая может быть быстро наделена дополнительными функциями в зависимости от условий эксплуатации и требований потребителя. На рисунке 3а представлена структурная схема устройства. Приемо-передающий тракт в работе реализован на базе акустических преобразователей ПИ1-ЛУ3.814 [5], с резонансной частотой на 11,7 кГц и с полосой частот до 500 Гц.

Таблица 1 - Оценка скорости передачи телеметрической информации

Длина последовательности

N при lp<7%

N при lp<13%

N, при lp<20%

Nall

SNR1, дБ

SNR2, дБ

V, бод/с

31 символ

6

31

0

37

-11

-11

403

63 символа

6

63

0

69

-14

-15

238

127 символов

18

254

4

276

-17

-18

157

255 символов

16

254

12

282

-20

-20

78

511 символов

48

1022

12

1082

-22

-23

48

1023 символа

60

3063

36

3159

-24

-25

28

где lp – отношение максимального значения боковых лепестков к пику корреляционной функции. Nall – общее количество последовательностей данного типа, N - количество последовательностей данного типа по заданному критерию, SNR1 – отношение сигнал/шум при обработки обычной корреляцией, SNR2 – при обработки разработанным методом посимвольной обработки, V – возможная скорость передачи.

Натурные испытания разработанной системы проводились в августе в условиях мелкого моря (бухта Витязь, залив Посьет, мыс Шульца, Приморский край) на дальностях до 500 м и глубинах до 10 метров. Для испытаний использовались фазоманипулированные М-последовательности или последовательностей Голда состоящие из 31..1023 символов. Несущая частота сигнала fС=11700 Гц, частота дискретизации fD=48кГц, длительность символа tS=0,6 мс. В эксперименте последовательно передавались разные типы фазоманипулированных последовательностей без паузы и с паузой равной 40 мс.

В таблице 1 представлены расчетные скорости для передачи телеметрической информации при использовании сложных сигналов.

Отношение сигнал/шум в канале принимала значения от 10 дБ до –25 дБ. На рис. 3б представлен график вероятности приема ШПС (127-битные М последовательности) от отношения сигнал/шум. По графику видно, что 90% вероятность приема возможна при отношении сигнал/шум -15 дБ. Данный график наглядно отображает высокую помехоустойчивость шумоподобных сигналов и возможность работы системы даже при уровне сигнала много меньшем уровня шума.



Рис. 3 – Структурная схема устройства и график вероятности приема от отношения сигнал/шум.


Предложенные в данной работе методы и средства приема гидроакустического сигнала позволят повысить качества гидроакустического телекоммуникационного и навигационного обеспечения подводных автономных систем. В частности разработанные методы и средства дадут возможность увеличить помехоустойчивость и дальность действия автономных подводных систем. Разработанные в данной работе методы и средства найдут своё применение в автономных необитаемых подводных аппаратах, разрабатываемых в Институте проблем морских технологий ДВО РАН (г. Владивосток).

Литература

  1. Chitre, M. Shahabudeen, S., Stojanovic M. Underwater Acoustic Communications and Networking: Recent Advances and Future Challenges. Marine technology society journal, 2008, Vol 42; Numb 1, – P. 103–116.

  2. Варакин Л.Е. Системы связи с шумоподобными сигналами. – М.: Радио и связь, 1985. – 384 с.

  3. Бурдинский И.Н., Миронов А.С. Мяготин А.В. Измерительный комплекс для регистрации шумоподобных гидроакустических сигналов / Материалы IX Международной конференции Актуальные проблемы электронного приборостроения. Новосибирск: 2008.

  4. Linnik M.A., Karabanov I.V., Burdinskiy I.N. Threshold Methods of Sonar Pseudonoise Phase-shift Signal Detection / The First Russia and Pacific Conference on Computer Technology and Applications (6-9 September, 2010). – Владивосток, 2010. – С. 404-408.

  5. Linnik M.A., Karabanov I.V., Mironov A.S., Burdinskiy I.N. Acoustic communication system for underwater vehicle telecommunication / The First Russia and Pacific Conference on Computer Technology and Applications (6-9 September, 2010). – Владивосток, 2010. – С. 317-320.


Hardware Implementation OF Underwater acoustic telecommunications receiver

Burdinsky I., Karabanov I., Linnik M., Mironov A.

Pacific National University

Institute of Marine Technology Problems FEB RAS


The last decade has seen a growing interest in underwater acoustic telecommunication and navigation systems because of its applications in marine research, oceanography, marine commercial operations, the offshore oil industry, defense sector, Navy and diving equipment. The aim of this work is development and optimization of methods and tools for receiving and detecting acoustic signals, which improve the reliability of telecommunication system of underwater vehicle.

The paper presents the developed algorithm for processing phase-shifted noise-like signals, called symbol correlation. This algorithm has several advantages: organization multi subscriber system without any additional units; no need to keep the mask of the signal in the memory; asynchronous signal detection; evaluating the quality of detection and the percentage of losses during a reception in the real time; receiver implementation requires small amount of hardware resources (multipliers, memory and logic blocks), receiver has a simple structure.

FPGA technology has been chosen as the base for implementation and research of the developed algorithms of transceiver system. The use of reconfigurable FPGA allows designing a reconfigurable system that can quickly be given additional functions, depending on operating conditions and requirements. Implementation of system was carried out on the evaluation platform Xilinx ML402, which has on board Virtex-4 XC4VSX35 FPGA, DAC and ADC based on codec AC97, transmitter interfaces such as Ethernet, RS-232 and others.

Experiments of the developed system were conducted in August 2010 in a shallow sea (Bay Vityaz, Posiet Bay, Cape Schultz, Primorsky Krai, Russian Federation) at ranges up to 500 meters and a depth of 10 meters.

Signal to noise ratio in the channel during the experiment is from 10 dB to -25 dB. Experiments have shown that data transfer rate is about 350 bps and coefficient of frequency efficiency is 0,7 bps/Hz when signal to noise ratio is more -15 dB and probability of receiving is more 95%. These experiments displays the high noise immunity of noise-like signals. These signals allow to operate when the signal level much lower noise level.

Developed in this paper methods and tools for receiving and detecting acoustic signals can improve the reliability of telecommunication system of underwater vehicle. These methods will provide an opportunity to increase noise immunity, range of action and realize a multi subscriber system. Developed in this paper methods and tools find their application in autonomous unmanned underwater vehicles developed by the Institute of Marine Technology Problems, FEB RAS (Vladivostok), particularly in the underwater vehicle MMT-3000.




СРАВНЕНИЕ АЛГОРИТМОВ КЛАСТЕРИЗАЦИИ В ЗАДАЧЕ ИДЕНТИФИКАЦИИ ДИКТОРА


Любимов Н., Михеев Е., Лукин А.


Московский Государственный Университет им. М. В. Ломоносова



следующая страница >>