Шумомер - Получете по-задълбочено разбиране на потискането на шума
След като разберем основните разлики между потискането на шума (потискане на шума от околната среда на високоговорителя, за да могат отдалечените слушатели да чуват ясно) и активното намаляване на шума (компенсиране на собствения шум от околната среда на слушателя), нека се съсредоточим върху това как да постигнем потискане на шума.
Един от методите е да се използват множество микрофони за потискане на данни. Събирането на данни от множество местоположения ще доведе до устройства, получаващи подобни (но все пак различни) сигнали. Гласовият сигнал, получен от микрофона в близост до говорещото население, е значително по-силен от този на вторичния микрофон. Два микрофона ще получат негласов фонов звук с еднаква сила на сигнала. Извадете звуковата информация, събрана от микрофона със силен глас и вторичния микрофон, и останалата част е гласовата информация. Колкото по-голямо е разстоянието между микрофоните, толкова по-голяма е разликата в сигнала между по-близките и по-далечните микрофони, което улеснява използването на този прост алгоритъм за потискане на шума. Въпреки това, когато не говорите или когато очаквате гласовите данни да се променят с времето (като например когато ходите или бягате и телефонът ви продължава да се тресе), ефективността на този метод ще намалее. Подтискането на шума с много микрофони със сигурност е надеждно, но има недостатъци в допълнителния хардуер и обработка.
Ами ако имаше само един микрофон? Ако не се използват допълнителни източници на звук за проверка/сравнение, решението с един микрофон ще разчита на разбирането на получените шумови характеристики и филтрирането им. Това е свързано с по-горе споменатите дефиниции за стационарен и нестационарен шум. Шумът в стационарно състояние може да бъде ефективно филтриран чрез DSP алгоритми, докато нестационарният шум представлява предизвикателство, дълбоките невронни мрежи (DNN) могат да помогнат за решаването на проблема.
Този метод изисква набор от данни за обучение на мрежата. Този набор от данни се състои от различен (стационарен и нестационарен) шум и ясна реч, създавайки синтезиран шумов модел на реч. Подайте набора от данни като вход към DNN и го изведете с ясен глас. Това ще създаде модел на невронна мрежа, който ще елиминира шума и ще извежда само ясна реч.
Дори и с обучени DNN, все още има някои предизвикателства и индикатори, които трябва да се вземат предвид. Ако искате да работите в реално време с ниска латентност, имате нужда от силна процесорна мощност или по-малък DNN. Колкото повече параметри има в DNN, толкова по-бавна е скоростта му на работа. Скоростта на аудио дискретизация има подобен ефект върху потискането на звука. По-високата честота на семплиране означава, че DNN трябва да обработва повече параметри, но на свой ред ще постигне по-високо качество на изхода. Теснолентовата гласова комуникация е идеален избор за потискане на шума в реално време.
Този тип обработка представлява интензивни задачи и облачните изчисления са много квалифицирани при изпълнението на такива задачи, но този метод значително увеличава латентността. Като се има предвид, че хората могат надеждно да разграничат закъснения от приблизително 108 милисекунди или повече, допълнителното забавяне, причинено от обработката на облачни изчисления, очевидно не е идеален резултат. Изпълнението на DNN на ръба обаче изисква някои умни настройки. CEVA винаги се ангажира да подобрява нашите възможности за обработка на глас и говор. Това включва валидирани алгоритми за яснота на речта и разпознаване на команди - тези алгоритми осигуряват ясна комуникация и гласов контрол дори в краищата. Добре дошли да се свържете с нас и да изслушате лично.
