Какие именно ИИ-подобные алгоритмы используются в современных декликерах?
iZotope RX De-click (самый популярный современный декликер):
- Основной алгоритм - классический DSP (цифровая обработка сигнала): анализирует волновую форму на резкие пики амплитуды, затем интерполирует (сглаживает) проблемные участки, используя данные из соседних сэмплов.
- Есть разные режимы: single-band (быстрый для цифровых кликов), multi-band (для винила, с защитой транзиентов).
- Не использует machine learning напрямую в De-click. (в RX 11 -2024 года внедрены элементы машинного обучения для улучшения качества и скорости работы Repair Assistant. Однако сам модуль De-click по-прежнему основан на классической DSP-обработке, а ML применяется в других модулях (Dialogue Isolate; De‑reverb; Music Rebalance (разделение стемов); De‑rustle (разделение речи и шума/реверберации)).
- Для mouth clicks (щелчки рта) есть отдельный Mouth De-click - тоже DSP, но оптимизированный под вокал.
Acon Digital DeClick (из Restoration Suite):
- Тоже классический алгоритм: точное определение начала и длительности клика, затем замена на интерполированный сигнал.
- Улучшен в версии 2: получше работает с thumps (глухие удары) и plosives (взрывы в вокале). Extract: Dialogue от Acon Digital использует ML для разделения диалога от шума, а HANCE Audio Engine, разработанный совместно с Soundly, включает deep learning для сложных задач обработки звука.
Другие современные декликеры:
- Sonnox Oxford DeClicker, CEDAR - продвинутый DSP с многополосной обработкой и защитой полезного сигнала.
- Некоторые новые инструменты (типа Waves Clarity или Accentize) используют ML для общего шумоподавления, но для чистых кликов чаще DSP. В реальности Sonnox фокусируется на традиционных алгоритмах с акцентом на точность и контроль, но без явного использования нейросетевых технологий в DeClicker.
Настоящие "ИИ-подобные" (нейросетевые) алгоритмы в декликерах почти не используются. De-click - это в основном точный DSP с интерполяцией, улучшенный за годы (лучше детекция, меньше артефактов).
ML/нейросети активно применяют для сложных задач: разделение речи от шума, реверба, стемов - там нужно "понимать" контент. А клики простые (короткие импульсы), их легко ловить без ИИ. Новые инструменты с элементами ML: Waves Clarity - комбинирует традиционные методы с ML для общей очистки аудио; Accentize - применяет ML преимущественно для шумоподавления, а не для устранения чистых кликов.
Поэтому современные декликеры портят звук гораздо меньше старых: лучше детекция, точная интерполяция без сдвига фазы. Но если переусердствовать (высокая чувствительность) - всё равно может приглушить транзиенты или добавить лёгкие артефакты. Мягкие настройки + ручная доработка) порой улучшают.
__________________
О нас думают плохо лишь те, кто хуже нас. А те, кто лучше нас, им просто не до нас.
--Омар Хайям
Обновления по запросу — на Я.Ди. «Мэйл-облако» для тех, кто помогает нашему интернет-проекту, и для тех, кто хотел бы это делать, но пока не знает, как.
Помогая форуму ВТО, вы прежде всего помогаете себе! А не делаете что-то абстрактное для «других», совершенно незнакомых и безразличных вам людей.
|