Впечатлены реалистичной имитацией голоса, которую вы видели в видео или каверах? Виновником может быть модель искусственного интеллекта (ИИ), называемая преобразованием голоса на основе поиска (RVC). Эта модель учится и приспосабливается к нюансам голоса, создавая удивительно реалистичные имитации. Давайте рассмотрим, как начать работу с этой технологией ниже, приготовьтесь войти в увлекательный мир ИИ, который имитирует и учится говорить.

Читать далее:

Что такое модель РВК

Модель преобразования голоса на основе поиска (RVC) представляет собой искусственный интеллект (ИИ), который выделяется своей способностью имитировать человеческие голоса. Используя модель ИИ под названием Transformer и обученную на большом наборе голосовых данных, RVC учится отображать и адаптироваться к нюансам разных голосов, фиксируя уникальные характеристики, такие как тон, акцент и ритм речи. Несмотря на их убедительную имитацию, важно помнить, что голоса, генерируемые RVC, по-прежнему являются компьютерными симуляциями. Короче говоря, RVC сочетает машинное обучение и обработку естественного языка для создания инструмента искусственного интеллекта, который меняет способ нашего взаимодействия с технологиями.

Как использовать

  1. Скачайте необходимые программы

    Перед загрузкой РВК-бета у вас должны быть установлены следующие программы:
    — Питон.
    — Программа для распаковки файла «7z» (в данном случае мы будем использовать WinRAR).

  2. Скачать бета-версию РВК

    Загрузите файл «RVC-beta» со страницы Hugging Face профиля «lj1995/VoiceConversionWebUI».

  3. Ищите модель RVC

    В Интернете доступно несколько вариантов для бесплатного использования, требующих, чтобы файл был в формате «pth». Крайне важно проверить, соблюдаете ли вы условия использования и авторские права, и убедитесь, что вы согласны с условиями использования голоса, который вы будете использовать.

  4. Приготовьте «Акапеллу».

    Чтобы ИИ имитировал поемую песню, у него должен быть эталонный файл. Вы можете записать себя или использовать чужой голос, если у вас есть авторские права и согласие на использование. Опять же, убедитесь, что все соответствует правилам использования.

  5. Разархивируйте бета-версию RVC

    Используйте программу, установленную выше, чтобы разархивировать все файлы.

  6. Откройте файл «go-web».

    В разархивированной папке вы найдете файл с названием «go-web», он в одно мгновение соберет для вас программу и откроет ее в браузере.

  7. Переместите модель RVC в папку «веса».

    Поместите модель RVC (файл pth), полученную на шаге 3, в папку «веса».

  8. Обновите и проверьте, есть ли модель в списке

    Нажмите «Обновить список голосов и исправление индекса» и найдите модель RVC.

  9. Скопируйте каталог акапеллы

    Щелкните правой кнопкой мыши файл acapela и выберите параметр «Копировать как путь».

  10. вставьте каталог

    Вставьте в поле «Введите путь аудиофайла для обработки» путь к файлу.

  11. Настройте «Ключ» голоса

    Если тональность голоса модели и певческого голоса не гармонируют, вы можете использовать эту настройку. Например, если голос акапела ниже, а модель выше, могут возникнуть конфликты или нежелательные результаты. В этом случае в разделе «Транспонирование» можно ввести положительное значение, чтобы сделать голос более острым, рекомендуется использовать значение «12», или отрицательное значение, наоборот, «-12».

  12. установить предпочтение

    Есть несколько методов преобразования, а именно «pm»: более быстрое извлечение, но более низкое качество речи; «урожай»: лучше басы, но крайне медленно; «crepe»: лучшее качество, но ресурсоемкий GPU. В нем есть другие настройки, но ничего менять не надо.

  13. конвертируй и проверяй

    Если появился этот экран, значит, все прошло успешно! Чтобы скачать файл, просто нажмите на три точки и выберите «Скачать».

Важность ответственного использования

Вот и все, теперь вы знаете, как использовать модель преобразования голоса на основе поиска (RVC), мощный инструмент на переднем крае искусственного интеллекта. Важно подчеркнуть важность ответственного использования этой технологии. Не забывайте всегда получать надлежащее разрешение на использование чужого голоса и помните об условиях использования и авторских правах. Возможность создавать голосовые дипфейки влечет за собой этическую обязанность по предотвращению дезинформации, обмана и нарушений конфиденциальности. Имея в руках этот новый навык и ответственное использование технологий, вы готовы исследовать бесчисленные возможности, которые предлагает ИИ.

Вы смотрели новые видео на YouTube цифрового взгляда? Подписывайтесь на канал!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *