Как транскрибировать аудио в текст с помощью искусственного интеллекта

Преобразование аудио в текст — задача, требующая много внимания и времени. К счастью, эту деятельность постепенно берут на себя машины: вначале автоматические программы, такие как закрытые субтитры YouTube, уже сделали возможной ограниченную транскрипцию. В наши дни продвинутый искусственный интеллект способен более эффективно и точно выполнять эту задачу.

Как транскрибировать аудио в текст прямо из браузера (бесплатно) с помощью ИИ

В этом уроке мы научим вас пользоваться Шепот ИИискусственный интеллект, созданный открытый ИИ, та же группа, которая разработала популярную Теги GPT в чате. Все отправленные на него видео- или аудиофайлы будут автоматически преобразованы в текст в один клик, абсолютно бесплатно и без программ. Отличные новости для тех, кому нужно ежедневно преобразовывать аудио в текст.

WhisperAI является чрезвычайно мощным и может даже транскрибировать низкокачественный звук, такой как аудитория, классы дистанционного обучения, записанные презентации аудитории и т. д.

📝 Что вам понадобится?

  • Учетная запись Gmail для доступа к Google Диску;
  • 15 минут вашего времени.

Необходимое время: 15 минут

Внимательно выполните все шаги, и давайте научимся расшифровывать аудио с помощью ИИ.

  1. Получите доступ к Google Диску. Если у вас нет учетной записи Gmail, просто создайте ее бесплатно.

    В Google Диске нажмите «Ново” в левом верхнем углу экрана;

  2. Внизу нажмите на «Более», а затем на «подключить больше приложений« ;

  3. Во вкладке поиска введите «Совместная работа Google». нажмите в « Установить » и приложение будет установлено на вашем Google Диске;

  4. Теперь переходим к кнопке « Ново » еще раз, теперь нажмите на « Более« , и нажмите на « Сотрудничество Google »приложение, которое мы только что установили;

  5. Итак, мы добрались до приложения Google Colab. Прежде всего, мы должны сделать небольшую настройку, чтобы убедиться, что все работает. нажмите в Темп исполненияа затем на Изменить тип среды выполнения;

  6. в аппаратный ускорительпроверьте вариант графический процессор. Теперь нажмите на Держать;

  7. Теперь давайте установим Whisper AI в Google Colab. Нажмите на текстовую строку, чтобы ввести текст для следующего шага. Если вы не видите эту текстовую строку, нажмите + Код;

  8. Скопируйте и вставьте следующий код, а затем нажмите кнопку, чтобы установить Whisper AI:

    !pip установить git+https://github.com/openai/whisper.git

    !sudo apt update && sudo apt установить ffmpeg

  9. Установка занимает около 30 секунд. Теперь с левой стороны нажмите на значок папки, чтобы открыть файлы;

  10. Здесь мы можем щелкнуть и перетащить все аудиофайлы, которые мы хотим транскрибировать. В этом случае я буду использовать звук из нашего анализа мобильного телефона Samsung в качестве примера. Перетащите аудиофайл(ы);

  11. Теперь просто нажмите на +Код и введите следующий код в текстовую строку, чтобы начать процесс транскрипции:

    !whisper « имя файла здесь.mp3 » –модель носителя

    Нажмите кнопку запуска, подождите несколько минут и вуаля! Ваш файл успешно расшифрован.

    (В «имя файла здесь» не забудьте указать формат имени, например .mp3, .FLAC, .WAV и т. д.).

  12. На правой стороне у нас есть время и стенограмма. С левой стороны, рядом с аудиофайлом, который мы перетащили ранее, у нас есть файлы « .srt« е ».vtt« , который можно использовать для субтитров к видео с помощью совместимого проигрывателя, такого как ВЛК Медиа. Теперь файл « .текст » — это полная стенограмма, которую можно открыть в Блокноте Windows.

Остались вопросы? Какие-то шаги перепутались? Оставьте комментарий ниже, и мы ответим как можно скорее.

Как исправить ошибку «Нет такого файла или каталога» в Whisper AI

Если вы столкнулись с этой ошибкой на шаге 11, то это означает, что аудиофайл поврежден ИЛИ вы ввели неправильное имя. Помня, что помимо имени файла необходимо добавить его формат, например .mp3, WAV, FLAC…

Чтобы узнать формат файла, сделайте следующее:

1.Щелкните правой кнопкой мыши файл, а затем нажмите характеристики;

Рабочий стол в Windows 11

2. В случае с файлом, который мы используем для тестирования здесь, в руководстве, это .mp3, то есть мы должны поставить «.mp3» в конце имени файла, это выглядит так:

!шепот « Обзор Samsung Galaxy A34_ ЛУЧШИЙ хит 2023 года от Samsung.mp3 » –модель среднего

Свойства аудиофайла.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *