Как использовать OpenAI Whisper на ПК с Windows

OpenAI Whisper превратит ваш голос в текст на устройствах с Windows 11/10. Поскольку эта программа разрабатывается OpenAI, должно быть ясно, что искусственный интеллект лежит в основе того, что он может делать. И если судить по ChatGPT, вы можете быть уверены, что технология искусственного интеллекта, на которой работает Whisper, является первоклассной.

Как использовать OpenAI Whisper на ПК с Windows

Кроме того, мы должны сказать, что Whisper идеально подходит для тех, кто хочет преобразовать голос в текст, но у него мало средств. Это потому, что приложение на основе ИИ можно загрузить и использовать бесплатно.

Каковы недостатки Whisper?

Установка, вероятно, является той частью, которая не понравится большинству пользователей. Это потому, что это не просто. Это требует более длительного процесса, чем считается нормальным, и это может быть проблемой для начинающих пользователей.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Кроме того, графические процессоры AMD не поддерживаются. Это связано с тем, что эти графические процессоры не поддерживают CUDA, инструмент, созданный NVIDIA и считающийся платформой для параллельных вычислений и моделью программирования.

Таким образом, CUDA поддерживает только графические процессоры NVIDIA, и ближайшей альтернативой ему с точки зрения AMD являются Radeon Compute Platform и OpenCL. Мы подозреваем, что OpenAI будет поддерживать такие платформы в будущем, так что пока нужно подождать.

Тем не менее, мы должны отметить, что CUDA является более зрелой по сравнению с другими, поэтому это может быть основной причиной, по которой OpenAI решила на данный момент отказаться от OpenCL и Radeon Compute Platform.

Как загрузить и установить OpenAIs Whisper в Windows 11/10

Установка и использование Whisper на компьютере требует использования PowerShell и установки ключевых инструментов, таких как Python и т. д. Необходимые шаги:

  1. Загрузите и установите Python
  2. Загрузите и установите PIP.
  3. Скачайте и установите Шоколадный
  4. Скачайте и установите FFMPEG
  5. Скачайте и установите Whisper
  6. Преобразование аудио в текст с помощью Whisper

1) Загрузите и установите Python

Загрузка веб-сайта Python

Если вы еще этого не сделали, посетите официальный сайт Pythonзатем загрузите и установите приложение.

Имейте в виду, что Python не имеет пользовательского интерфейса, поэтому все делается через командную строку.

2) Загрузите и установите PIP

Дело в том, что если вы используете Python 2.7.9 или выше, то PIP устанавливается по умолчанию. Это связано с тем, что PIP встроен в установщик Python, поэтому мы предлагаем загрузить последнюю версию, поскольку более старые версии не будут поддерживаться навсегда.

3) Скачайте и установите Шоколадный

Установить Шоколадный

Наконец, вы должны найти время, чтобы загрузить пакет Chocolatey на свой компьютер.

Для этого откройте PowerShell на своем компьютере от имени администратора.

Мы должны убедиться, что Get-ExecutionPolicy не ограничен, поэтому выполните следующую команду и нажмите клавишу Enter.

Get-ExecutionPolicy

Если вы видите Restricted, запустите:

Set-ExecutionPolicy AllSigned

Или

Процесс Set-ExecutionPolicy Bypass -Scope

Если все пойдет по плану, вы увидите следующее сообщение:

Обязательно нажмите клавишу Enter сразу после вставки, чтобы запустить команду. Политика выполнения помогает защитить вас от сценариев, которым вы не доверяете. Изменение политики выполнения может подвергнуть вас риску безопасности, описанному в разделе справки о политиках выполнения по адресу https:/go.microsoft.com/fwlink/?LinkID=135170.

Введите Y для подтверждения, затем нажмите клавишу Enter, чтобы сделать изменения официальными.

Теперь вы должны вставить следующую команду в PowerShell и, как обычно, нажать клавишу Enter:

Set-ExecutionPolicy Bypass-Scope Process-Force; (System.Net.ServicePointManager)::SecurityProtocol = (System.Net.ServicePointManager)::SecurityProtocol -bor 3072; iex ((Новый объект System.Net.WebClient).DownloadString(‘https://community.chocolatey.org/install.ps1’))

Терпеливо подождите, пока Chocolatey будет установлен на ваш компьютер.

4) Скачайте и установите FFMPEG

Установите FFMPEG Python PIP3

Следующим шагом будет загрузка и установка FFMPEG. Это можно сделать, только если установлен Chocolatey. Кроме того, установка должна выполняться с помощью инструмента PowerShell.

Скопируйте и вставьте следующую команду в PowerShell и нажмите Enter:

шоколад установить ffmpeg

Вы также должны установить версию FFMPEG для Python с помощью этой команды:

pip3 install python-ffmpeg5) Загрузите и установите Whisper

Установить шепот

Наконец, используйте следующую команду, чтобы установить Whisper на свой компьютер:

pip3 установить git+https://github.com/openai/whisper.git

Теперь все должно двигаться в правильном направлении, так что поздравьте себя.

6) Преобразование аудио в текст с помощью Whisper

Скрипт Python конвертирует Woff в TTF

Когда все установлено и готово к работе, пришло время расшифровать. Поскольку графического интерфейса нет, командная строка — ваш единственный друг.

Теперь, прежде чем мы начнем, вы должны записать аудиофайл или подготовить уже сохраненный на вашем компьютере.

Итак, скажем, у нас есть аудиофайл с именем TWCAudio.mp3, хранящийся в папке с именем TWCThings.

Первое, что нужно сделать здесь, это изменить каталог с помощью этой команды:

компакт-диск C:\TWCThings

Запустите инструмент Whisper для файла с помощью этой команды:

шепот –model base –language gr –task translate TWCAudio.mp3

Вернитесь в папку и найдите текстовый файл. В этом файле находится переведенное аудио в текстовой форме.

ЧИТАЙТЕ: что такое OpenAI Playground и как ее использовать?

Можно ли запустить Whisper локально?

Да, Whisper можно запускать локально на вашем персональном компьютере или с облачной платформы, которая поддерживает запуск этого приложения для распознавания речи с открытым исходным кодом.

Можно ли использовать Whisper AI в автономном режиме?

Инструмент Whisper AI поддерживает автономное использование, но лучше всего он работает на мощном и быстром компьютере. Более слабый компьютер заставит пользователя долго ждать расшифровки файлов, и все зависит от длины аудиозаписи.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *