Оглавление:
2025 Автор: John Day | [email protected]. Последнее изменение: 2025-01-13 06:58
Для курса TfCD мастера IPD в Делфтском техническом университете.
Это инструкция по созданию системы распознавания голоса. Мы объясняем основы и как настроить этот проект с помощью Arduino и BitVoicer. Мы уверены, что после изучения основ вы сможете использовать эту систему по своему вкусу.
Шаг 1. Подготовка вывода: ваш Arduino и Box
Вам понадобится ваш Arduino, несколько проводов и светодиоды (три подойдут). Мы подключили светодиоды к контактам 3, 5 и 6 (все контакты ШИМ, хотя мы их не используем). Помните, что в этом уроке мы фокусируемся на методе ввода: распознавании голоса. Поэтому мы не сосредоточились на результатах этой системы и сделали ее довольно простой.
Чтобы продемонстрировать использование этой технологии, мы сделали коробку, в которую поместили подшипники для коленных имплантатов, напечатанные на 3D-принтере. Идея в том, что у вас много разных предметов и вам нужно найти подходящий. Мы решили продемонстрировать это с помощью небольшого, среднего и большого объекта, символизирующего опору для коленного имплантата. Чтобы было понятнее, мы решили использовать зеленый светодиод для маленького размера, желтый светодиод для среднего размера и красный для большого.
Шаг 2: Настройка BitVoicer
Первое, что вам нужно сделать, это активировать продукт в разделе «Справка»> «Активировать». Это позволяет отправлять данные из Bitvoicer на ваш микроконтроллер (Arduino).
Затем вы хотите настроить Bitvoicer так, чтобы он фактически использовал Arduino для настройки своего вывода. Перейдите в файл> настройки. Здесь вы видите несколько вариантов:
Не обращайте внимания на первый абзац. Это очевидные варианты, позволяющие открывать и запускать систему распознавания голоса сразу после запуска компьютера. Позже вы можете подумать об этом, используя Raspberry Pi, и создать автономную систему.
Далее вы увидите следующий вариант:
Язык распознавания речи: определение того, какой язык должен распознавать BitVoicer, Приемлемый уровень уверенности: помните, что распознавание голоса «предсказывает» сказанное. Возможно, он никогда не достигнет 100%, но 40% может быть уже достаточно для эффективной работы. Это зависит от акцента пользователя, громкости речи или микрофона. Мы вернемся к этому позже.
Минимальный уровень звука: минимальный уровень звука, который компьютер должен слушать.
Период активации уровня звука (мс): продолжительность прослушивания после достижения минимального уровня звука.
Период задержки: задержка между голосовой командой и выводом.
В следующем абзаце снимите галочку с пункта «Отключить связь». Это позволяет Bitvoicer связываться с Arduino. Следующие настройки: имя порта, биты в секунду, четность, стоповые биты, управление потоком. Задайте для имени порта правильный последовательный порт (он называется COMX, где X является числом, его можно найти в разделе справка> порт в Arduino). Убедитесь, что ваши биты в секунду равны 9600. Остальные параметры можно оставить по умолчанию.
В следующем абзаце мы будем использовать микрофон компьютера.
Теперь вы готовы к игре с Bitvoicer.
Шаг 3: Использование Bitvoicer
В этом видео мы объясняем, как использовать Bitvoicer.
Шаг 4: Код Arduino
Мы использовали другой исходный код и упростили его, чтобы использовать его. Упрощенную версию с инструкциями можно найти в Приложенном коде Arduino. (Вы можете увидеть источник здесь
Вот и все! Теперь вы можете использовать голосовые команды в качестве ввода и решать, какой вывод вы хотите использовать в коде Arduino.
www.youtube.com/watch?v=u8QUKTFdQgU