Добавление звука запуска триггера в Google AIY Voice Kit: 6 шагов (с изображениями)

Шаг 1. Необходимые материалы и файлы
Шаг 2: Шаг 2: просмотрите файл Voicehat.py для получения дополнительной информации
Шаг 3: Шаг 3: Добавьте звуковой код триггера в демонстрационный код
Шаг 4. Шаг 4. Запустите код и убедитесь, что все в порядке
Шаг 5: Шаг 5: Создайте свой собственный файл.wav
Шаг 6: Шаг 6: Добавление звука подтверждения?

2025 Автор: John Day | [email protected]. Последнее изменение: 2025-01-23 15:05

Шаг 2. Просмотрите файл Voicehat.py для получения дополнительной информации

Этот учебник довольно прост. Мне очень нравится голосовой набор Google AIY, но мне очень нравится мой обычный Google Home, шум, который они издают, чтобы подтвердить, что они активно слушают. Это не установлено по умолчанию ни в одном из примеров, которые предварительно загружены в образ AIY Voice Kit.

Я также включаю ссылку на стандартные шумы Start и Confirm, которые я записал с моего настоящего Google Home с помощью своего рекордера Zoom.

Вот и началось мое первое обучение!

Шаг 1. Необходимые материалы и файлы

Полнофункциональный голосовой комплект Google AIY - чтобы настроить свой комплект, посетите официальную страницу AIY Voice Kit.
Возможность доступа к терминалу вашего Pi через SSH, VNC или с помощью монитора и клавиатуры.
. Wav файл, который вы хотите воспроизвести, когда Pi прослушивает голосовой ввод. Если пользовательский файл не используется, загрузите стандартный файл St art Talking здесь или загрузите его по прикрепленной ссылке.
(Необязательно) Аудио редактор, который может конвертировать файлы и изменять их бит и частоту дискретизации.

Шаг 2: Шаг 2: просмотрите файл Voicehat.py для получения дополнительной информации

ВАЖНЫЙ

Я не использую последнее изображение в своем голосовом комплекте, которое включает код для набора Voice и Vision (например, aiyprojects-2018-01-03.img). Я использую код из ветки Voice Kit, который можно найти на GitHub Google AIY Raspbian. Мое личное мнение - просто использовать ветку Voice Kit, чтобы она была простой и вам не приходилось иметь дело с кодом Vision, когда вы работаете со своим голосовым комплектом

Двигаемся дальше…

Этот шаг не является полностью обязательным, но он покажет вам, где Google похоронил инструкции для того, чтобы это работало, если вы хотите сделать еще один шаг или понять, почему код, который я добавляю, работает.

пи @ малина: cd AIY-voice-kit-python / src / aiy /

Затем мы собираемся проверить файл voicehat.py в этой папке:

пи @ малина: ~ / AIY-voice-kit-python / src / aiy / sudo nano voicehat.py

На прилагаемом рисунке показано, где можно узнать об интерфейсах состояния и о том, как использовать звук во время триггера.

Хорошо, теперь давайте добавим код в один из файлов примеров, чтобы эта штука заработала.

Шаг 3: Шаг 3: Добавьте звуковой код триггера в демонстрационный код

Сначала перейдите в папку AIY-voice-kit-python и запустите исходный код.

компакт-диск AIY-voice-kit-python

исходный env / bin / активировать

cd src

Затем используйте sudo nano в файле assistant_grpc_demo.py или assistant_library_demo.py

Разница между двумя файлами заключается в том, что assistant_grpc_demo.py использует кнопку для запуска Google Assistant, а assistant_library_demo.py использует слово активации «Окей, Google» для запуска Google Assistant.

Для обоих этих файлов вам нужно добавить только ОДНУ строку кода:

status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav')

Предполагается, что вы поместили свой стартовый звук в папку / home / pi / и назвали его googlestart.wav. Измените их в зависимости от того, как вы назвали свой файл и где бы вы его ни находили.

Строка кода, которую мы ищем, находится ниже:

status_ui.status ('прослушивание')

Мы хотим добавить нашу новую строку кода ПЕРЕД этой строкой кода …

Для примера "assistant_library_demo.py" его можно найти здесь:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# А теперь добавляем наш код status_ui.set_trigger_sound_wave ('home / pi / googlestart.wav') status_ui.status ('прослушивание')

Для примера "assistant_grpc_demo.py" его можно найти здесь:

button.wait_for_press ()

# А теперь добавляем наш код status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav') status_ui.status ('прослушивание')

Нажмите CTRL-X и Y, чтобы все сохранить.

*** ПРИМЕЧАНИЕ: я нашел что-то немного глупое. Для 'assistant_library_demo.py' добавление звука триггера, похоже, не влияет на функцию распознавания речи. Однако для «assistant_grpc_demo.py» кажется, что когда у вас реализован звук триггера, он обрезает первое или два слова, которые вы говорите. Не совсем уверен, почему. Все еще пытаюсь понять это.

Шаг 4. Шаг 4. Запустите код и убедитесь, что все в порядке

пи @ малина: cd AIY-voice-kit-python

и загрузите virtualenv

pi @ raspberry: ~ / AIY-voice-kit-python $ исходный код env / bin / activate

и запускай!

(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / assistant_library_demo.py

или

(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / assistant_grpc_demo.py

Теперь скажите «Окей, Google» или нажмите эту кнопку и посмотрите, работает ли это!

Следующая страница поможет вам, если у вас есть собственный пользовательский файл и соответствующие биты и частота дискретизации для вашего файла.wav.

Шаг 5: Шаг 5: Создайте свой собственный файл.wav

Если вас не интересует мой.wav-файл со стандартным стартовым звуком Google Home, вам нужно создать свой собственный.wav-файл. Чтобы получить правильный бит и частоту дискретизации, мне потребовалось немного проб и ошибок.

Я использовал Logic Pro X для всего своего редактирования (на фото), который представляет собой полноценную DAW для создания и производства музыки. Я нашел два подходящих варианта: Switch или MediaHuman Audio Converter. Я предполагаю, что вы могли бы сделать это с помощью Garageband, если у вас есть Mac, но я этого не пробовал.

Для работы с демонстрационным кодом необходимы три ключевые части вашего файла.

Должен быть аудиофайл в формате MONO
Частота дискретизации должна быть 32000
Должен быть файл.wav.
(Необязательно) 16-битное разрешение мне подошло лучше всего

Шаг 6: Шаг 6: Добавление звука подтверждения?

Вот где я застрял, если у кого-то есть мысли. Я хотел бы добавить шум подтверждения, если система распознает голосовой ввод, как на обычном Google Home.

Для вашего удобства я приложил ниже шум подтверждения.

Наслаждаться!

Добавление внешнего динамика для улучшения качества звука: 5 шагов

Добавьте внешний динамик, чтобы улучшить качество звука: качество звука от этих милых маленьких радиочасов было ужасным! Все остальное в радио отличное, простота использования, зарядка телефона, дисплей и т. Д. Лекарство - использовать внешний динамик и больше лучше

Pixel Kit для запуска MicroPython: первые шаги: 7 шагов

Pixel Kit Запуск MicroPython: первые шаги: путь к раскрытию всего потенциала Pixel Кано начинается с замены заводской прошивки на MicroPython, но это только начало. Чтобы кодировать Pixel Kit, мы должны подключить к нему наши компьютеры. Это руководство объяснит, что

Индикатор уровня звука / звука: 10 шагов

Индикатор уровня звука / звука: в этом проекте я покажу вам, как создать простой индикатор уровня звука с использованием операционных усилителей. Примечание. Чтобы задать вопросы, посетите мой сайт по адресу «Спросите эксперта». Полезные дополнительные видео: смоделированная схема, созданная на хлебной доске (Proto

Общие сведения о микросхеме восьмеричного D-триггера 74LS273: 5 шагов

Понимание 74LS273 Octal D Flip-Flop IC: Я получил в руки 74LS273 IC, когда собирал некоторые компоненты из старого спутникового ресивера, что-то, что я делаю в перерывах между проектами, чтобы сэкономить деньги … Эта IC была на панели управления и была подключена к 4-значный 7-сегментный светодиодный дисплей с

Вспышка ведомого триггера: 4 шага (с изображениями)

Вспышка ведомого триггера: в этой инструкции я объясню, как сделать настоящую (оптическую) ведомую вспышку триггера с минимумом компонентов. В Интернете можно найти множество сложных конструкций, эта конструкция очень проста и хорошо работает в яркое и тускло освещенное окружение

Добавление звука запуска триггера в Google AIY Voice Kit: 6 шагов (с изображениями)

Оглавление:

Шаг 1. Необходимые материалы и файлы

Шаг 2: Шаг 2: просмотрите файл Voicehat.py для получения дополнительной информации

ВАЖНЫЙ

Шаг 3: Шаг 3: Добавьте звуковой код триггера в демонстрационный код

Шаг 4. Шаг 4. Запустите код и убедитесь, что все в порядке

Шаг 5: Шаг 5: Создайте свой собственный файл.wav

Шаг 6: Шаг 6: Добавление звука подтверждения?

Рекомендуемые:

Добавление внешнего динамика для улучшения качества звука: 5 шагов

Pixel Kit для запуска MicroPython: первые шаги: 7 шагов

Индикатор уровня звука / звука: 10 шагов

Общие сведения о микросхеме восьмеричного D-триггера 74LS273: 5 шагов

Вспышка ведомого триггера: 4 шага (с изображениями)

Индикатор уровня воды с SMS: 4 шага

Подключение 3-осевого гироскопического датчика BMG160 к Arduino Nano: 5 шагов

Измерение магнитного поля с использованием HMC5883 и Raspberry Pi: 4 шага

Персональный помощник на базе Arduino. (BHAI): 4 шага

Как сделать LED Chaser с использованием NE555 IC BC547: 17 шагов

Жестовый робот с самодельной Arduino: 7 шагов

Индивидуальный чехол Lego Raspberry Pi: 19 шагов

Настройте свой компьютер !: 6 шагов

Светодиодный матричный дисплей с прокруткой DIY с использованием Arduino: 6 шагов

Откройте навигационный компьютер Apollo DSKY: 13 шагов (с изображениями)

Шляпа с аналоговой камерой на 360 градусов: 10 шагов (с изображениями)

Упрощение изучения электроники и программирования с помощью Visual DIY Workbench: 3 шага

Arduino Flappy Bird - Arduino 2,4-дюймовый сенсорный TFT-экран SPFD5408 Bird Game Project: 3 шага

Весы для цветочных горшков IOT: 7 шагов

Светодиодные сообщения с Arduino: 10 шагов

Новый слой беспроводного датчика IOT для системы мониторинга окружающей среды дома: 5 шагов (с изображениями)