Sistem De Conversație Bazat Pe Inteligență Artificială: 6 шагов
Sistem De Conversație Bazat Pe Inteligență Artificială: 6 шагов
Anonim
Sistem De Conversație Bazat Pe Inteligență Artificială
Sistem De Conversație Bazat Pe Inteligență Artificială

Автор: Станут Николае-Раду

Группа: 333AB

Замечание: 8

Шаг 1. Описание функции

Descriere Funcțională
Descriere Funcțională

În Principiu sistemul va fi asemănător

asistenților inteligenți pentru casă de typeul Google Assistant și Amazon Alexa, utilizatorii pot da comenzi voice aparatului, iar acesta va răspunde sau va face o anumită acțiune, în funcție de cerințele utilizatorului. Creierul acestui dispozitiv va fi un Raspberry pi 3, datorită faptului că dispune de Wi-Fi, лучшее решение для обслуживания облака Amazon, забота о системе интеллектуального обслуживания.

Многофункциональное облачное обслуживание с искусственным интеллектом Amazon, наиболее эффективным с точки зрения функциональности и идентичности Amazon Alexa. De exemplu acest asistent virtual poate prezenta starea meteo, poate ține minte notițe, poate pune alarme, dar din păcate (sau fericire?), Aceste lucruri depind în totalitate de Amazon, iar comenzile dispozitivului se eng în limba.

Ca i obiectiv secundar, voi încerca să integrez limba română astfel încât asistentul să poată înțelege și comenzi și de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asistentul să ajute la automatizarea unor processse, de exemplu aprinderea și stingerea unor lumini, oprirea unei prize. Desigur, doar dacă API-ul Amazon va permite aceste lucruri.

Sursa poză:

Шаг 2: Componente

Pentru realizarea proiectului am avut nevoie de următoarele component:

  1. Малина PI 3 B +

    Acest mini computer - это созданный проект, который должен быть изменен на Linux Debian на процессоре ARM. Доступна, простая модель диспун i для Wi-Fi, conexiunea la internet fiind absolut necesară pentru motoarele de text-în-vorbire și vorbire-în-text

  2. Камера PS Eye

    Pe post microfon ("urechea proiectului") на всю камеру или камеру, предназначенную для консоли Play Station 3, deoarece dispune de un microfon puternic cu 4 canale, fiind mai ieftină decât o cameră web obișnuită

  3. Boxă portabilă

    Pentru a transmite informația către utilizator a fost nevoie de un diffuzor, am folosit o boxă cu fir primită de la un prieten

  4. 2 огня + светодиод
  5. Казеролэ

    Carcasa proiectului, o caserolă de sarmale: D

Шаг 3: Оборудование

Аппаратное обеспечение
Аппаратное обеспечение

După ce am adunat component, am trecut la implementation, schema este una foarte simple. Портативная коробка, подключенная к порту USB, может быть подключена к порту для подключения к разъему для воспроизведения, камеры / микрофона, который подключен к порту USB-принтера для связи с компьютером-ул. Am mai adăugat în schemă și led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Nimic сложный.

Шаг 4: Программное обеспечение

Arhitectura acestui proiect presupune un «Creier» Care să preia comenzi de la utilizator (voce), să transforme datele в формате accesibil lui (текст) i să le redea răspunsul sau confirmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii, отдельный:

  1. Un motor Speech-to-Text (STT), pentru a prelua datele de intrare (информационная передача-де-утилизатор prin vorbire)
  2. Ун система искусственного интеллекта, pentru a lua decizii și a rezolva проблема
  3. Un motor преобразование текста в речь (TTS), pentru a transmite utilizatorului răspunsurile sau confirmările acțiunilor

Pentru STT am folosit API-ul de la Google, denumit Google Speech API, care este gratuit, предлагать или проверять, что вы говорите о rată mică de erori, dar oferă și un număr limitat de apeluri. Am ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor hardware impuse de computer (putere de processare, spațiu de stocare, memorie), folosirea unui serviciu offline este exclusă, așa că am optat pentru un serviciu Cloud, oferind și o Precizie mai mare, dar i un timp de răspun Google доступен для всех, кто хочет купить мотоцикл STT.

Pentru feedback-ul oferit utilizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este foarte mare consumator de resurse și nici nu este la fel de sensibil precum STT-ul. Sintetizarea Vocii este făcuta де Фестивальная система синтеза речи, забота о бесплатном sub o liceță де типуль MIT. Голосовать за робота, использовать интеллектуальную информацию в eSpeak, а также использовать TTS в автономном режиме. Avantajul său faă de serviciile online este că nu are niciun fel de limitare la numărul decoversii.

Liantul dintre STT și TTS, Precum și partea "iteligentă" este platforma denumită Jasper. Платформа с открытым исходным кодом доступна на GitHub по адресу link-ul: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus și ia decizii în funcție de input-ul utilizatorului. Это совместимо с Raspberry PI, найденным на Python. Am ales această soluție în detrimentul celor Cloud datorită modularității, платформа permite folosirea oricărui serviciu STT și TTS, dar și Definirea oricărei acțiuni folosind limbajul de programare Python.

Sistemul de inteligență искусственный. Natura platformei Jasper, find bazată pe comenzi și acțiuni predfinite, limitează capacitya de convorbire, dar oferă un cadru potrivit pentru un asistent digital, acesta fiind și scopul proiectului.

Шаг 5: внедрение

  1. Am instalat sistemul de operare Raspbian pe cardul microSD
  2. Am conectat camera și diffuzorul la Raspberry
  3. Am configurat sistemul de operare, după care am instalat toate bibliotecile și serviciile necesare, urmând toți pașii din acest ghid:
  4. Создал și instalat module adiționale pentru a extinde funcționalitatea sistemului

Шаг 6: Utilizare

Image
Image
Utilizare
Utilizare
Utilizare
Utilizare

Монитор на вашем телефоне с конфигурацией устройства, который поддерживает предопределенную беспроводную связь, управляет настройкой, реализованной на SSH. Jasper permite două typeuri de interacțiune:

  1. Терминал печати (текст) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jasper

Din Простите voi începe демонстрационная функциональность принин промежуточный терминал. La rularea comenzii jasper_cli va fi afișat un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. Printre comenzile cunoscute se numără:

  • DEFINE + cuvânt - întoarce Definiția din dicționar a cuvântului respectiv
  • КТО, ЧТО, СКОЛЬКО, СКОЛЬКО, НАСКОЛЬКО + cuvânt - folosește API-ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - folosește API-ul de la wikipedia pentru a oferi informații despre differite noțiuni
  • ШУТКА - spune o glumă
  • LUMOS / NOX - aprinde / stinge LED-ul atașat
  • ТРИВИЯ
  • ФИЛЬМЫ - информация о фильмах (imdb)
  • НОВОСТИ - citește știri

В модульном голосе, Deschis la Introductionre comenzii "jasper" в linia de comandă, dispozitivul se pune in module de așteptare, acesta fiind trezit la auzirea unui cuvânt-cheie. În cazul de faă cuvâtul cheie este "Джаспер". După ce dispozitivul a auzit cuvântul cheie, acesta intră în modul de ascultare, putând să primească comenzi точный ca i în модульный текст. După executarea comenzii, dispozitivul intră din nou în așteptare până la o nouă trezire a sa.

Рекомендуемые: