Как Alexa слуша будни думи

Alexa винаги слуша, но не записва непрекъснато. Той не изпраща нищо до облачните сървъри, докато не ви чуе да кажете думата за събуждане (Alexa, Echo или Computer). Но да слушате за будни думи е по-трудно, отколкото си мислите.

Ехо хардуерът не е толкова интелигентен. Без интернет всяка молба или въпрос, който зададете, няма да се провали. Това е така, защото вашите команди се изпращат в облака за интерпретация и решения. Amazon не иска всеки разговор, който имате пред интелигентен високоговорител, да бъде записан, а по-скоро само командите, които давате на интелигентния високоговорител. Поради тази причина компанията използва будна дума, за да привлече вниманието на интелигентния говорител. За да постигне това, Amazon използва комбинация от фино настроени микрофони, кратък буфер на паметта и обучение на невронна мрежа.

Фино настроените микрофони определят вашия глас

Светлосиният светодиод винаги ще гледа към посоката на вашия глас.

Високоговорителите на гласов асистент, като Echo и Echo Dot, обикновено имат множество вградени микрофони. Echo Dot, например, има седем. Този масив дава на устройствата няколко способности, от чуване на команди, изречени далеч, до отделяне на фоновия шум от гласовете.

Последното е особено полезно за откриване на будни думи. Използвайки множеството си микрофони, Echo може да определи местоположението ви спрямо това къде седи и да слуша в тази посока, като игнорира останалата част от стаята.

  Бързо обработвайте поща с плъзгане на приложението Outlook Mail

Виждате това в действие, когато използвате думата за събуждане. Застанете отстрани на Echo или Echo Dot и кажете думата за събуждане. Забележете, че пръстенът светва в тъмно синьо, а след това в по-светло синьо, докато кръжи и „сочи“ към вас. Сега преместете няколко стъпки встрани и кажете думата за събуждане още веднъж. Забележете, че светлосините светлини ви следват.

Знаейки къде се намирате, помага на устройството да се фокусира по-добре върху вас и изключете шумовете, идващи от другаде.

Късата памет не позволява на високоговорителя да държи твърде много

Echo устройствата имат много място за съхранение, но те не използват много от него. Според Рохит Прасад, вицепрезидент на Amazon и главен учен на Alexa Artificial Intelligence, ехо може физически да съхранява само няколко секунди аудио.

Намалявайки възможностите си, Amazon не само ви дава повече поверителност (това е едно място по-малко, където се съхранява гласът ви), но също така не позволява на Echo да слуша цели разговори, ограничавайки фокуса си върху намирането на думата за събуждане.

Представете си, че имате трисекундна касета и касетофон. Да предположим, че след като достигне края, лентата се връща към началото отново и отново. Ако започнете да записвате разговор, всичко, което сте казали преди четири секунди, ще бъде изтрито и незабавно ще бъде записано. Това прави Amazon Echo.

Той записва непрекъснато, но изтрива всичко, което току-що е записано, едновременно. Тази кратка продължителност на вниманието означава, че всичко, което може да чуе, е думата „Алекса“ и не много повече. Три секунди обаче са достатъчно дълги, за да може тази дума да бъде записана, разгледана и въздействана по подходящ начин.

  Как да инсталирате AbanteCart на Ubuntu сървър

Обучението на невронната мрежа помага при съпоставянето на шаблони

Представяне на слоевете, използвани от алгоритмите на Amazon.

И накрая, Amazon зависи от обучение на невронни мрежи за да научите Echo как да съвпада с шаблон. Подобно на други форми на машинно обучение, Amazon тренира своите алгоритми, като го захранва екземпляр след екземпляр на думата Alexa (или Computer, или Echo, в зависимост от това коя будна дума обучава компанията).

Идеята е да се обхванат всяка инфлексия и акцент, но също и контекстът. Amazon иска вашето Echo да разпознае разликата, когато говорите с него, когато говорите за него или, може би, когато говорите с човек на име Alexa. Насочените микрофони също помагат за тази цел.

С всяка дума, която Echo чува, то пуска аудио през слоеве от алгоритми. Всеки слой е проектиран да изключва фалшиви положителни резултати, търсейки подобни на звука или контекстни улики. Ако проверката на един слой премине, думата преминава към следващия. Накрая, когато локалното устройство реши, че е чуло думата за събуждане, то започва да записва и предава аудиото към облачните сървъри на Amazon. Amazon използва четири алгоритма: по един за всяка будна дума (Alexa, Computer, Echo) и един за Alexa Guard, който третира специфични звуци, като например разбиване на стъкло, като будна дума.

Но дори когато възникне съвпадение, Amazon продължава да извършва по-сложни проверки. Забелязали ли сте, че когато някой произнесе думата Alexa в телевизионно предаване или реклама, това обикновено не предизвиква отговор от вашето ехо? Това е така, защото Amazon също прави облачна проверка.

  Защо хората все още купуват телефони с функции през 2020 г

Облачните проверки изключват някои фалшиви положителни резултати

Това весела реклама на Alexa няма да събуди вашето ехо.

Когато компаниите правят реклами, които включват Alexa, те могат изпратете аудиото на Amazon. Компанията управлява аудиото чрез подобни алгоритми за съвпадение на шаблони, използвани за идентифициране на будната дума. След като този точен екземпляр е напълно каталогизиран, той се добавя към база данни.

Като част от процеса при достигане до облака, вашето Echo включва информация за будната дума, която е чул, и проверява тази база данни. Всеки път, когато намери съвпадение, Amazon инструктира вашето Echo да игнорира думата за събуждане, да изключи и да изхвърли всяко записано аудио.

Освен това Amazon проверява за екземпляри на събуждащата дума, произнесена едновременно. Не всяка компания изпраща аудио на Amazon, така че компанията излезе с ново решение за архивиране. След като провери за съвпадение в базата данни, компанията сравнява отпечатъка на будната дума с всички други случаи, идващи по същото време. Малко вероятно е двама души, които казват Alexa едновременно, да звучат напълно еднакво, така че ако има съвпадение, Amazon знае, че вероятно е рекламно или телевизионно шоу, и игнорира заявката.

Въпреки всички проверки, все още се появяват фалшиви положителни резултати. Можете да слушате какво е записало вашето Echo Центърът за поверителност на Amazon, и вероятно ще намерите поне един фалшиво положителен в групата. Но технологията непрекъснато се усъвършенства и в крайна сметка Amazon би искала тя да функционира без никаква будна дума.