Всичко за лицевото разпознаване за бизнеса

Разпознаването на лица не е ограничено до областта на компютърните науки. Има солидни бизнес приложения.

Една от най-популярните модни думи на това десетилетие е лицевото разпознаване.

Това е частта от приложното машинно обучение, която може да открива и идентифицира човешки лица, проблем, който досега беше изключително труден за компютрите. И това разкри цял нов свят от вълнуващи възможности и предизвикателства както за бизнеса, правителствата, така и за отделните хора.

Ако сте бизнес лидер и сте се чудили каква е цялата врява и дали има някаква полза в тази нова разработка, ние ще ви покрием. В тази статия ще разгледаме историята на лицевото разпознаване, неговото развитие, текущи употреби, противоречия, внедряване и много други аспекти.

До края му ще имате солидна представа какво представлява технологията за лицево разпознаване и какви са нейните последици за бизнеса.

Да започваме!

Еволюция на лицевото разпознаване

Технологията съществува от известно време заради целия шум и медийно отразяване около лицевото разпознаване. Първата сериозна алгоритмична работа в откриването на лица беше Рамка за откриване на обекти Viola-Jones публикувана през 2001 г. Въпреки че представлява рамка с общо предназначение за идентифициране на обекти в изображения, тя бързо се прилага за разпознаване на лица с много добър успех. Основната причина за популярността на този алгоритъм е неговата скорост; докато процесът на обучение беше мъчително бавен, процесът на откриване беше изключително бърз.

Още през 2001/2004 г. средният настолен компютър, работещ с този алгоритъм, успя да обработи 300px X 300px кадър за 0,07 секунди (още тук). The проценти на точноствъпреки че не са сравними с това, което хората могат да постигнат, са впечатляващи с 90%.

Истински напредък обаче не беше постигнат до десетилетието 2010-2020 г., когато Конволюционни невронни мрежи се появи като най-добрият метод за разпознаване на лица. Причината беше наличието на сурова процесорна мощност и гигантски системни памети, предоставени чрез облачни изчисления от доставчици на инфраструктура като услуга (IaaS). За първи път в историята компютрите постоянно изпреварваха хората в разпознаването на лица, особено когато бяха включени голям брой произволни лица.

Източник: medium.com

Как работи лицевото разпознаване?

Лицевото разпознаване е многоетапен процес с участието на няколко специализирани подсистеми.

Ето какво означават различните етапи:

Откриване/проследяване: Тази част от етапа на предварителна обработка е отговорна за идентифицирането и проследяването на лица в дадения файл с изображение или видео. След като този процес приключи, знаем със сигурност, че в дадения вход има лице и то може да бъде обработено допълнително. Фазата на проследяване също е отговорна за проследяването на определени части, конкретни характеристики или изражения на лицето, ако това е необходимо.

Подравняване: Проблемът с разпознаването на лица се усложнява, защото лицата в дадено изображение или видео не следват никакви указания. Лицето може да е увеличено или намалено, да наднича иззад дърво или да присъства в страничен профил, което прави проблема с разпознаването на лице още по-труден. Тук идва подравняването на лицето: то ни казва къде в даденото изображение/видео са линиите на лицето и какви са контурите на чертите на лицето.

Източник: csc.kth.se

Извличане на характеристики: Както подсказва името, по време на тази фаза на процеса (сега сме в етапа на разпознаване), отделните характеристики на лицето, като очи, нос, брадичка, устни и т.н., се извличат във формата които алгоритмите могат да използват в следващия етап. На този етап компютърът е събрал достатъчно сложни данни, за да различи лицето по уникален начин.

Съпоставяне/класификация на признаци: В този етап входните данни, получени от извличането на признаци, се съпоставят с дадената база данни, за да се изведе самоличността на лицето. Тази фаза е известна още като класификация, тъй като алгоритъмът може да е необходим за категоризиране на лица, вместо да ги идентифицира индивидуално.

След като този процес приключи, знаем със сигурност дали даденото лице е част от базата данни, с която сме сравнили или не. Крайният изход може също да съдържа маркиране, както сме свикнали да виждаме във Facebook.

Източник:warddatascience.com

Съображения за внедряване: от страна на сървъра срещу страна на клиента

Разпознаването на лица може да работи както на сървъра, така и на устройството, с което потребителят взаимодейства. Например, когато качите снимка във Facebook, алгоритмите се изпълняват от страната на сървъра; от друга страна, система за идентификация, която използва вашето лице за отключване на устройството, трябва да работи от страната на клиента. И така, кой е по-добър?

Честно казано, не става дума за това кой е по-добър. Както сървърните, така и клиентските внедрявания имат своите силни страни; на практика предприятията внедряват хибридна система. Препоръчителната практика е да обучавате вашите модели от страната на сървъра, където данните за обучение и ресурсите за обработка са неограничени. След като моделите бъдат обучени, те могат да бъдат пакетирани и разгърнати от страна на клиента, което подобрява скоростта на системата, както и запазва поверителността на потребителя.

  Какво е бързо зареждане и как работи?

Изпращането на всичко до сървъра води до забавяне, което може да бъде лошо или неприемливо в определени случаи. В същото време запазването на всичко от страна на клиента ще доведе до по-слаби модели.

Колко точно е лицевото разпознаване?

Точността не е много добре дефиниран термин в лицевото разпознаване. Основната причина е, че това е неясен проблем с всякакви объркани входове (слаба светлина, лице, частично покрито с коса, качество на камерата и т.н.) и дори измамни входове (повече за това по-късно!). В резултат на това невронните мрежи, участващи в разпознаването на лица, трябва да бъдат променени за разглеждания проблем, ограничавайки техния обхват. Така че, докато индустриална система за разпознаване на лица може да се похвали със 100% точност (което често се случва), същата система може да не е дори 20% точна, когато бъде помолена да идентифицира лица в претъпкана снимка.

В един изследвания, определен тип алгоритъм за лицево разпознаване успя да постигне 98,52% точност, по-висока от човешката точност от 97,53%, постигната при същия тест. В друг проучване проведено в криминалистиката, комбинацията от човешка преценка и алгоритми дава най-добри резултати в някои случаи.

В крайна сметка — за фокусирани, добре дефинирани приложения разпознаването на лица е най-добрият инструмент, с който разполагаме.

Къде се използва лицевото разпознаване?

Дори за краткия период, през който бяха разработени жизнеспособни алгоритми, лицевото разпознаване намери невероятно полезни и вълнуващи приложения. Някои от тях са забележими, но някои са толкова фино и фундаментално вплетени в ежедневието, че едва ли спираме да мислим какво има отдолу.

Facebook е може би най-разпространеният пример за съвременни системи за лицево разпознаване на работа. Веднага щом качите снимка, социалната мрежа може да разпознава лица. Докато преди време бяхте помолени да маркирате приятели, сега Facebook може да го направи сам.

Източник: labnol.org

Страхотно ново приложение от Facebook е характеристиката на информиране потребители, когато снимки, съдържащи техните лица, са качени от някого, дори ако не са били маркирани на тези снимки.

Snapchat използва интензивно откриване и разпознаване на лица за много от функциите си, най-вече забавните филтри, които са такава ярост.

Източник: gistreel.com

За да работят тези филтри, контурите и чертите на лицето на обекта трябва да бъдат разпознати перфектно, в противен случай наслагванията няма да изглеждат реалистични. Същото важи и за Face Swap, друга популярна функция на Snapchat. В случай, че се интересувате да се потопите по-дълбоко във възможностите на Snapchat за разпознаване на лица, вижте тук.

От известно време Uber се бори с опасенията за поверителността и безопасността и най-новото оръжие в арсенала на компанията е разпознаването на лица. Компанията пусна нова функция, при която самоличността на шофьорите-партньори се проверява от използвайки лицата си. Компанията казва в блога си, че след като са тествали няколко доставчици на технологии за разпознаване на лица, са се спрели на Microsoft Face API заради високото му качество. Интересното е, че тази проверка на самоличността в реално време работи добре при условия на слаба светлина и е в състояние да открие очила.

Тъй като лицевото разпознаване се оказва успешно в дивата природа, лесно е да се предвиди, че то скоро може да замени други методи за идентификация в образователни институции, болници, библиотеки и т.н.

Предотвратяването на престъпления в търговията на дребно е естествено продължение на приложението на лицевото разпознаване. Промишлеността на търговията на дребно губи приблизително 45 милиарда долара всяка година на крадци от магазини и други престъпления на дребно, с много малко за противодействие. Сега компании като FaceFirst помагат на търговците на дребно да използват лицево разпознаване, за да откриват предишни нарушители и да предупреждават служителите по сигурността.

Полицейското наблюдение започва да използва разпознаването на лица, както всички други институции там. Например в Обединеното кралство полицията в Южен Уелс използва камери, монтирани на микробуси, за да направи наблюдение на тълпите по-лесно.

Източник: theconversation.com

Въпреки че тази новооткрита суперсила в ръцете на полицията предизвика разгорещени обществени дебати относно неприкосновеността на личния живот, полицията вярва, че ще им помогне да ограничават по-добре нарушителите. Както каза Ричард Луис, заместник-началник на полицията в Южен Уелс Financial Times:

Ако идентифицирате някой, който е извършил престъпление [previously]вие основно казвате: знаем, че сте тук, моля, дръжте се прилично.

Здравеопазването наскоро имаше неочаквано приложение, при което лицевото разпознаване помогна за откриването на рядко генетично заболяване, наречено синдром на DiGeorge.

Синдромът на DiGeorge се появява при около 1 на 6000 деца и води до деформации в няколко части на тялото. Проблемът със здравеопазването в този случай е по-сериозен за по-бедните страни, които нямат ресурси да използват скъпи диагностични методи. Като такова, разпознаване на лица, с поразително точност от 96,6%, предлага нова надежда за жертвите на синдрома на DiGeorge.

  Как да принудите вашия Apple Watch да се синхронизира с вашия iPhone

В индустрията на авиокомпаниите възприемането на лицевото разпознаване набира скорост и скоро ще замени конвенционалните бордни карти. Понастоящем има ограничени, но обещаващи резултати в подпомагането идентифициране на пътниците като напускат страната. Всъщност Администрацията за транспортна сигурност (TSA) на САЩ изложи a план за широкото използване на биометрични данни, базирани на лицево разпознаване.

Противоречиви употреби на лицевото разпознаване

Технологията ни дава сила, въпреки че доброто или лошото й използване зависи от нас. Няма съмнение тогава, че нещо толкова мощно и радикално като лицевото разпознаване се използва по начин, който поражда загриженост относно основните човешки права и етика.

Най-забележителният пример за спорни употреби на разпознаване на лица е огромният Китай система за наблюдение която използва около 200 милиона камери, за да следи своите 1,4 милиарда граждани.

Източник: sbs.com

Системата проследява хората и оценява действията им, като непрекъснато актуализира метрика, наречена граждански резултат. Въпреки че има някаква стойност в наличието на мощна контролирана от държавата система за наблюдение (например проследяване на неизпълнени задължения), повечето виждат това като пристигането на дистопичното бъдеще, което си е представял Джордж Оруел. Това е бъдеще, в което правителствата имат неограничена власт над индивида, а неприкосновеността на личния живот не съществува.

Вторият пример за спорна употреба на разпознаване на лица също идва (не е изненадващо?) от Китай. Този път училищната система приема лицево разпознаване, за да гарантира, че учениците са „внимателни“ по време на часовете. Новата система за лицево разпознаване, въпреки че все още не е широко разпространена, заменя личните карти, библиотечните карти, системите за присъствие и т.н., използвайки лицето на ученика за идентификация.

Източник: businessinsider.com

Но зловещата част е, че тази система следи нивата на внимание на учениците, използването на мобилни телефони и т.н. и предупреждава учителя, когато определен праг бъде преминат.

Въпреки че видеонаблюдението, задвижвано от разпознаване на лица, не е изключително за Китай – САЩ са полагане на усилия да го използва за ограничаване на насилието с огнестрелно оръжие в училищата – Китай изглежда е този, който отива по-далеч от всяка друга страна.

Що се отнася до използването на лицевото разпознаване, какви опции имате? В този раздел ще разгледаме какво се използва често и как различните решения се подреждат едно срещу друго.

Преди да започнем обаче: напомняне, че тези API се развиват бързо и е вероятно да попаднете на публикации в блогове, които казват, че на този API липсва тази или онази функция. Не вземайте решенията си въз основа на това. Първо анализирайте нуждите на вашия бизнес, внимателно проверете предлаганите функции, проучете ги и едва тогава вземете решение.

OpenCV

Изследванията на AI са дупка без дъно. Обучението и усъвършенстването на система за лицево разпознаване е трудно и е най-добре да се остави на конгломерати с дълбоки джобове и армия от изследователи. Въпреки това, ако вашите нужди са прости и искате да имате пълен контрол – и разбира се, сте готови за поддръжката на малък/малък инженерен екип –OpenCV може просто да работи за вас.

Това е библиотека за компютърно зрение с отворен код, която е изключително точна и е достъпна за всички платформи за програмиране. Ето едно настръхване на косата пример за това как можете да завъртите система за разпознаване на лица с Python и OpenCV в 25 реда код!

Сега може да срещнете някои блогове, които казват, че OpenCV няма разпознаване на лица. Е, това е пълна лъжа и ето доказателство. Като цяло, OpenCV може да бъде чудесен избор за вашия бизнес, ако нуждите са прости и специфични.

Amazon Rekognition

Разпознаване е мощно предложение от един от най-големите доставчици на облачни услуги – AWS. Това е напълно управлявана, мощна услуга за платформата AWS и ако вече използвате AWS за внедряване, Rekognition вероятно е най-добрият избор.

Някои от умопомрачителните функции, предлагани от Rekognition са:

  • Анализ в реално време (докато качвате изображение или видео в S3)
  • Обширен анализ на лицето (пол, цвят на косата, изражение на лицето, отворени или не очи и др.)
  • Pathing (улавяне на пътища на идентифицирани обекти във видеоклипове)
  • Разпознаване на сцена и активност (на закрито/на открито, „играене на футбол“ и др.)
  • Модериране на опасно съдържание (голота, например)

Най-големият плюс с Rekognition е и най-големият минус — наистина ще ви е трудно да го използвате с услуги извън AWS до степен, в която просто ще трябва да се откажете.

Кайрос

В рязък контраст с Rekognition, Кайрос ви предоставя AI върху API (римуването е непреднамерено, кълнем се!), което ви позволява да поемете пълен контрол върху вашите данни и сървъри. Kairos се представя като услуга, която поставя на първо място поверителността, и е така изключително критичен на Amazon и други компании, влизащи в тайно споразумение с правителството (така е ACLUмежду другото).

  Как да инсталирате Apache Tomcat на Ubuntu Server

Kairos работи както с изображения, така и с видеоклипове и има всички хубави функции, които бихте очаквали от модерен API за разпознаване на лица. Той изпълнява някои от удивителните функции, открити в Rekognition, но ако не се нуждаете от тях и вече управлявате данните си, защо да си правите труда?!

Kairos има локално внедряване за тези, които са параноични относно поверителността и дори не искат да изпращат данни по кабела за обработка, Kairos има локално внедряване, ценообразуването зависи от вашия случай на употреба и може да бъде доста стръмно.

Google Cloud Vision

Google избра да прави разлика между своите услуги за разпознаване на лица за изображения и видеоклипове. API за изображения е известен като Облачно зрениедокато се извиква услугата, фокусирана върху видео Видео интелигентност.

Докато услугата, фокусирана върху изображения, е доста подобна на това, което AWS може да предложи, видео услугата има хубава функция за каталогизиране и търсене. Това ще бъде полезно за компании, които имат големи видео архиви, които биха искали да анализират или търсят.

Въпреки това, Video Intelligence няма функции за разпознаване на лица към момента на писане и те изглежда се предлагат само в Cloud Vision. Проследяването на обекти и откриването на текст също са в бета версия, което ги поставя много по-назад от предложенията на Amazon.

Azure Face API

Тъй като Microsoft приема облачните си предложения по-сериозно от настолните (най-накрая), Azure Face API е едно прекрасно предложение. Има всички интересни функции, които бихте очаквали (откриване, идентификация, групиране на лица, търсене на подобни лица, емоция и т.н.) и работи еднакво добре с видеоклипове.

Това не е тясно свързано с лицевото разпознаване, но си струва да споменем, че Azure предлага и компютърно зрение на клиента обслужванекоето ви позволява да използвате своите входове и да обучавате модели според вашите нужди.

Точно като услугата на Google, има налична детска площадка точно на началната страница, което прави тестването на API много забавно!

Има ли значителни разлики между най-добре управляваните услуги за разпознаване на лица? Не точно. В момента има силна конкуренция в областта и новите функции се въвеждат по-бързо от пиците. Ако вече сте обвързани с определена екосистема, използването на тяхната собствена услуга за разпознаване на лица има смисъл. В противен случай може да искате да изберете друг доставчик, ако вашите нужди са специфични (контролиране на вашите собствени данни, необходимост само от обикновено откриване и т.н.).

Системи против лицево разпознаване

Точно както някои изследователи са посветили живота си на усъвършенстване на технологията за разпознаване на лица, други са заети с разработването на техники, които да ги заблудят. Едно такова интересно развитие е Състезателни очилакоито иначе изглеждат нормални за хората, но са заблудили експертните системи за лицево разпознаване.

Източник: digitaltrends.com

Въпреки това тези очила все още не се предлагат на пазара, въпреки че изследователите казват, че могат лесно да бъдат отпечатани на 3D.

Друго интересно развитие беше стартирането на еко очила на Kickstarter. Въпреки че продуктът вече е отменен, той работи върху забележително проста идея: обикновени, ежедневни слънчеви очила за $45, които просто отразяват светлината, карайки камерите и устройствата за видеонаблюдение да полудеят.

Точно като домейна на киберсигурността, „хакерите“ и изследователите се захващат с разпознаването на лица за надпреварата към съвършенството. Около 2014 г. видяхме популярността на камуфлажен грим които дадоха невидимост срещу разпознаване на лица, но вече не са жизнеспособни. Ще има ли AES криптиране на лицевото разпознаване? Само времето ще покаже!

Разпознаването на лица за вас ли е?

Видът бизнес, който може да се възползва от разпознаването на лица, е този, който включва хора – да, което означава всеки бизнес там! Докато настоящите употреби на разпознаването на лица изглежда се подкрепят от правителства, големи фирми или технологични стартиращи компании, няма причина вашият бизнес да не може да се възползва от него.

Възможностите са наистина безкрайни, когато комбинираме малко творческо мислене – поздравяване и идентифициране на клиенти в хотел, намиране на вашия приятел в море от хора, намиране на хора с подобни лица (може би за използване като актьори), откриване на личности за работа интервюта (отново тук просто оставяме въображението да се развихри; може да няма нищо съществено в подобно проучване), персонализиране на банковото изживяване, когато влезе клиент с висока стойност. . . Има безброй начини да използвате разпознаването на лица на малки и големи нива, за да направите бизнеса си по-добър.

Заключение

Съвсем скоро лицевото разпознаване ще стане толкова широко разпространено и толкова често, че дори няма да го забележим (като мобилните телефони?). Основната технология е почти усъвършенствана, но в реалния свят не става въпрос само за откриване на лица – а за това какво можем да правим с тази способност.

Звучи увлекателно и искате да научите повече? Вижте това брилянтен курс за компютърно зрение.