Как работи лицевото разпознаване?

Повечето хора се чувстват комфортно с разпознаването на лица за използването му във филтрите на Instagram и Face ID. Но тази сравнително нова технология може да се почувства малко страховита. Вашето лице е като пръстов отпечатък, а технологията зад лицевото разпознаване е сложна.

Както при всяка нова технология, разпознаването на лица има и недостатъци. Тези недостатъци стават все по-очевидни, тъй като военните, полицията, рекламодатели, и създателите на дълбоки фалшификати, намират нови хитри начини да се възползват от софтуера за разпознаване на лица.

Сега, повече от всякога, е важно хората да разберат как работи разпознаването на лица. Също така е важно да знаете ограниченията на разпознаването на лица и как ще се развият в бъдеще.

Разпознаването на лица е изненадващо просто

Преди да се заемете с многото различни среди за лицево разпознаване, важно е да разберете как работи процесът на разпознаване на лица. Ето три приложения за софтуер за разпознаване на лица и просто обяснение за това как разпознават или идентифицират лица:

Основно лицево разпознаване: За филтрите Animoji и Instagram камерата на телефона ви „търси“ определящите черти на лицето, по-специално чифт очи, нос и уста. След това използва алгоритми, за да заключи лице и да определи в коя посока гледа, дали устата му е отворена и т.н. Струва си да се спомене, че това не е лицева идентификация, а просто софтуер, който търси лица.
Face ID и подобни програми: След като настроите Face ID (или подобни програми) на вашия телефон, той прави снимка на лицето ви и измерва разстоянието между чертите на лицето ви. След това, всеки път, когато отидете да отключите телефона си, той „преглежда“ през камерата, за да измери и потвърди вашата самоличност.
Идентифициране на непознат: Когато една организация иска да идентифицира лице за целите на сигурността, рекламата или полицията, тя използва алгоритми, за да сравни това лице с обширна база данни от лица. Този процес е почти идентичен с Face ID на Apple, но в по-голям мащаб. Теоретично може да се използва всяка база данни (личностни карти, профили във Facebook), но база данни с ясни, предварително идентифицирани снимки е идеална.

Добре, нека да влезем в същността. Тъй като „основното лицево разпознаване“, използвано за филтрите на Instagram, е толкова прост и безвреден процес, ние ще се съсредоточим изцяло върху идентификацията на лицето и многото различни технологии, които могат да се използват за идентифициране на лице.

  Как да промените настройките на вашите AirPods и AirPods Pro

Повечето лицево разпознаване разчита на 2D изображения

Както бихте очаквали, повечето софтуери за разпознаване на лица разчитат изцяло на 2D изображения. Но това не се прави, защото 2D изобразяването на лицето е супер точно, направено е с цел удобство. Преобладаващото мнозинство от камерите правят снимки без никаква дълбочина, а обществените снимки, които могат да се използват за бази данни за разпознаване на лица (например снимки на профили във Facebook), са в 2D.

Защо 2D изображението на лицето не е супер точно? Е, защото на плоското изображение на лицето ви липсват идентифициращи характеристики, като дълбочина. С плоско изображение компютърът може да измери разстоянието на зеницата ви и ширината на устата ви, наред с други променливи. Но не може да определи дължината на носа ви или изпъкналостта на челото ви.

Освен това, 2D изобразяването на лицето разчита на спектъра на видимата светлина. Това означава, че 2D изображението на лицето не работи на тъмно и може да бъде ненадеждно при фънки или сенчести условия на осветление.

Ясно е, че начинът за заобикаляне на някои от тези недостатъци е използването на 3D изображения на лицето. Но как е възможно това? Имате ли нужда от специално оборудване, за да видите лице в 3D?

IR камерите добавят дълбочина към вашата самоличност

Докато някои приложения за разпознаване на лица разчитат единствено на 2D изображения, не е необичайно разпознаването на лица да разчита и на 3D изображения. Всъщност вашият опит с разпознаването на лица вероятно включва щипка 3D.

Това се постига чрез техника, наречена лидар, която е подобна на сонара. По същество устройствата за сканиране на лица, като вашия iPhone, изстрелват безвредна IR матрица към лицето ви. Тази матрица (стена от лазери) след това се отразява от лицето ви и се улавя от IR камера (или ToF камера) на вашия телефон.

Къде се случва 3D магията? IR камерата на телефона ви измерва колко време отнема всяка част от инфрачервената светлина да отскочи от лицето ви и да се върне към телефона. Естествено, светлината, която се отразява от носа ви, ще има по-кратко пътуване от светлината, която се отразява от ушите ви, а IR камерата използва тази информация, за да създаде уникална карта на дълбочината на лицето ви. Когато се използва заедно с основни 2D изображения, 3D изображенията могат значително да повишат точността на софтуера за лицево разпознаване.

  Как да инсталирате и управлявате разширения в Chrome

Лидарното изобразяване е странна концепция, която може да бъде трудно да си обхванете главата. Ако това помогне, опитайте се да си представите, че IR мрежата от вашия телефон (или всяко устройство за лицево разпознаване) е играчка с щифтове. Подобно на играчка с игли, лицето ви оставя вдлъбнатина в IR мрежата, където носът ви е забележимо по-дълбок от, да речем, очите ви.

Термоизображението позволява на лицевото разпознаване да работи през нощта

Един от недостатъците на 2D лицевото разпознаване е, че разчита на видимия спектър на светлината. Казано на лаици, основното лицево разпознаване не работи в тъмното. Но това може да се заобиколи с помощта на термовизионна камера (да, като в Tom Clancy).

„Чакай малко“, може да кажете, „термичните изображения не разчитат ли на IR светлина?“ Да, така е. Но термовизионните камери не изпращат взривове от IR светлина; те просто откриват IR светлината, която излъчва от обекти. Топлите обекти излъчват тон IR светлина, докато студените излъчват незначително количество IR светлина. Скъпите термовизионни камери могат дори да откриват фини температурни разлики в цялата повърхност, така че технологията е идеална за разпознаване на лица.

Изображение на видимия светлинен спектър, термично изображение и композитно термично изображение.

Има a шепа различни начини за идентифициране на лице с термовизия. Всички тези техники са невероятно сложни, но споделят някои фундаментални прилики, така че ще се опитаме да направим нещата прости със списък:

Необходими са множество снимки: термовизионна камера прави множество снимки на лицето на обекта. Всяка снимка се фокусира върху различен спектър на IR светлина (дълги, къси и средни вълни). Обикновено дългият вълнов спектър осигурява най-много детайли на лицето.
Картите на кръвоносните съдове са полезни: Тези IR изображения могат да се използват и за извличане на образуването на кръвоносни съдове в лицето на човек. Страшно е, но картите на кръвоносните съдове могат да се използват като уникални лицеви пръстови отпечатъци. Те могат да се използват и за намиране на разстоянието между лицевите органи (ако типичните термични изображения показват калпави снимки) или за идентифициране на синини и белези.
Субектът може да бъде идентифициран: Съставно изображение (или набор от данни) се създава с помощта на множество IR изображения. След това това съставно изображение може да бъде сравнено с база данни на лицата, за да се идентифицира обектът.

Разбира се, термичното лицево разпознаване обикновено се използва от военните, това не е нещо, което ще намерите в Khols, и не е нещо, което ще дойде със следващия си мобилен телефон. Освен това термовизионните изображения не работят добре през деня (или в обикновено добре осветени среди), така че нямат много потенциални приложения извън армията.

  Как да сканирате Snapcode, записан във вашия фотоапарат

Ограничения на лицевото разпознаване

Прекарахме много време в разговори за недостатъците на лицевото разпознаване. Както видяхме от IR и термични изображения, е възможно да се преодолеят някои от тези ограничения. Но все още има няколко проблема, които все още не са изяснени:

Препятствие: Както бихте очаквали, слънчевите очила и други аксесоари могат да спънат софтуера за разпознаване на лица.
Пози: Разпознаването на лица работи най-добре с неутрално, обърнато напред изображение. Накланянето или завъртането на главата може да затрудни разпознаването на лица, дори за софтуер за разпознаване, базиран на инфрачервени лъчи. Освен това усмивката, надутите бузи или всяка друга поза могат да променят начина, по който компютърът измерва лицето ви.
Светлина: Всички форми на лицево разпознаване разчитат на светлина, независимо дали е във видим спектър или инфрачервена светлина. В резултат на това странните условия на осветление могат да намалят точността на идентификацията на лицето. Това може да се промени, тъй като учените се развиват в момента технология за лицево разпознаване, базирана на сонар.
Базата данни: Без добра база данни разпознаването на лица не може да работи. По същите тези линии е невъзможно да се идентифицира лице, което не е било идентифицирано правилно в миналото.
Обработка на данни: В зависимост от размера и формата на базата данни, може да отнеме известно време, докато компютрите идентифицират правилно лицата. В някои ситуации, като полицията, ограниченията в обработката на данни ограничават използването на лицева идентификация за ежедневни приложения (което вероятно е добро).

Към момента най-добрият начин да заобиколите тези ограничения е да използвате други форми на идентификация във връзка с лицевото разпознаване. Телефонът ви ще поиска парола или пръстов отпечатък, ако не успее да идентифицира лицето ви и китайско правителство използва лични карти и технология за проследяване, за да затвори границата на грешка, която съществува в неговата мрежа за разпознаване на лица.

В бъдеще учените със сигурност ще намерят начин да заобиколят тези проблеми. Те могат да използват сонарна технология заедно с лидар, за да създават 3D карти на лица във всяка среда и могат да намерят начини да обработват данни за лица (и да идентифицират непознати) за невероятно кратък период от време. Така или иначе, тази технология има голям потенциал за злоупотреба, така че си струва да сте в крак с нея.

Източници: Университетът в Риека, Фондация Electronic Frontier