Остарял ли е тестът на Тюринг? 5 алтернативи на теста на Тюринг

Преди повече от 70 години, когато изкуственият интелект беше концептуализиран, Алън Тюринг публикува статия, която описва как да го идентифицираме. По-късно е известен като тест на Тюринг и се използва от десетилетия за разграничаване между човек и ИИ.

Въпреки това, с въвеждането на усъвършенствани AI чатботове като ChatGPT и Google Bard, става все по-трудно да разберете дали говорите с AI. Това повдига въпроса; остарял ли е тестът на Тюринг? И ако е, какви са алтернативите?

Остарял ли е тестът на Тюринг?

Кредит за изображение: Jesus Sanz/Shutterstock

За да определите дали тестът на Тюринг е остарял, първо трябва да разберете как работи. За да може изкуственият интелект да премине теста на Тюринг, той трябва да убеди човек, който разпитва, че е човек. Но има уловка – AI се оценява заедно с човек и трябва да отговори с текст.

Мислете за това така; ако вие сте разпитващият и задавате въпроси на двама участници онлайн, като използвате текст, но единият от тях е AI модел – бихте ли ги различили след пет минути? Имайте предвид, че целта на теста на Тюринг не е да идентифицира AI модела въз основа на правилните отговори, а да оцени дали AI може да мисли или да се държи като човек.

Проблемът с подхода на теста на Тюринг за идентифициране само на човешки реакции е, че той не отчита други фактори. Например, интелигентността на AI модела или знанията на разпитващия. Освен това тестът на Тюринг е ограничен само до текст и става все по-трудно да се идентифицира AI, който генерира човешки глас или дълбоки фалшиви видеоклипове, които имитират човешко поведение.

  Коригирайте PS4 код за грешка WS 37431 8

Въпреки това, настоящите AI модели като ChatGPT-4 и Google Bard все още не са напреднали до степен, в която могат постоянно да преминават теста на Тюринг. Всъщност, ако сте запознати с AI, можете да забележите текст, генериран от AI.

5-те най-добри алтернативи на теста на Тюринг

Възможно е бъдещите AI модели като ChatGPT-5 да преминат теста на Тюринг. Ако това се случи, ще имаме нужда от различни тестове, комбинирани с теста на Тюринг, за да определим дали говорим с ИИ или човек. Ето най-добрите алтернативи за тест на Тюринг:

1. Тестът на Маркъс

Гари Маркъс, известен когнитивен учен и изследовател на ИИ, предложи алтернатива на теста на Тюринг, която беше публикувана в Нюйоркчанин за идентифициране на когнитивните способности на ИИ. Тестът е прост – вие преценявате AI модел въз основа на способността му да гледа и разбира YouTube видеоклипове и телевизионни предавания без субтитри или текст. За да може AI да премине теста на Marcus, той трябва да разбира сарказма, хумора, иронията и сюжета, когато гледа видеоклиповете, и да ги обяснява като човек.

В момента GPT-4 може да описва изображения, но досега няма AI модел, който да може да разбира видеоклипове като човек. Самоуправляващите се превозни средства се доближават, но не са напълно автономни и изискват сензори, тъй като не могат да осмислят всичко в заобикалящата ги среда.

2. Визуалният тест на Тюринг

Според изследователска статия, публикувана на PNAS, визуалният тест на Тюринг може да се използва за идентифициране дали говорите с човек или с изкуствен интелект с помощта на въпросници с изображения. Работи като теста на Тюринг, но вместо да отговарят на въпроси с помощта на текстове, на участниците се показват изображения и се очаква да отговарят на прости въпроси, докато мислят като човек. Визуалният тест на Тюринг обаче е различен от CAPTCHA, тъй като всички отговори са верни, но за да премине теста, AI трябва да обработва изображенията подобно на човек.

  Как да промените шрифта по подразбиране в Outlook

Освен това, ако на AI и човек се покажат множество изображения едно до друго и бъдат помолени да идентифицират реалистични изображения, човекът ще има когнитивната способност да премине теста. Това е така, защото AI моделите трудно различават изображения, които не изглеждат като заснети в реалния свят. Всъщност това е причината, поради която можете да идентифицирате изображения, генерирани от AI, като използвате аномалии, които нямат смисъл.

3. Тестът Lovelace 2.0

Теорията, че компютърът не може да създава оригинални идеи отвъд това, за което е бил програмиран, е концептуализирана за първи път от Ада Лавлейс преди теста на Тюринг. Въпреки това Алън Тюринг възрази срещу тази теория, твърдейки, че AI все още може да изненада хората. Едва през 2001 г. бяха разработени насоките за теста на Lovelace, за да се различи AI от човек – и според thekurzweillibrary по-късно правилата бяха преразгледани през 2014 г.

За да може AI да премине теста Lovelace, той трябва да демонстрира, че може да генерира оригинални идеи, които надхвърлят обучението му. Сегашните AI модели като GPT-4 нямат способността да измислят нови изобретения извън съществуващите ни познания. Изкуственият общ интелект обаче може да постигне тази способност и да премине теста Lovelace.

4. Обратен тест на Тюринг

Какво ще кажете за теста на Тюринг, но направен наобратно? Вместо да се опитвате да разберете дали говорите с човек, целта на обратен тест на Тюринг е да подмамите AI да повярва, че сте AI. Но вие също се нуждаете от друг AI модел, за да отговорите на същите въпроси с помощта на текст.

  Как да коригирате грешката „406 неприемливо“ на вашия WordPress сайт

Например, ако ChatGPT-4 е разпитващият, можете да запишете Google Bard и друг човек като участници. Ако AI моделът може правилно да идентифицира човешкия участник въз основа на отговорите, той е преминал теста.

Недостатъкът на обратния тест на Тюринг е, че е ненадежден, особено като се има предвид, че понякога AI не може да разграничи генерираното от AI съдържание и написаното от хора съдържание.

5. Рамка за класификация на AI

Според рамката за класификация на AI, разработена от Крис Саад, тестът на Тюринг е само един метод за оценка, за да разберете дали говорите с AI. По-накратко, класификационната рамка на AI се основава на теорията за множествената интелигентност, която изисква човешкият интелект да отговаря на поне осем различни критерия, които включват: музикално-ритъм, логико-математически интелект, визуална идентификация, емоционална интелигентност, саморефлексивна интелигентност способност за екзистенциално мислене и движение на тялото.

Тъй като AI се оценява по осем различни параметъра, е малко вероятно да мине за човек, дори ако се представя по-добре от средното в определени бенчмаркове. Например ChatGPT може да решава математически проблеми, да описва изображения и да разговаря на естествен език като човешки, но няма да се справи с други категории, дефинирани в рамката за класификация на AI.

Тестът на Тюринг не е окончателен

Тестът на Тюринг е предназначен да бъде повече мисловен експеримент, отколкото убедителен тест за разграничаване между хората и ИИ. Когато беше предложено първоначално, това беше основният еталон за измерване на машинния интелект.

Въпреки това, с неотдавнашното развитие на AI модели с говорни, визуални и слухови интерактивни възможности, тестът на Тюринг не успява, тъй като е ограничен до текстов разговор. Най-ефективното решение би било да се въведат алтернативи на теста на Тюринг, които допълнително разграничават AI моделите от хората.