ChatGPT-4 срещу ChatGPT-3.5 по подразбиране срещу ChatGPT-3.5 Legacy: Тествани разлики

Очаква се ChatGPT 4.0 да предизвика големи вълни във вселената на чатботовете. Но наистина ли превъзхожда своя предшественик? Нека проверим.

ChatGPT беше само върхът на предстоящия айсберг за автоматизация, като Google, Microsoft и много други компании, които са първи в сферата на изкуствения интелект, последваха примера им.

Като за начало открихме няколко чатбота като ChatGPT, много от които не принадлежат към големите технологии.

Но го наречете силата на маркетинга; ChatGPT все още е управляващият крал на всички подобни AI ботове. Може да прави много неща, включително математика, поезия и публикации в блогове, а хората дори го използват, за да завеждат дела.

DoNotPay работи върху използването на GPT-4 за генериране на „съдебни дела с едно щракване“, за да съди роботизирани потребители за $1500. Представете си, че получавате обаждане, щракнете върху бутон, обаждането се транскрибира и се генерира дело от 1000 думи. GPT-3.5 не беше достатъчно добър, но GPT-4 се справи изключително добре със задачата: pic.twitter.com/gplf79kaqG

— Джошуа Браудър (@jbrowder1) 14 март 2023 г

Има десетки професионалисти, които се тревожат, че наборът им от умения ще стане безполезен в близко бъдеще.

Въпреки това прочетох публикация в Linkedin, която казва:

AI няма да ви замени, но човек, използващ AI, може.

И така, стискаме палци, нека се запознаем с най-новата актуализация на ChatGPT и да видим как се различава от предишните си версии.

Съдържание

ChatGPT: наследство, по подразбиране и актуализация

Така че има три версии, достъпни за платените потребители: Legacy (3.5), Default (3.5) и скорошната актуализация на ChatGPT (4).

Въпреки че ще навлезем малко по-дълбоко в техните възможности, това е, което OpenAI има да каже за разликите:

Източник: OpenAI

И така, докато безплатните потребители имат само Legacy 3.5, с който да играят, премиум абонаментът предлага и трите, които да опитат и да се задоволят с това, което потребителите смятат за най-доброто.

За да обобщим предходното изображение, платените планове са за получаване на по-точни резултати при прилична скорост. Разликите обаче са очевидни само ако подканите са сложни и се нуждаят от творчество.

ParameterChatGPT 4ChatGPT 3.5Bar Резултат от изпит Топ 10%Долни 10%AI2 Reasoning Challenge (ARC)96.3%85.2%Python кодиране Резултат67%48.1%Визуална интерпретацияДаНеКонтекстНад 25k думиПо-малкоИзточник: OpenAI

Освен това ChatGPT 4 може да приема визуални входове.

Е, стига с определенията от учебниците. Нека си изцапаме ръцете и да оценим тези кандидати на бойното поле в реалния живот.

Допълнителните секции са пълни с изображения, които може да изглеждат неясни. В такъв случай щракнете с десния бутон върху всяко изображение и изберете Отваряне в нов раздел, за да видите правилно.

Математика

Тъй като съм завършил инженерство, не мога да не им хвърля някои основни проблеми. Нека започнем лесно с алгебрични уравнения.

Как да синхронизирате about:config Preferences с Firefox Sync

Етап I

Много от нас са виждали тези уравнения ax2+bx+c=0, където трябва да решим за X. Тук дадох тази проста подкана, Решете за x: x2 + x – 6 = 0

Въпреки че всички дадоха едни и същи корени (X= -3,2), Legacy и Update бяха по-сходни в използването на формулата директно (както всеки ученик ще направи), за да разбере резултата.

Въпреки това, Default 3.5 обяснява два метода, включително разлагане на множители, които обикновено всеки квалифициран ученик използва, когато му бъдат дадени такива светски уравнения.

Етап II

След това го подканвам да реши леко сложно кубично уравнение: x^3 -12x^2 + 48x – 64 = 0.

Това наистина доказа защо ChatGPT 4 е „актуализацията“.

Ето и отговорите:

Целият този шум и ChatGPT Legacy и Default не можаха да решат общо кубично уравнение. Въпреки това, Legacy се справи малко по-добре и намери два корена правилно, докато Default се провали с всички.

Актуализацията беше категоричен победител във втория етап и реши уравнението перфектно, намирайки и трите корена с хубаво обяснение.

Логическо разсъждение

Можем спокойно да предположим, че повечето елементарни математически задачи имат речникови решения. Ако знаете теоремата или формулата, въведете стойностите и получете резултатите.

И ChatGPT, като AI, може да направи бърза работа с такива заявки. Логичните разсъждения обаче са различна територия, с големи шансове AI да се провали.

Етап I

Дадох им класиката:

А е по-стар от Б.
C е по-стар от A.
B е по-стар от C.
Дали третото твърдение е вярно или невярно, ако първите две твърдения са верни?

И всички версии на ChatGPT бяха правилни, като заявиха, че третото твърдение е невярно.

След това използвах имена вместо азбуката и резултатите може да ви изненадат:

И така, Default 3.5 продължи своето представяне под номинала и се обърка с тази скромна вариация. Все пак Legacy и Update се представиха оптимално.

Етап II

Може би вече сте забелязали, че целта на този етап I и етап II е да се намери точката на разликата, където сложността на дадена подкана отделя актуализацията от останалите две.

Тук подканата беше прост логически пъзел:

Една сутрин след изгрев Рохит стоеше с лице към стълб. Сянката на стълба падна точно от дясната му страна. Към коя посока беше обърнат?
а. север
b. запад
° С. юг
д. изток

Това накара Legacy да даде неточен отговор, докато Default отговори с неясни разяснения, водещи до грешно заключение.

Само Актуализацията блесна с правилния отговор, с лесни за следване твърдения.

Писма

Завеждането на съдебни дела може да бъде трудно, но понякога не се стига до това, ако можете да съставите поразително първо известие.

Ето, отидох с тази подкана: Напиши писмо до Тим Кук, за да ми предаде ябълка, защото не отговорих на един от моите туитове.

Смешно, да! Но нека да видим какво може да направи AI от това.

Какви протоколи за сигурност използва WiFi рутерът

Legacy 3.5 веднага прие подканата като робо-роб и извади писмо, което може да ме направи отличен обект на подигравка, ако някога достигне предназначението си.

По подразбиране също не беше добро. Въпреки това, това просто ме затвори, както един сърдит старец би направил с петгодишно дете.

Въпреки че направените аргументи бяха точни, това сложи край на забавлението с малко учене.

Въпреки че това беше достатъчно проста подкана, изискваше малко мисъл и креативност. И това е мястото, където големият брат, актуализацията, направи своя случай:

Първо, това беше написано почти перфектно. Второ, това ми спести търсене в Google за адреса на централата на Apple (въпреки че човек трябва да провери такива записи).

Трето, беше добре написано с официален тон и хумористична нотка. Освен това намерението беше ясно в самата тема.

И все пак, писмото предава чувството на недоволен фен на Apple.

Така че това прави ChatGPT 4 (известен още като Актуализацията) с мили пред старите си братовчеди. Той е плашещо интелигентен и има някои признаци на здрав разум, което го прави нещо повече от тъп, скучен чатбот.

Поезия

С пускането на ChatGPT поезията, мислех си, може да се окаже слабото му място.

В края на краищата са необходими емоции, креативност и много усилия, за да може човек да създаде нещо, което наистина резонира с читателите.

Казано просто, поезията е изкуство в най-добрия си вид и тайно ми се искаше AI да се провали. Но това беше преди колегата ми да удари всички ни в Slack канала на pctechbg.net с ChatGPT творение, което беше преди тази актуализация 4.0.

Етап I

Ето подканата, която дадох на нашите кандидати: „изразете поетично защо или защо не сервирането на бургери, заедно с текущото им меню, може да бъде от полза за веригата пицарии dominos. Нека е по-малко от 100 думи.“

Можете ли да забележите разликата?

Версията на Default беше изключително кратка, само 32 думи и не можеше да използва наличната честотна лента, за да покаже своята креативност.

The Legacy, въпреки че използва най-много думи от трите, заключава, че начинанието да се сервират пици заедно не е рисковано и ще доведе до сигурен успех и в двата случая, което не е съвсем вярно.

Поезията на Актуализацията беше само 53 думи, губейки почти половината от определения брой думи. Все пак беше ясно за наградите и потенциалните клопки и не можа да се стигне до никакъв резултат, което, предполагам, е по-хуманно от останалите.

Етап II

След това ги помолих всички да „обяснят поезията на петгодишно дете“.

Интересното е, че Legacy не можа да вземе контекст от разговора и обясни „Поезия“ буквално. Default взе контекста и го обобщи в параграф, който все още е приличен.

10 най-добри C++ IDE за използване през 2022 г

Продължавайки тенденцията, ChatGPT 4 опрости своята креативност, като същевременно запази поетичния вкус жив.

ChatGPT Premium срещу ChatGPT Free

Безплатен, тъй като е безплатен, му липсва скорост и точност и не е съпоставим с ChatGPT 4, но не е и напълно безполезен.

За да го сравня на равна основа, хвърлих към него същите подкани, с които тествахме Legacy, Default и Update.

🔵 Математика: Решава квадратните уравнения, но дава грешни отговори за кубичното. (като Legacy и Default)

🔵 Логическо разсъждение: Премина първия етап с азбуки и имена, но не успя с втория (като Legacy).

🔵 Писма: Не написах писмото и сметнах подканата за неетична и неподходяща. (като по подразбиране)

🔵 Поезия: Генерира поезия с 30+ думи и я обяснява прилично. (подобно на по подразбиране).

Така че можем да заключим, че безплатната версия също не е лоша. Всъщност той е наравно с Default 3.5 и дори е по-добър в някои аспекти.

Прочетете също: Мощни подкани за подобряване на вашето ChatGPT изживяване

Пътят напред

Слуховете, че AI ще замени работните места в бъдеще, не са напълно погрешни.

Първо, автоматизацията направи това в производствената индустрия, а сега разперва криле навсякъде другаде.

Лично той е много по-бърз от мен при решаването на кубични уравнения, създаването на поезия или писането на писма. Въпреки това фактът, че рядко казва НЕ на подкана и почти не се учи от грешките си, го задържа зад нас, хората.

За да повторим, AI няма да ни замени, но някой, който използва AI, може.

Тук, в pctechbg.net, нашият маркетингов екип използва ChatGPT по интересни начини. Например наскоро достигнахме крайъгълен камък от 100 милиона гледания и нашият главен изпълнителен директор реши да го върне на публиката чрез раздаване.

И предполагам, че момчетата от маркетинга са имали нужда от заглавие, за да привлекат вниманието на читателя. И така, те дадоха една подкана и помолиха ChatGPT да предложи няколко варианта, като този:

Освен това го използваме за обобщаване на съдържанието, проверка на граматиката, предлагане на заглавия за нови статии и какво ли още не.

В заключение, има много начини да се възползвате и да се състезавате пред стереотипите, които виждат AI като безполезен боклук.

Единственото нещо, което трябва да запомните, е, че трябва да има някой (човек), който да преценява работата на AI, тъй като тя може да бъде (много) неточна и подвеждаща.

Актуализацията е наистина нещо!

При моята кратка среща ChatGPT 4 се стори по-креативен, разбиращ и реалистичен. Все пак това е машина и може уверено да дава грешни отговори.

Но това, което е зашеметяващо, е нивото на надграждане, което OpenAI направи на този проект само за няколко месеца.

И нямам търпение да видя магията, с която следващата актуализация може да ни озадачи!

PS: Не само прозорец за чат; впрегнете силата му с тези най-добри ChatGPT разширения за Chrome. И мислили ли сте някога за интегриране на ChatGPT със Siri?