MidJourney срещу Stable Diffusion срещу Bing Image Creator

Изкуственият интелект променя света на изкуството по забележителни начини. Едно от завладяващите приложения на AI в сегмента на изкуството е чрез използването на генератори на описателно изкуство. Тези генератори имат способността да изследват и интерпретират изображения и да генерират напълно нови произведения на изкуството въз основа на техния анализ.

В тази статия обсъждаме три такива генератора на изкуство с изкуствен интелект: MidJourney, Stable Diffusion и Microsoft Bing Image Creator и кой от трите излиза на първо място в генерирането на най-добри резултати въз основа на подкани.

Съдържание

MidJourney

MidJourney, основана от Дейвид Холц, е генератор на изкуство с изкуствен интелект, който използва машинно обучение за идентифициране на модели и характеристики в съществуващи произведения на изкуството, които след това могат да бъдат използвани за създаване на нови произведения.

  Как да гледате TATA IPL 2022 безплатно в Индия

MidJourney влезе в отворена бета версия на 12 юли 2022 г. Преди да пусне MidJourney, Холц е съосновател на Leap Motion, стартираща компания, която трансформира потребителските интерфейси чрез използване на заснемане на видео и жестове с ръце. През 2019 г. той продаде Leap Motion на Ultrahaptics.

След като MidJourney набира популярност, Холц споделя своите прозрения за технологиите и тяхното влияние върху изкуството и обществото. Холц гледа на артистите като на клиенти на MidJourney, а не като на конкуренти, и вярва, че платформата може да улесни по-голяма креативност и експериментиране във фазата на идеята.

Съществуват обаче опасения за потенциално нарушаване на авторски права от набора за обучение на MidJourney, който може да включва защитени с авторски права произведения на други артисти.

Холц подчертава, че MidJourney е предназначен да подобри човешките способности, а не да ги замени. Той го оприличава на автомобилите, обяснявайки, че това, че колите са по-бързи от хората, не означава, че трябва да си отрежем краката.

Използвайки генерирането на AI изображения на MidJourney, художниците могат да изследват нови възможности и да генерират множество идеи, преди да създадат свои собствени творби.

  Как да анулирате членство в Costco

Стабилна дифузия

Stable Diffusion е модел за машинно обучение с отворен код, който може да генерира изображения от текст, да променя изображения въз основа на текст или да попълва детайли в изображения с ниска разделителна способност или ниска детайлност. Той е обучен на милиарди изображения и може да произведе резултати, които са сравними с тези, които бихте получили от DALL-E 2 и MidJourney.

Emad Mostaque, основател и главен изпълнителен директор на Stability AI, е компанията, отговорна за Stable Diffusion. Stable Diffusion е модел на латентна дифузия, разработен от групата CompVis в LMU Мюнхен, и е проектиран от Патрик Есер и Робин Ромбах, които преди това са създали архитектурата на модела на латентна дифузия, използвана от Stable Diffusion.

Сътрудничеството между Stability AI, CompVis LMU, Runway, EleutherAI и LAION направи Stable Diffusion достъпен за обществеността.

Стабилната дифузия може да бъде внедрена на различни платформи, включително устройства с Windows и Apple. Използването на внедряване на устройство в приложение може да защити поверителността на потребителите, което е за предпочитане пред базирания на сървър подход.

Microsoft Bing Image Creator

Microsoft представи нов инструмент, наречен Bing Image Creator, който дава възможност на потребителите да създават свои собствени изображения директно в Microsoft Edge. Компанията пусна набор от инструменти за творци, предназначени да разпалят креативността и себеизразяването. Инструментът позволява на потребителите да създават персонализирани изображения, за да споделят своите актуализации от живота или за всяка друга цел, от която може да се нуждаят.

  Ръководство за Bash масиви

Потребителите могат лесно да получат достъп до Image Creator от страничната лента на Microsoft Edge. Microsoft е предприела проактивни мерки, за да гарантира, че инструментът се използва отговорно и не улеснява разпространението на обидно съдържание.

Компанията е задала политика за съдържание, която забранява използването на Image Creator за определени случаи и потребителите могат да докладват за всяко нарушение на тази политика. Освен това Microsoft е внедрила технология за справяне с потенциални отклонения, които биха могли да възникнат в технологията за генериране на изображения.

В тази статия ще тръгнем на пътешествие, за да оценим резултатите от всеки описателен AI генератор на изображения, когато бъдете подканени с идентични текстови подкани.

Подсказка 1: Съвременен Дядо Коледа на шейна, теглен от елени в топъл, ярък слънчев ден на магистрала

Подсказка 2: Близък план на животно с големи очи, улавящ неговата невинност и сладост

Подсказка 3: Човек-астронавт, играещ кацане на нова планета, е добре дошъл от враждебни извънземни същества, които изваждат оръжията си

Подсказка 4: Модерно абстрактно изкуство на корица на книга на роман, базиран в Ню Йорк, в ярки ярки цветове

Подсказка 5: Човек избира между две чинии – една с пица и друга с чийзбургер върху нея

Подсказка 6: Ранен воин, яздещ коня си по заснежена планина с меч в ръка

Подсказка 7: Абстрактно изображение, използващо различни нюанси, което показва движението и потока на водата

Подсказка 8: Сьомга в река с тучни зелени дървета на заден план

Подсказка 9: Чаша вода на маса с лимон, изстискан в нея с ръка

Подсказка 10: Изглед на хоризонта в пустиня от гледна точка на хора, яздещи слон в нея

Подсказка 11: Гора, в която хартиените пари растат по дърветата, а птиците са направени от монети

Подсказка 12: Купа рамен, цветно засенчване, вечерно осветление, фотореалистично

Подсказка 13: Илон Мъск е беден и безработен

Присъда

При оценката на резултатите от MidJourney, Stable Diffusion и Bing Image Creator е очевидно, че няма окончателен победител.

Всеки генератор интерпретира подканите по различен начин, с прилики, открити в резултатите на Bing Image Creator и MidJourney. Стабилната дифузия е ефективна, когато подканите имат ясни описания, но често приемат думите твърде буквално. Докато MidJourney и Bing Image Creator като цяло са успешни, те понякога дават резултати, които не съответстват на подканите.

Трябва да се отбележи, че Bing Image Creator внимава при генерирането на всякакви злоупотреби или подстрекателски резултати, като издава предупредително съобщение, когато бъде подканен да създаде изображение на беден и безработен Илон Мъск. Възприемането на такива защитни мерки от Microsoft е похвално.

Междувременно експертният опит на MidJourney в областта на невронните мрежи генерира образ на беден и изоставен Илон Мъск. Следователно може да се заключи, че всеки генератор ще се погрижи за съответната си потребителска база.