DALL-E 3: nová verzia AI, ktorá vytvára čokoľvek, čo si predstavujete

Rôzne obrázky dall e

Už sme sa rozprávali pri inej príležitosti DALL-E. Pri tejto príležitosti sa objavuje jeho tretia verzia. DALL-E3 je názov novej verzie umelej inteligencie OpenAI ktorý z textu vytvára obrázky. Toto je evolúcia DALL-E, ktorá bola predstavená v januári 2021 a už prekvapila svet svojou schopnosťou generovať obrázky takých rôznorodých konceptov. ako tučniak s klobúkom alebo avokádo v tvare stoličky. DALL-E 3 výrazne zlepšuje výkon a možnosti svojho predchodcu a ponúka realistickejšie, detailnejšie a konzistentnejšie obrázky s poskytnutým textom.

Okrem toho, natívne sa integruje s ChatGPT, chatbot založený na GPT-3, ktorý vám umožňuje chatovať s umelou inteligenciou a požiadať ju, aby vytvorila obrázky podľa našich pokynov. V tomto článku vám to prezradíme ako funguje DALL-E 3, aké nové funkcie prináša v súvislosti s DALL-E, aký typ obrázkov dokáže vytvárať a aké dôsledky má táto technológia pre budúcnosť dizajnu a komunikácie.

Ako funguje DALL-E 3?

Dall e obraz astronauta

DALL-E3 Ide o model umelej inteligencie založený na umelé neurónové siete, konkrétne v takzvaných transformátoroch, ktoré sú schopné spracovať sekvencie údajov, ako je text alebo obrázky, a naučiť sa vzťahy medzi nimi.

Tento model bol trénovaný s veľkým počtom párov text-obrázok, extrahované z internetu, aby ste sa naučili spájať vizuálne pojmy so slovami. Týmto spôsobom, keď dostane text, dokáže pomocou vlastnej kreativity a predstavivosti vytvoriť obrázok, ktorý ho ilustruje.

Prijímajte text aj obrázok ako jeden dátový tok, zložený z maximálne 1280 tokenov. Token je akýkoľvek symbol diskrétnej slovnej zásoby; Napríklad každé písmeno abecedy je token. Slovná zásoba DALL-E 3 má tokeny pre text aj obrázok. Text je reprezentovaný pomocou maximálne 256 tokenov zakódovaných pomocou BPE (Byte Pair Encoding) a obrázok je reprezentovaný pomocou 1024 tokenov zakódovaných pomocou VQ-VAE (vektorový kvantovaný variačný autokóder).

DALL-E 3 je trénovaný pomocou metódy maximálnej pravdepodobnosti, ktorá pozostáva z generovania všetkých tokenov jeden po druhom, čím sa maximalizuje pravdepodobnosť každého z predchádzajúcich. Týmto spôsobom DALL-E 3 môžete vytvoriť obrázok od začiatkualebo vygenerujte akúkoľvek časť existujúceho obrázka, ktorá siaha do pravého dolného rohu, pokiaľ je v súlade s textom.

Aké novinky prináša?

Veža, ktorú vyrobil Dall e

DALL-E 3 predpokladá veľký pokrok v porovnaní s DALL-E vo viacerých aspektoch. Po prvé, DALL-E 3 má vyššie rozlíšenie a kvalitu obrázkov, ktoré generuje. Zatiaľ čo DALL-E vytvoril obrázky 256 × 256 pixelov, DALL-E 3 vytvára obrázky 512 × 512 pixelov, čo vám umožní lepšie oceniť detaily a textúry.

Po druhé, DALL-E 3 má a väčšie pochopenie a presnosť pri interpretácii poskytnutého textu. Dokáže lepšie zachytiť nuansy a špecifikácie textu, ako aj vzťahy medzi prvkami, ktoré tvoria obraz. Napríklad, môžete vytvárať obrázky s textom vo vnútri, ako sú plagáty alebo štítky, rešpektujúc jazyk a formát textu. Môžete tiež vytvárať obrázky s realistickejšími a proporcionálnejšími časťami ľudského tela, ako sú ruky alebo nohy.

Po tretie, DALL-E 3 má väčšiu integráciu a jednoduchosť vďaka prepojeniu s ChatGPT. ChatGPT je chatbot spoločnosti OpenAI založený na GPT-3, najpokročilejšom jazykovom modeli na svete, ktorý vám umožňuje chatovať s umelou inteligenciou a žiadať ju, aby robila veci. Integráciou s ChatGPT, DALL-E 3 môžete získať podrobnejšie pokyny a jasné obrázky na vytváranie obrázkov, ako aj poskytovanie prirodzenejšej a plynulejšej spätnej väzby pre používateľa.

Aké obrázky dokáže DALL-E 3 vytvoriť?

Ďalej a maľovanie

DALL-E3 dokáže vytvárať obrazy širokej škály pojmov, ktoré možno vyjadriť v prirodzenom jazyku. Niektoré príklady:

  • Obrázky antropomorfizovaných predmetov alebo zvierat, teda s ľudskými vlastnosťami. Napríklad mačka v obleku a kravate, alebo slon v okuliaroch a klobúku.
  • Obrázky hybridných predmetov alebo zvierat, to znamená s kombinovanými charakteristikami dvoch alebo viacerých druhov. Napríklad pes s motýlími krídlami, alebo had s hlavou leva.
  • Obrázky upravených predmetov alebo zvierat, teda so zmenenými alebo pridanými vlastnosťami. Napríklad auto so syrovými kolesami, alebo kvet so sklenenými lupeňmi.
  • obrázky imaginárnych predmetov alebo zvierat, to znamená, že v skutočnosti neexistujú. Napríklad ružový jednorožec, alebo ohnivý drak.
  • Obrázky fiktívnych scén alebo krajiny, teda nezodpovedajú žiadnemu reálnemu miestu. Napríklad plávajúce mesto na oblohe alebo začarovaný les.
  • Obrázky z transformácií alebo manipulácií s existujúcimi obrázkami, to znamená, že zmenia niektorý aspekt pôvodného obrázka. Napríklad zmena farby vlasov alebo očí osoby alebo pridanie alebo odstránenie niečoho z obrázka.

Aké dôsledky má DALL-E 3?

Farebná polievka vyrobená v AI

DALL-E 3 je príkladom obrovského potenciálu, ktorý má umelá inteligencia v tejto oblasti dizajn a komunikácia. S DALL-E 3 sa otvára možnosť vytvárania personalizovaných a originálnych obrázkov jednoduchým napísaním frázy, ktorá môže mať viacero praktických aplikácií a kreatívny.

Napríklad DALL-E 3 možno použiť na:

  • Vytvárajte ilustrácie pre knihy, časopisy alebo blogy.
  • Vytvárajte logá alebo plagáty pre značky alebo udalosti.
  • Vytvorte si avatarov alebo emotikony pre sociálne siete alebo hry.
  • Vytvorte memy alebo nálepky zdieľať s priateľmi.
  • Vytvorte náčrty alebo prototypy pre umelecké alebo profesionálne projekty.
  • Vytvárajte vzdelávacie obrázky alebo informatívne na vysvetlenie zložitých pojmov.

DALL-E 3 však prináša aj určité výzvy a riziká, ktoré treba vziať do úvahy. Na jednej strane DALL-E 3 môže ovplyvniť prácu a uznanie ľudských dizajnérov a umelcov, ktorí mohli vidieť, že ich kreativita a originalita sú ohrozené strojom. Na druhej strane môže DALL-E 3 uľahčiť vytváranie a šírenie nepravdivého alebo zavádzajúceho obsahu, ako sú deepfakes alebo falošné správy, čo by mohlo mať negatívne dôsledky pre spoločnosť.

Vaša predstavivosť, teraz bez bariér

Robot generovaný AI

DALL-E 3 je nová verzia Umelá inteligencia OpenAI ktorý vytvára obrázky z textu. DALL-E 3 zlepšuje kvalitu a presnosť obrázkov, ktoré generuje, ako aj jeho integráciu s ChatGPT. Môžete vytvárať neuveriteľné obrazy širokej škály konceptov, ktoré možno vyjadriť v prirodzenom jazyku. DALL-E 3 má veľký potenciál pre dizajn a komunikáciu, ale predstavuje aj určité výzvy a riziká, ktoré treba vziať do úvahy.


Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Zodpovedný za údaje: Miguel Ángel Gatón
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.