Maaari bang bumuo ng mga larawan ang ChatGPT? Sa kasamaang palad hindi

image1.png

Ang mga Chatbot ay nakakuha ng napakalaking katanyagan sa iba't ibang industriya, na naghahatid ng mga layunin sa entertainment, edukasyon, at serbisyo sa customer. Kabilang sa mga pinakamahusay na modelo ng chatbot ay ang ChatGPT , na binuo ng OpenAI.

Habang ang ChatGPT ay mahusay sa pagbuo ng nilalamang batay sa teksto, narito ka upang malaman kung maaari itong makabuo ng mga larawan. Nakalulungkot, ang sagot ay hindi. Ang ChatGPT ay hindi partikular na idinisenyo upang lumikha ng visual na likhang sining, na tumutuon sa halip sa paggawa ng mga text output batay sa data ng pagsasanay at input nito.

Gayunpaman, ang limitasyong ito ay hindi nangangahulugan na ang lahat ng pag-asa ay mawawala. Magagawa pa rin ng ChatGPT ang isang mahalagang papel sa paglikha ng imahe sa pamamagitan ng proseso ng text-to-image synthesis. Sa pamamagitan ng paggamit ng AI image generator gaya ng DALL·E o Midjourney, na partikular na sinanay para sa pagbuo ng imahe at mga gawain sa pagmamanipula, ang mga descriptive text prompt ay maaaring ibigay ng ChatGPT upang lumikha ng mga larawan batay sa textual input.

Bagama't ang ChatGPT mismo ay walang direktang kakayahan sa pagbuo ng imahe ng AI, ang paggamit sa pagbuo ng teksto nito kasama ng mga dalubhasang modelo ng pagbuo ng imahe ay nagbubukas ng mga posibilidad para sa paglikha ng mga visual batay sa mga tekstong paglalarawan. Ang pagsasamang ito ay nagpapakita ng collaborative na potensyal ng mga teknolohiya ng AI sa paggawa ng mga multi-modal na output.

Mga alternatibong generator ng imahe ng ChatGPT

Bagama't ang ChatGPT mismo ay hindi nagtataglay ng mga kakayahan sa pagbuo ng text-to-image, mayroong iba't ibang mga platform na mahusay sa domain na ito. Ang ilan sa mga AI art generator na ito ay maaaring ma-access nang libre, na nagpapahintulot sa mga user na galugarin ang mga posibilidad ng AI-generated na mga imahe. Narito ang ilang kapansin-pansing mga generator ng imahe ng AI na dapat isaalang-alang:

  1. DALL-E 2: Kilala sa kakayahang gumawa ng mga de-kalidad na larawan batay sa magkakaibang text prompt, ang DALL-E 2 ay isang kilalang image generator. Gayunpaman, hindi na ito magagamit nang libre at nangangailangan ng subscription o pagbabayad na batay sa paggamit.
  2. Midjourney: Malawakang kinikilala para sa malikhain at masining na mga kakayahan sa pagbuo ng larawan, ang Midjourney ay namumukod-tangi bilang isa pang sikat na AI image generator. Nagtataglay ito ng kakayahang gumawa ng mga larawang naaayon sa mga partikular na istilo ng sining, na nag-aalok sa mga user ng kakaibang malikhaing karanasan.
  3. DreamStudio (Stable Diffusion): Bilang isang open-source AI image generator, ang DreamStudio (Stable Diffusion) ay nagbibigay sa mga user ng flexibility at mga opsyon sa pag-customize. Ito ay kilala sa pagbuo ng mga de-kalidad na larawan mula sa malawak na hanay ng mga text prompt. Kapansin-pansin, ang serbisyong ito ay libre at tumatakbo nang mas mabilis kaysa sa DALL-E 2.
  4. Starryai: Isang mahusay na opsyon para sa libreng text-to-picture AI image generator, pinapayagan ng Starryai ang mga user na lumikha ng hanggang limang larawan bawat araw. Nag-aalok ang platform ng iba't ibang mga pagpipilian sa istilo upang umangkop sa mga kagustuhan ng mga gumagamit. Bukod pa rito, nagbibigay ang Starryai ng opsyon na bumili ng mga credit para sa mas malawak na paggamit o i-access ang kanilang serbisyo sa membership na nakabatay sa subscription, ang Starryai Pro.

Ang mga platform ng pagbuo ng imahe ng AI na ito ay nagpapalawak ng mga malikhaing posibilidad at nagpapakita ng mga pagsulong sa text-to-image synthesis. Maaaring galugarin ng mga user ang mga tool na ito upang makabuo ng mga visual na nakakahimok na output batay sa kanilang mga text na input.

Maaari bang lumikha ng mga larawan ang ChatGPT? Hindi pero makakatulong ito

Habang ang ChatGPT ay pangunahing idinisenyo para sa pagbuo ng teksto, mayroong isang hindi direktang paraan upang magamit ang mga kakayahan sa wika nito upang lumikha ng mga larawan. Sa pamamagitan ng pagbibigay sa ChatGPT ng isang mapaglarawang prompt ng nais na larawan, maaari itong makabuo ng isang tekstong paglalarawan, na pagkatapos ay magagamit bilang input para sa mga tool sa pagbuo ng text-to-image gaya ng DeepAI, DALL·E, at Midjourney.

Maaaring gamitin ang diskarteng ito upang mapahusay ang katumpakan ng panghuling larawang ginawa. Upang ilarawan ang pagiging epektibo nito, nagsagawa kami ng eksperimento kung saan nakabuo ang ChatGPT ng mga prompt para sa mga modelo ng AI gaya ng DeepAI, DALL·E, at Midjourney. Ang mga resulta ay kamangha-mangha, dahil ang ChatGPT ay nag-aalok ng detalyado at matingkad na mga senyas na nagbigay-daan sa amin upang makagawa ng nakamamanghang likhang sining. Sa pamamagitan ng mga senyas na ito, nakamit namin ang isang mataas na antas ng pagpapasadya upang bigyang-buhay ang aming pananaw!

Mahalagang bigyang-diin na kahit na may wastong pagsasanay at angkop na prompt, ang ChatGPT lamang ay hindi makakabuo ng mga larawan. Bagama't mahusay ito sa pagbuo ng teksto, ang paglikha ng mga larawan ay nangangailangan ng pakikipagtulungan ng mga modelo ng AI na partikular na sinanay para sa pagbuo ng imahe at mga gawain sa pagmamanipula.

Sa konklusyon, habang ang ChatGPT ay maaaring hindi nagtataglay ng mga intrinsic na kakayahan sa pagbuo ng imahe, maaari pa rin itong magsilbi bilang isang makapangyarihang tool para sa paglikha ng mga visual na nakamamanghang larawan sa pamamagitan ng text-to-image na henerasyon kasama ng mga dalubhasang AI image creator.

Pag-input ng larawan ng ChatGPT

Inihayag kamakailan ng OpenAI ang mga kahanga-hangang multimodal na kakayahan ng GPT-4 na malaking modelo ng wika nito, na nagpapakita ng kakayahang magproseso ng mga senyas na nakabatay sa imahe. Ang pambihirang tagumpay na ito ay kumakatawan sa isang makabuluhang pag-unlad sa larangan ng AI, dahil ang GPT-4 ay nagpapakita ng husay nito sa pag-unawa at pagbibigay-kahulugan sa mga imahe.

Gayunpaman, mahalagang tandaan na ang pag-input ng imahe ay kasalukuyang hindi magagamit sa ChatGPT o kahit na sa ChatGPT Plus, sa kabila ng modelong ito na binuo sa GPT-4 na arkitektura. Gayunpaman, ang pagpapakita ng OpenAI ng multimodal na kapangyarihan ng GPT-4 ay nagmumungkahi na ang tampok na ito ay malamang na ipakilala sa hinaharap.

Sa kasalukuyan, ang eksklusibong pag-access sa input ng imahe para sa GPT-4 ay limitado sa mga developer sa pamamagitan ng GPT-4 API. Sa kasamaang palad, hindi ito naa-access sa pangkalahatang publiko sa ngayon. Habang ang OpenAI ay patuloy na sumusulong sa teknolohiya nito, inaasahan na ang mga kakayahan sa pag-input ng imahe ay magiging mas malawak na magagamit sa mga gumagamit sa hinaharap.

Maaari bang gumawa ng sining ang ChatGPT?

Tulad ng nabanggit na ang ChatGPT ay hindi pinutol para sa paglikha ng visual art sa tradisyonal na kahulugan. Bilang isang bot na bumubuo ng wika, hindi ito makakalikha ng mga larawan. Sa itaas ay naglista kami ng ilang mahuhusay na AI image generator na may kakayahang gumawa ng ilang talagang kamangha-manghang visual.

Ang isang paraan kung saan maaari mong gamitin ang ChatGPT sa paggawa ng likhang sining ay ang paggamit nito upang tumulong sa mga senyas at ideya. Ang ChatGPT ay napakatalino para sa ganitong uri ng bagay. Kung mayroon ka lang malabong ideya na makakatulong sa iyo ang ChatGPT na mabuo ito at gawing isang ganap na plano para sa paglikha ng iyong sariling likhang sining.

Kung sining ang pinag-uusapan natin sa mas malawak na kahulugan ng termino, maaaring interesado ka sa katotohanang maraming tao ang gumagamit ng ChatGPT upang lumikha ng tula at kahit na tumulong sa pagsusulat ng mga kanta. Kung ito ay tunay na sining ay isang mas pilosopiko na tanong kaysa sa tingin namin ay kwalipikadong harapin. Gayunpaman, kung ikaw ay sapat na tiyak sa iyong mga senyas, maaaring mahirap sabihin ang taludtod na binuo ng AI bukod sa pagsulat ng tao!

Maaari bang bumuo ng mga imahe ang GPT-4?

Maraming usapan sa paligid ng mga larawan at GPT-4 kaya't linawin natin ang ilang bagay.

Una sa lahat, ang GPT-4 ay hindi kayang gumawa ng mga imahe. Naka-on ang GPT-4 na may kakayahang bumuo ng mga tugon na nakabatay sa teksto sa iyong mga senyas.

Isa sa mga kapana-panabik na kakayahan na mayroon ang GPT-4 (na wala sa GPT-3.5) ay ang kakayahang magsuri ng mga larawan. Nangangahulugan ito na sa GPT-4 maaari mong i-prompt ang software gamit ang isang imahe at ang GPT-4 ay magpapatuloy sa pagsusuri sa larawang ito para sa iyo. Kung halimbawa, ang imahe ay isang graph, magagawa ng GPT-4 na suriin ang data mula sa graph.

Kaugnay na mga Artikulo

Tingnan Nang Mas Marami >>

I-unlock ang kapangyarihan ng AI gamit ang HIX.AI!