Paano gumagana ang ChatGPT?

Ang ChatGPT ay isa sa mga pinakasikat na bagong tool na pinapagana ng AI, ngunit ang mga algorithm na gumagana sa background ay aktwal na nagpapagana ng isang buong hanay ng mga app at serbisyo mula noong 2020. Kaya para maunawaan kung paano gumagana ang ChatGPT, kailangan nating magsimula sa pamamagitan ng pag-uusap tungkol sa pinagbabatayan na wika engine na nagpapagana nito.

Ang GPT sa ChatGPT ay kadalasang GPT-3, o ang Generative Pre-trained Transformer 3, bagama't available na ang GPT-4 para sa mga subscriber ng ChatGPT Plus—at malamang na magiging mas laganap sa lalong madaling panahon. Ang mga modelo ng GPT ay binuo ng OpenAI (ang kumpanya sa likod ng ChatGPT at ang image generator na DALL·E 2), ngunit pinapagana nila ang lahat mula sa mga feature ng AI ng Bing hanggang sa mga tool sa pagsulat tulad ng Jasper at Copy.ai. Sa katunayan, karamihan sa mga AI text generator na available sa ngayon ay gumagamit ng GPT-3, at malamang na mag-aalok ng GPT-4 bilang susunod na hakbang.

Dinala ng ChatGPT ang GPT-3 sa limelight dahil ginawa nitong simple ang proseso ng pakikipag-ugnayan sa isang AI text generator at—pinaka-importante—libre sa lahat. Dagdag pa, isa itong chatbot, at nagustuhan ng mga tao ang isang magandang chatbot mula noong SmarterChild.

Habang ang GPT-3 at GPT-4 ay ang pinakasikat na Large Language Models (LLMs) sa ngayon, sa susunod na ilang taon, malamang na magkaroon ng mas maraming kumpetisyon. Ang Google, halimbawa, ay mayroong Bard —ang AI chatbot nito—na pinapagana ng sarili nitong engine ng wika na Pathways Language Model (PaLM 2). Ngunit sa ngayon, ang handog ng OpenAI ay ang de facto na pamantayan ng industriya. Ito lang ang pinakamadaling tool para makuha ng mga tao ang kanilang mga kamay.

Kaya ang sagot sa "paano gumagana ang ChatGPT?" ay karaniwang: GPT-3 at GPT-4. Ngunit maghukay tayo ng kaunti pa.

Ano ang ChatGPT?

Ang ChatGPT ay isang app na binuo ng OpenAI. Gamit ang mga modelo ng wikang GPT, masasagot nito ang iyong mga tanong, magsulat ng kopya, mag-draft ng mga email, makipag-usap, magpaliwanag ng code sa iba't ibang programming language, magsalin ng natural na wika sa code, at higit pa—o kahit man lang subukan—lahat batay sa natural na wika sinenyasan kang pakainin ito. Ito ay isang chatbot, ngunit isang talagang, talagang mahusay.

Bagama't cool na makipaglaro kung, sabihin nating, gusto mong magsulat ng isang Shakespearean sonnet tungkol sa iyong alagang hayop o makakuha ng ilang ideya para sa mga linya ng paksa para sa ilang mga email sa marketing, ito ay mabuti rin para sa OpenAI. Ito ay isang paraan upang makakuha ng maraming data mula sa mga totoong user at nagsisilbing isang magarbong demo para sa kapangyarihan ng GPT, na maaaring makaramdam ng kaunting malabo maliban kung ikaw ay malalim sa machine learning.

Sa ngayon, nag-aalok ang ChatGPT ng dalawang modelo ng GPT. Ang default, GPT-3.5, ay hindi gaanong malakas ngunit magagamit ng lahat nang libre. Ang mas advanced na GPT-4 ay limitado sa mga subscriber ng ChatGPT Plus, at kahit na nakakakuha lang sila ng limitadong bilang ng mga tanong araw-araw.

Ang isa sa malaking feature ng ChatGPT ay ang pag-alala nito sa pakikipag-usap mo dito. Nangangahulugan ito na maaari itong kumuha ng konteksto mula sa anumang tinanong mo noon at pagkatapos ay gamitin iyon upang ipaalam ang pakikipag-usap nito sa iyo. Maaari ka ring humiling ng mga rework at pagwawasto, at ito ay magre-refer pabalik sa anumang tinalakay mo noon. Ginagawa nitong parang isang tunay na pabalik-balik ang pakikipag-ugnayan sa AI.

Kung gusto mong talagang maramdaman ito, pumunta at gumugol ng limang minuto sa paglalaro sa ChatGPT ngayon (libre ito!), at pagkatapos ay bumalik upang basahin ang tungkol sa kung paano ito gumagana.

Paano gumagana ang ChatGPT?

Ang napakalaking dataset na ito ay ginamit upang bumuo ng isang malalim na pag-aaral ng neural network [ ... ] na itinulad sa utak ng tao—na nagbigay-daan sa ChatGPT na matuto ng mga pattern at relasyon sa data ng text [ ... ] na hinuhulaan kung anong teksto ang dapat na susunod sa anumang ibinigay na pangungusap .

Gumagana ang ChatGPT sa pamamagitan ng pagsubok na unawain ang iyong prompt at pagkatapos ay maglalabas ng mga string ng mga salita na hinuhulaan nitong pinakamahusay na sasagot sa iyong tanong, batay sa data kung saan ito pinagsanayan.

Talagang pag-usapan natin ang pagsasanay na iyon. Ito ay isang proseso kung saan ang nascent AI ay binibigyan ng ilang mga pangunahing panuntunan, at pagkatapos ay ilalagay ito sa mga sitwasyon o bibigyan ng maraming data upang gawin upang makabuo ng sarili nitong mga algorithm.

Ang GPT-3 ay sinanay sa humigit-kumulang 500 bilyong "mga token," na nagbibigay-daan sa mga modelo ng wika nito na mas madaling magtalaga ng kahulugan at mahulaan ang posibleng follow-on na text. Maraming salita ang nagmamapa sa mga iisang token, bagaman ang mas mahaba o mas kumplikadong mga salita ay kadalasang nahahati sa maraming token. Sa karaniwan, ang mga token ay humigit-kumulang apat na character ang haba. Ang OpenAI ay nanatiling tahimik tungkol sa mga panloob na gawain ng GPT-4, ngunit maaari naming ligtas na ipagpalagay na ito ay sinanay sa halos parehong dataset dahil ito ay mas malakas.

Ang lahat ng mga token ay nagmula sa isang napakalaking corpus ng data na isinulat ng mga tao. Kasama rito ang mga aklat, artikulo, at iba pang mga dokumento sa lahat ng iba't ibang paksa, istilo, at genre—at hindi kapani-paniwalang dami ng content na na-scrap mula sa bukas na internet. Talaga, pinahintulutan itong mag-crunch sa kabuuan ng kaalaman ng tao.

Ang napakalaking dataset na ito ay ginamit upang bumuo ng isang malalim na pag-aaral ng neural network—isang kumplikado, maraming layer, at may timbang na algorithm na itinulad sa utak ng tao—na nagbigay-daan sa ChatGPT na matuto ng mga pattern at relasyon sa data ng text at mag-tap sa kakayahang lumikha ng katulad ng tao. mga tugon sa pamamagitan ng paghula kung anong teksto ang dapat na susunod sa anumang ibinigay na pangungusap.

Kahit na talaga, na massively undersells bagay. Ang ChatGPT ay hindi gumagana sa antas ng pangungusap—sa halip, ito ay bumubuo ng teksto ng kung anong mga salita, pangungusap, at maging mga talata o saknong ang maaaring sundin. Hindi ito ang predictive na text sa iyong telepono na tahasang hinuhulaan ang susunod na salita; sinusubukan nitong lumikha ng ganap na magkakaugnay na mga tugon sa anumang prompt.

Upang higit pang pinuhin ang kakayahan ng ChatGPT na tumugon sa iba't ibang mga senyas, na-optimize ito para sa pag-uusap gamit ang isang pamamaraan na tinatawag na reinforcement learning na may feedback ng tao (RLHF). Sa pangkalahatan, ang mga tao ay lumikha ng isang modelo ng reward na may data ng paghahambing (kung saan ang dalawa o higit pang mga tugon ng modelo ay niraranggo ng mga tagapagsanay ng AI), upang malaman ng AI kung alin ang pinakamahusay na tugon.

Bumalik sa neural network na nabuo nito. Batay sa lahat ng pagsasanay na iyon, ang neural network ng GPT-3 ay may 175 bilyong parameter o variable na nagbibigay-daan dito na kumuha ng input—ang iyong prompt—at pagkatapos, batay sa mga value at weighting na ibinibigay nito sa iba't ibang mga parameter (at isang maliit na halaga ng randomness ), naglalabas ng anumang sa tingin nito ay pinakamahusay na tumutugma sa iyong kahilingan. Hindi sinabi ng OpenAI kung gaano karaming mga parameter ang mayroon ang GPT-4, ngunit ito ay isang ligtas na hulaan na ito ay higit sa 175 bilyon at mas mababa kaysa sa dating-usap-usapan na 100 trilyong parameter. Anuman ang eksaktong numero, ang mas maraming parameter ay hindi awtomatikong nangangahulugang mas mahusay. Ang ilan sa tumaas na kapangyarihan ng GPT-4 ay malamang na nagmumula sa pagkakaroon ng higit pang mga parameter kaysa sa GPT-3, ngunit malamang na marami ang nakasalalay sa mga pagpapabuti sa kung paano ito sinanay.

Sa huli, ang pinakasimpleng paraan upang isipin ito ay tulad ng isa sa mga larong "tapusin ang pangungusap" na nilalaro mo noong bata pa.

Sa huli, ang pinakasimpleng paraan upang isipin ito ay tulad ng isa sa mga larong "tapusin ang pangungusap" na nilalaro mo noong bata pa. Halimbawa, noong binigyan ko ang ChatGPT gamit ang GPT-3 ng prompt, "Zapier is..." tumugon ito na nagsasabing:

"Ang Zapier ay isang web-based na automation tool na nagbibigay-daan sa mga user na ikonekta ang iba't ibang web application nang magkasama upang i-automate ang mga paulit-ulit na gawain at pagbutihin ang mga daloy ng trabaho."

Iyan ang uri ng pangungusap na mahahanap mo sa daan-daang artikulo na naglalarawan sa ginagawa ni Zapier, kaya makatuwiran na ito ang uri ng bagay na ibinubuhos dito. Ngunit nang bigyan ito ng aking editor ng parehong prompt, sinabi nito:

"Ang Zapier ay isang web-based na automation tool na nagbibigay-daan sa mga user na ikonekta ang iba't ibang web application at i-automate ang mga workflow sa pagitan nila."

Iyan ay medyo magkatulad, ngunit ito ay hindi eksakto ang parehong tugon. Ang pagiging random na iyon (na maaari mong kontrolin sa ilang GPT-3 na app na may setting na tinatawag na "temperatura") ay nagsisiguro na ang ChatGPT ay hindi lamang tumutugon sa bawat solong tugon kung ano ang halaga ng isang stock na sagot. Pinapatakbo nito ang bawat prompt sa buong neural network sa bawat oras, at nagpapagulong-gulong ng ilang dice dito at doon upang panatilihing sariwa ang mga bagay. Hindi malamang na simulan ang pag-claim na ang Zapier ay isang kulay mula sa Mars, ngunit paghaluin nito ang mga sumusunod na salita batay sa kanilang mga kamag-anak na posibilidad.

(Para sa kung ano ang halaga nito, kapag tumatakbo sa GPT-4, sinabi ng ChatGPT: " Ang Zapier ay isang web-based na automation tool na nagpapahintulot sa mga user na isama at i-automate ang mga gawain sa pagitan ng iba't ibang mga online na application at serbisyo." Parehong pareho!)

Naglalabas ng mga salita, hindi kaalaman

Ang mga gumagawa ng ChatGPT ang unang nagsabi na maaari itong makagawa ng hindi tama (at posibleng nakakapinsala) na impormasyon, kahit na nagsusumikap silang ayusin ito.

Narito ang isang magandang halimbawa. Nang tanungin ko ang ChatGPT gamit ang GPT-3 at GPT-4 na tumugon sa "Harry Guinness ay..." unang sumagot ang GPT-3 sa pamamagitan ng pagtatanong kung aling Harry Guinness. Napakagandang tanong—talagang dalawa kami! Kaya sabi ko, "Harry Guinness the writer" (ako yan). Nahulaan agad ng GPT-4 kung sino ako, kahit na ang parehong mga tugon ay kaakit-akit:

GPT-3: Si Harry Guinness ay isang freelance na manunulat at mamamahayag na nakabase sa Ireland. Sumulat siya para sa iba't ibang publikasyon, kabilang ang The New York Times, The Guardian, The Huffington Post, at Popular Mechanics. Sinasaklaw niya ang mga paksa mula sa teknolohiya at photography hanggang sa paglalakbay at kultura.

GPT-4: Si Harry Guinness ay isang Irish na manunulat, photographer, at eksperto sa teknolohiya. Sumulat siya para sa iba't ibang publikasyon, kabilang ang How-To Geek, Lifehacker, at Tuts+. Ang kanyang trabaho ay pangunahing nakatuon sa teknolohiya, mga tutorial, at mga tip, pati na rin sa pagkuha ng litrato at pag-edit ng larawan. Ang Guinness ay bumuo ng isang reputasyon para sa paglikha ng mga detalyadong gabay na makakatulong sa mga mambabasa na maunawaan ang mga kumplikadong paksa o malutas ang mga problema sa isang tuwirang paraan.

Ang una at huling mga linya ng GPT-3 ay halos kinukuha mula sa aking iba't ibang mga website at bios ng may-akda sa buong web (bagaman karaniwan kong inililista ang aking sarili bilang isang freelance na manunulat at photographer, hindi isang mamamahayag). Ngunit ang listahan ng mga publikasyon ay karaniwang binubuo. Sumulat ako para sa The New York Times , ngunit hindi para sa The Guardian , The Huffington Post , o Popular Mechanics (regular akong nagsusulat para sa Popular Science , kaya maaaring kung saan iyon nanggaling).

Nakukuha ng GPT-4 nang tama ang bahagi ng photographer at aktwal na naglilista ng ilang publikasyong sinulatan ko, na kahanga-hanga, kahit na hindi sila ang pinakapinagmamalaki ko. Isa itong magandang halimbawa kung paano napataas ng OpenAI ang katumpakan ng GPT-4 na may kaugnayan sa GPT-3, kahit na hindi ito palaging nag-aalok ng pinakatamang sagot.

Ngunit bumalik tayo sa GPT-3 dahil ang error nito ay nagbibigay ng isang kawili-wiling halimbawa ng kung ano ang nangyayari sa likod ng mga eksena sa ChatGPT. Wala talaga itong alam tungkol sa akin. Ito ay hindi kahit na kopya / i-paste mula sa internet at pagtitiwala sa pinagmulan ng impormasyon. Sa halip, hinuhulaan lang nito ang isang string ng mga salita na susunod na darating batay sa bilyun-bilyong data point na mayroon ito.

Halimbawa: Ang New York Times ay mas madalas na nakagrupo sa The Guardian at The Huffington Post kaysa sa mga lugar na sinulatan ko, tulad ng Wired , Outside , The Irish Times , at, siyempre, Zapier. Kaya kapag kailangan nitong gawin kung ano ang dapat sundin mula sa The New York Times , hindi ito humihila mula sa nai-publish na impormasyon tungkol sa akin; kinukuha nito ang listahan ng malalaking publikasyon mula sa lahat ng data ng pagsasanay na mayroon ito. Ito ay napakatalino at mukhang kapani-paniwala, ngunit hindi ito totoo.

Ang GPT-4 ay gumagawa ng isang mas mahusay na trabaho at ipinako ang mga publikasyon, ngunit ang iba pa sa kung ano ang sinasabi nito ay talagang parang mga makatotohanang follow-on na mga pangungusap. Sa palagay ko ay wala itong malaking pagpapahalaga sa aking reputasyon: sinasabi lang nito ang uri ng bagay na sinasabi ng isang bio. Ito ay mas mahusay sa pagtatago kung paano ito gumagana kaysa sa GPT-3, kahit na ito ay aktwal na gumagamit ng halos parehong pamamaraan.

Gayunpaman, talagang kahanga-hanga kung gaano kalaki ang napabuti ng GPT. Sa ngayon, ang GPT-4 ay naka-lock sa likod ng isang premium na subscription, kaya karamihan sa ChatGPT content na makikita mo ay aasa sa GPT-3, ngunit maaaring magbago iyon sa susunod na panahon. Sino ang nakakaalam kung ano ang dadalhin ng GPT-5.

Ano ang ChatGPT API?

Ang OpenAI ay walang just-us attitude sa teknolohiya nito. Ang kumpanya ay may isang platform ng API na nagpapahintulot sa mga developer na isama ang kapangyarihan ng ChatGPT sa kanilang sariling mga app at serbisyo (para sa isang presyo, siyempre).

Ginagamit ng Zapier ang ChatGPT API upang paganahin ang sarili nitong pagsasama ng ChatGPT, na nagbibigay-daan sa iyong ikonekta ang ChatGPT sa libu-libong iba pang app at magdagdag ng AI sa iyong mga kritikal na daloy ng trabaho sa negosyo. Narito ang ilang mga halimbawa upang makapagsimula ka, ngunit maaari mong i-trigger ang ChatGPT mula sa karaniwang anumang app.

Maaari mo ring gamitin ang iba pang mga modelo ng OpenAI—tulad ng DALL·E at Whisper—na may pagsasama ng OpenAI ng Zapier. I-automate ang mga workflow na may kinalaman sa pagbuo ng larawan at transkripsyon ng audio, mula mismo sa mga app na ginagamit mo na.

Kaugnay na pagbabasa: Paano mo (at kapag hindi mo dapat) gamitin ang ChatGPT upang magsulat ng kopya ng marketing

Paano gumagana ang ChatGPT?

Ano ang ChatGPT?

Paano gumagana ang ChatGPT?

Naglalabas ng mga salita, hindi kaalaman

Ano ang ChatGPT API?

Kaugnay na mga Artikulo