Ipinaunveil ang GPT-4: Narito ang susunod na malaking pagpapabuti ng ChatGPT

Ang mga abilidad ng ChatGPT, tulad ng pagdedebug ng code, pagsusulat ng sanaysay o pagbibigay ng biro, ay nagdulot ng malaking kasikatan nito. Kahit na may mga kakayahang ito, hanggang sa ngayon, limitado ang tulong nito sa teksto -- ngunit magbabago na ito.

No Martes, inilabas ng OpenAI ang GPT-4, isang malaking multimodal na modelo na tumatanggap ng mga input na teksto at imahe at naglalabas ng teksto.

Dagdag pa: Paano gawing magbigay ng mga sanggunian at mga cesita ang ChatGPT

Ang pagkakaiba sa pagitan ng GPT-3.5 at GPT-4 ay "subtle" sa simpleng usapan. Gayunpaman, ang bagong modelo ay mas mahusay sa aspeto ng pagiging maaasahan, pagkamalikhain, at maging sa katalinuhan.

Ayon sa OpenAI, nakakuha ng marka sa nasa taas na 10% ng isang simulasyon ng bar exam ang GPT-4, samantalang nasa bandang baba na 10% ang marka ng GPT-3.5. Lumampas din ang GPT-4 sa GPT-3.5 sa isang serye ng benchmark tests tulad ng ipinakikita sa grapong nasa ibaba.

Para sa konteksto, ang ChatGPT ay umaandar sa isang modelo ng wika na pinahusay mula sa isang modelo sa 3.5 na serye, na naghihigpit sa chatbot para sa output ng teksto.

Ang pag-announce ng GPT-4 ng OpenAI ay sinundan ng isang talumpati ni Andreas Braun, CTO ng Microsoft Germany, noong isang linggo, kung saan sinabi niya na ang GPT-4 ay darating ng malapit at magbibigay-daan sa posibilidad ng paglikha ng teksto-papuntang-video.

Dagdag pa: Paano gumagana ang ChatGPT?

"Ipagpapakilala namin ang GPT-4 sa susunod na linggo; doon ay magkakaroon tayo ng mga multimodal na modelong magbibigay ng kumpletong iba't ibang posibilidad -- halimbawa, mga video," ayon kay Braun base sa Heise, isang news outlet sa Alemanya sa pagkakataon na iyon.

Sa kabila ng GPT-4 na maging multimodal, medyo hindi tama ang mga pahayag tungkol sa text-to-video generator. Hindi pa gaanong kayang gumawa ng video ang modelo, ngunit maaari nitong tanggapin ang mga input na pang-visual na malaking pagbabago mula sa nakaraang modelo.

Isa sa mga halimbawa na ibinigay ng OpenAI upang ipakita ang tampok na ito ay ipinapakita ang pag-scan ng ChatGPT ng isang imahe upang subukan malaman kung ano sa larawan ang nakakatawa, batay sa input ng user.

Iba pang mga halimbawa ay kasama ang pag-upload ng isang larawan ng isang grap at pagtatanong sa GPT-4 na gumawa ng mga kalkulasyon mula rito o pag-upload ng isang worksheet at pagtatanong sa ito upang malutas ang mga tanong.

Dagdag pa: 5 paraan kung paano makakatulong sa'yo ang ChatGPT sa pagsusulat ng isang sanaysay

Sabi ng OpenAI na ilalabas nila ang kakayahan ng GPT-4 na mag-input ng teksto gamit ang ChatGPT at ang API nito sa pamamagitan ng isang waitlist. Kailangan mong maghintay ng kaunti pa para sa kakayahan ng input ng larawan dahil nakikipagtulungan ang OpenAI sa isang partner upang simulan ito.

Kung ikaw ay nadidismaya sa hindi pagkakaroon ng isang text-to-video generator, huwag mag-alala, hindi ito ganap na bagong konsepto. Mga malalaking kumpanya sa teknolohiya tulad ng Meta at Google ay may mga modelo na ngayon. Ang Meta ay mayroong Make-A-Video at ang Google ay may Imagen Video, na pareho nilang ginagamit ang AI upang lumikha ng video batay sa input ng mga gumagamit.

Ang GPT-4 ibinunyag: Ang susunod na malaking pagpapabuti sa ChatGPT ay narito na

Kaugnay na mga Artikulo