U-Turn ng OpenAI: Hindi Nakikinig Kay GPT-4 Sa Data ng Customer ng API

pagbabago-sa-pribasiya-ng-openai-6457d3fd3d25f-sej-760x400.png

Sa isang malaking pag-alis mula sa dating mga pamamaraan nito, inanunsyo ng OpenAI na hindi na nito gagamitin ang data ng mga customer na ipinadala sa pamamagitan ng kanyang mga API upang i-train ang malalawak nitong mga modelo ng wika, tulad ng GPT-4.

Ang pagbabago ay kinumpirma ni Sam Altman, ang CEO ng OpenAI, sa isang kamakailang panayam sa CNBC.

Bagong Paraan ng OpenAI sa User Data

Ang pagbabago sa patakaran ng OpenAI ay ipinatupad noong Marso 1, 2023, nang hindi gaanong mapansin ang pag-update ng kumpanya sa kanyang mga tuntunin ng serbisyo upang ipakita ang bagong commitment sa privacy ng mga gumagamit.

Binigyang-linaw ni Altman, "Malinaw na gusto ng mga customer na hindi namin gamitin ang kanilang data para sa pagsasanay, kaya binago namin ang aming plano: Hindi na namin gagawin iyon."

Ang mga API, o mga application programming interfaces, ay mga teknikal na balangkas na nagpapahintulot sa mga customer na kumonekta nang direkta sa software ng OpenAI.

Idiniin ni Altman na ang OpenAI ay hindi na nagagamit ang data ng API para sa pagsasanay ng modelo "sa loob ng mahabang panahon", na nagpapahayag na ang opisyal na pahayag na ito ay pormalisa ng umiiral na praktis.

Mga Kahalagahan Para sa Mga Negosyo na Mga Customer

Ang pagkilos ng OpenAI ay may malalim na mga kahulugan, partikular sa mga negosyong customer nito, na kasama ang mga higante tulad ng Microsoft, Salesforce, at Snapchat.

Ang mga kumpanyang ito ay mas malamang na magamit ang mga kakayahan ng OpenAI API para sa kanilang mga operasyon, kaya ang paglipat ng privacy at proteksyon ng data ay partikular na may kinalaman sa kanila.

Gayunman, ang bagong mga patakaran sa proteksyon ng datos ay nag-aaplay lamang sa mga customer na gumagamit ng mga serbisyong API ng kumpanya. Ganito ang nakasaad sa pinabagong mga tuntunin ng serbisyo ng OpenAI, "Maaari naming gamitin ang Nilalaman mula sa Iba pang mga Serbisyo bukod sa aming API."

Kaya't iba pang mga anyo ng pagpasok ng datos, tulad ng teksto na ipinasok sa sikat na chatbot na ChatGPT, ay maaaring gamitin pa rin ng OpenAI maliban na lang kung ang datos ay ibinahagi sa pamamagitan ng API.

Malawakang Epekto sa Industriya

Ang pagbabago ng patakaran ng OpenAI ay nagaganap habang tinatanaw ng mga industriya ang potensyal na epekto ng malalaking mga mod

Halimbawa, kamakailan lang nag-umpisa ang Amerikanong Writers Guild na mag-welga matapos maibigo ang mga negosasyon sa pagitan ng Guild at mga studio ng pelikula. Ang Guild ay nagtataguyod ng mga paghihigpit sa paggamit ng OpenAI's ChatGPT para sa paglikha o pagsulat ng script.

Ang desisyon ng OpenAI na huwag gamitin ang data ng mga customer para sa pagsasanay ay nagpapakita ng isang mahalagang sandali sa patuloy na usapin tungkol sa data privacy at AI. Habang patuloy na sinisikap ng mga kumpanya na isuri at palawigin ang mga hangganan ng teknolohiyang AI, ang pagtaguyod ng privacy ng mga gumagamit at ang pagkakaroon ng tiwala ay malamang na manatiling sentro sa mga talakayan na ito.

Ang Pag-unlad ng ChatGPT: GPT-3 Hanggang GPT-4

Mahalagang tandaan na ang pangako ng OpenAI na hindi gagamitin ang data ng mga customer para sa pagsasanay ay nag-aapply sa kanilang pinakabagong modelo ng wika, ang GPT-4, na inilabas noong Marso 14, 2023.

Ang GPT-4 ay nagdala ng ilang mga pagpapabuti kumpara sa kanyang mga naunang bersyon, tulad ng GPT-3, kabilang na ang malaking pagtaas sa limitasyon ng bilang ng mga salita (25,000 kumpara sa 3,000-word limit ng ChatGPT), mas malaking laki ng bintana ng konteksto, at pinabuting kakayahan sa pag-iisip at pagkaunawa.

Isa pang kahanga-hangang katangian ng GPT-4 ay ang kanyang multi-modality o kakayahan na maunawaan at tumukoy ng impormasyon mula sa mga imahe bukod sa teksto. Ang pinakabagong modelo na ito ay naglilikha ng mga teksto na mas kamukha ng tao, gumagamit ng mga katangian tulad ng mga emojis para sa mas personal na pakiramdam.

Gayunman, hindi pa tiyak ang eksaktong sukat at arkitektura ng GPT-4, na nagdudulot ng mga haka-haka tungkol sa mga detalye ng modelo.

Bagaman may mga tsismis na ito, pinabulaanan ng CEO ng OpenAI ang partikular na mga alegasyon tungkol sa laki ng modelo.

Tungkol sa pagganap, may mga nailahad na mga lakas si GPT-4 sa paglikha ng teksto ngunit mayroon ding ilang limitasyon. Halimbawa, naka-score ito sa ika-54 na percentile sa pagsulat ng Graduate Record Examination (GRE) at nag-perform naman sa ika-43 - 59 na percentile sa pagsusulit ng AP Calculus BC.

Kasabay nito, ito ay nag-perform nang mabuti sa mga madali at simpleng mga gawain sa pagko-code sa LeetCode, subalit nabawasan ito ang galing nito habang dumadami ang kahirapan ng mga gawain.

Samantalang ang mga detalye ng proseso ng pagsasanay ng GPT-4 ay hindi opisyal na naiulat, alam na ang mga modelo ng GPT sa pangkalahatan ay kasama ang malawakang pag-aaral ng mga makina gamit ang iba't ibang uri ng teksto sa internet.

Pinakahahangad

Bunga ng mga pagbabago sa data usage policy ng OpenAI, ang mga data na ginamit sa pagsasanay ng kanilang mga language models ay hindi kasama ang impormasyon na ibinahagi sa pamamagitan ng API maliban na lamang kung pumapayag ang mga gumagamit na magbahagi para sa layuning ito.

Samantalang umuunlad ang teknolohiyang ito at gumagampan ng isang mas mahalagang bahagi sa ating mga buhay, nakakatuwa kung paano nagbabago at tumutugon ang mga kumpanya sa mga alalahanin tungkol sa pagiging pribado ng data at sa pagkakamit ng tiwala ng mga tao.

U-Turn sa OpenAI: Hindi Tinatanong Ang GPT-4 Tungkol sa Data ng mga Customer sa API

Bagong Paraan ng OpenAI sa User Data

Mga Kahalagahan Para sa Mga Negosyo na Mga Customer

Malawakang Epekto sa Industriya

Ang Pag-unlad ng ChatGPT: GPT-3 Hanggang GPT-4

Pinakahahangad

Kaugnay na mga Artikulo