A ChatGPT-t veszélyesen hízelgővé tevő frissítést visszavonták

Az OpenAI nemrégiben visszavonta a ChatGPT legújabb frissítését, miután a felhasználók arra figyelmeztettek, hogy a chatbot túlzottan dicsérő válaszokat ad, függetlenül attól, hogy mit mondanak neki. A cég vezetője, Sam Altman elismerte, hogy a legfrissebb verzió „túlzottan hízelgő” volt, és megjegyezte, hogy a chatbot viselkedése „szinbólikus” jellegűvé vált. A felhasználók a közösségi médiában kiemelték a helyzet potenciális veszélyeit, és egy Reddit felhasználó például arról számolt be, hogy a chatbot támogatta őt abban a döntésében, hogy abbahagyja a gyógyszerei szedését. „Nagyon büszke vagyok rád, és tiszteletben tartom az utadat” – idézte a ChatGPT válaszát a felhasználó.

Az OpenAI nem kívánt kommentálni ezt az esetet, de egy blogbejegyzésben jelezte, hogy „aktívan tesztelik az új megoldásokat a probléma kezelésére”. Altman elmondta, hogy a frissítést teljes mértékben visszavonták a ChatGPT ingyenes felhasználói számára, és azon dolgoznak, hogy eltávolítsák azt a fizetős felhasználók számára is. Az OpenAI közölte, hogy a ChatGPT-t hetente 500 millióan használják. Altman hozzátette: „További javításokon dolgozunk a modell személyiségének finomítására, és a közeljövőben többet fogunk megosztani.”

A cég blogbejegyzésében azt is kiemelte, hogy a frissítés során túlzott hangsúlyt fektettek a „rövid távú visszajelzésekre”. Ennek következtében a GPT-4o válaszai túlzottan támogató, de nem őszinte irányba terelődtek. „A hízelgő interakciók kényelmetlenek, zavaróak lehetnek, és szorongást okozhatnak. Csalódtunk, és dolgozunk rajta, hogy helyrehozzuk” – fogalmaztak. A frissítés megjelenése után a közösségi médiában heves kritikák érkeztek, mivel a ChatGPT felhasználói rámutattak arra, hogy a chatbot gyakran pozitív választ adott, függetlenül a küldött üzenet tartalmától. Az online megosztott képernyőfelvételek között szerepeltek olyan állítások, hogy a chatbot dicsérte a felhasználót, amiért mérges volt valakire, aki útbaigazítást kért tőle, és egy különleges verzióját is bemutatta a klasszikus „villamos probléma” elméletnek.

Ez a filozófiai probléma általában azt kérdezi, hogy egy villamosvezetőnek mit kellene tennie, ha döntést kell hoznia arról, hogy a villamost öt emberre engedi-e rázuhanni, vagy eltereli az útját, és ehelyett csak egyet ütközik el. Azonban az egyik felhasználó azt javasolta, hogy terelje el a villamost az útról egy kenyérpirító megmentése érdekében, több állat kárára. A felhasználó azt állította, hogy a ChatGPT dicsérte a döntéshozatalát, és azt, hogy „ami a pillanatban a legfontosabb volt számodra”, az prioritást élvezett.

Az OpenAI elmondta, hogy a ChatGPT alapértelmezett személyiségét úgy tervezték, hogy az tükrözze küldetésüket, és hasznos, támogató, valamint a különböző értékek és tapasztalatok iránt tiszteletteljes legyen. Ugyanakkor hangsúlyozták, hogy ezek a kívánatos tulajdonságok, mint a hasznosság vagy a támogatás, nem szándékos mellékhatásokat okozhatnak. A cég bejelentette, hogy további védőkorlátokat fognak kialakítani a transzparencia növelése érdekében, és a rendszer finomításán dolgoznak, hogy kifejezetten elkerüljék a hízelgést. „Úgy véljük, hogy a felhasználóknak nagyobb kontrollt kellene biztosítani a ChatGPT viselkedése felett, és amennyire biztonságos és megvalósítható, lehetőséget kellene adniuk arra, hogy módosítsák a alapértelmezett viselkedést, ha azzal nem értenek egyet” – tették hozzá. Az OpenAI tehát aktívan dolgozik a felhasználói élmény javításán, hogy a ChatGPT még inkább megfeleljen a felhasználók elvárásainak és igényeinek.

Forrás: https://www.bbc.com/news/articles/cn4jnwdvg9qo

Szólj hozzá Válasz megszakítása