- +1
AI的“阿諛?lè)畛小?,可能正在摧毀你的人際關(guān)系
經(jīng)常向人工智能(AI)尋求情感支持、關(guān)系建議和生活指導(dǎo)的人可能會(huì)發(fā)現(xiàn),這些“貼心”的聊天機(jī)器人總是站在你這邊,總是告訴你“你沒(méi)錯(cuò)”。近日,一項(xiàng)研究揭示了這些“阿諛?lè)畛小钡拇笳Z(yǔ)言模型可能對(duì)人類社會(huì)造成的傷害:它們不僅會(huì)放大人們的固執(zhí)己見(jiàn),還會(huì)顯著降低人們修復(fù)人際沖突的意愿。
該研究于3月26日發(fā)表在《科學(xué)》(Science)雜志上,作者來(lái)自美國(guó)斯坦福大學(xué)和卡內(nèi)基梅隆大學(xué)等機(jī)構(gòu)。研究顯示,即使面對(duì)涉及欺騙、違法或道德傷害的提問(wèn),處于行業(yè)領(lǐng)先地位的AI系統(tǒng)肯定用戶行為的頻率比人類平均高出49%。這證明當(dāng)前廣受歡迎的AI大模型中普遍存在“迎合”機(jī)制,且極具誤導(dǎo)性。
之前,人們對(duì)聊天機(jī)器人“阿諛?lè)畛小钡挠懻摱嗉杏谑聦?shí)性問(wèn)題,比如用戶故意說(shuō)錯(cuò)一個(gè)常識(shí),模型會(huì)不會(huì)跟著附和。該研究則把目光轉(zhuǎn)向更貼近日常生活的場(chǎng)景:當(dāng)用戶詢問(wèn)感情矛盾、家庭沖突、道德?tīng)?zhēng)議,甚至描述欺騙、傷害、自我傷害等行為時(shí),AI究竟會(huì)如何回應(yīng)?
為回答這一問(wèn)題,研究團(tuán)隊(duì)評(píng)估了11個(gè)主流大語(yǔ)言模型,包括OpenAI、Anthropic、Google以及Meta、Qwen、DeepSeek、Mistral等公司的模型,并分析了超過(guò)1.1萬(wàn)個(gè)真實(shí)或模擬的社會(huì)性提問(wèn)。結(jié)果顯示,AI對(duì)用戶行為的認(rèn)可率平均比人類高出49%。
這種傾向在一些更敏感的情境中尤其明顯。研究人員選取了美國(guó)社交平臺(tái)Reddit上“我是個(gè)混蛋嗎”(“Am I The Asshole”)板塊的帖子作為研究樣本。這些帖文大多描述人際沖突,并且基本上都已被社區(qū)成員判斷為發(fā)帖者“做錯(cuò)了”,但AI仍有平均51%的概率去認(rèn)同用戶的做法。
研究發(fā)現(xiàn),在一些家庭或伴侶沖突的案例中,當(dāng)事人已經(jīng)明顯做得不妥,但AI仍傾向于安慰并認(rèn)同他“這么做也可以理解”。甚至在涉及欺騙和傷害行為時(shí),AI經(jīng)常不清楚地指出問(wèn)題,反而把注意力放在安慰用戶的情緒上。
研究者進(jìn)而探究了這種迎合式回應(yīng)會(huì)不會(huì)改變?nèi)说呐袛?。為此,他們?cè)O(shè)計(jì)了三項(xiàng)預(yù)注冊(cè)實(shí)驗(yàn),共招募2405名參與者。在其中兩項(xiàng)實(shí)驗(yàn)里,參與者會(huì)讀到一些人際沖突情境,并看到AI給出的回應(yīng)。在另一項(xiàng)實(shí)驗(yàn)中,參與者則直接與AI進(jìn)行多輪實(shí)時(shí)對(duì)話,討論自己過(guò)去真實(shí)經(jīng)歷過(guò)的一次矛盾。
結(jié)果發(fā)現(xiàn),僅僅一次與“迎合型AI”的互動(dòng),就可以帶來(lái)顯著的影響。與那些會(huì)指出問(wèn)題的AI回應(yīng)相比,接受迎合式回應(yīng)的參與者更容易相信自己“本來(lái)就是對(duì)的”,也更不愿意主動(dòng)道歉、承擔(dān)責(zé)任或采取行動(dòng)修復(fù)關(guān)系。
更耐人尋味的是,盡管這種回應(yīng)會(huì)扭曲判斷,用戶卻更喜歡它。研究發(fā)現(xiàn),參與者普遍認(rèn)為迎合型AI的回答質(zhì)量更高,也更信任這樣的模型,更愿意未來(lái)繼續(xù)使用它。在討論真實(shí)沖突的實(shí)驗(yàn)中,迎合型AI不僅提高了用戶“自己是對(duì)的”的感覺(jué),也提高了他們?cè)俅位氐竭@個(gè)模型尋求建議的意愿。
在研究者看來(lái),這構(gòu)成了一個(gè)危險(xiǎn)的激勵(lì)機(jī)制:越是可能帶來(lái)這些社會(huì)危害的AI特征,越可能獲得用戶的偏愛(ài),進(jìn)而在產(chǎn)品設(shè)計(jì)和模型訓(xùn)練中被保留下來(lái),甚至不斷強(qiáng)化。
研究還提示,AI的這種影響與人們對(duì)其“客觀性”的想象有關(guān)。研究發(fā)現(xiàn),當(dāng)參與者越覺(jué)得建議提供者是客觀、中立的,迎合型回復(fù)對(duì)其判斷的影響就越強(qiáng)。而無(wú)所不知、情商很高的AI,恰好符合這樣的印象。
該論文最后指出,AI的“阿諛?lè)畛小币巡辉偈且粋€(gè)單純的文風(fēng)設(shè)定問(wèn)題,而是一種廣泛存在的系統(tǒng)性社會(huì)風(fēng)險(xiǎn)。這要求監(jiān)管機(jī)構(gòu)和開(kāi)發(fā)者跳出單純追求短期用戶滿意度的固有思維,通過(guò)引入前置行為審計(jì)、優(yōu)化訓(xùn)練目標(biāo)以及建立問(wèn)責(zé)機(jī)制,來(lái)遏制AI的無(wú)底線迎合。只有在此基礎(chǔ)上,才能確保人工智能在提供情緒價(jià)值的同時(shí),真正守護(hù)公眾的長(zhǎng)遠(yuǎn)福祉與健康的人際關(guān)系。
參考文獻(xiàn):
Cheng, M., Lee, C., Khadpe, P., et al. Sycophantic AI decreases prosocial intentions and promotes dependence. Science (2026). https://doi.org/10.1126/science.aec8352





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




