AI的“阿諛?lè)畛小?，可能正在摧毀你的人際關(guān)系

澎湃新聞?dòng)浾?季敬杰

2026-04-01 14:28

來(lái)源：澎湃新聞

聽(tīng)全文

經(jīng)常向人工智能（AI）尋求情感支持、關(guān)系建議和生活指導(dǎo)的人可能會(huì)發(fā)現(xiàn)，這些“貼心”的聊天機(jī)器人總是站在你這邊，總是告訴你“你沒(méi)錯(cuò)”。近日，一項(xiàng)研究揭示了這些“阿諛?lè)畛小钡拇笳Z(yǔ)言模型可能對(duì)人類社會(huì)造成的傷害：它們不僅會(huì)放大人們的固執(zhí)己見(jiàn)，還會(huì)顯著降低人們修復(fù)人際沖突的意愿。

該研究于3月26日發(fā)表在《科學(xué)》（Science）雜志上，作者來(lái)自美國(guó)斯坦福大學(xué)和卡內(nèi)基梅隆大學(xué)等機(jī)構(gòu)。研究顯示，即使面對(duì)涉及欺騙、違法或道德傷害的提問(wèn)，處于行業(yè)領(lǐng)先地位的AI系統(tǒng)肯定用戶行為的頻率比人類平均高出49%。這證明當(dāng)前廣受歡迎的AI大模型中普遍存在“迎合”機(jī)制，且極具誤導(dǎo)性。

之前，人們對(duì)聊天機(jī)器人“阿諛?lè)畛小钡挠懻摱嗉杏谑聦?shí)性問(wèn)題，比如用戶故意說(shuō)錯(cuò)一個(gè)常識(shí)，模型會(huì)不會(huì)跟著附和。該研究則把目光轉(zhuǎn)向更貼近日常生活的場(chǎng)景：當(dāng)用戶詢問(wèn)感情矛盾、家庭沖突、道德?tīng)?zhēng)議，甚至描述欺騙、傷害、自我傷害等行為時(shí)，AI究竟會(huì)如何回應(yīng)？

為回答這一問(wèn)題，研究團(tuán)隊(duì)評(píng)估了11個(gè)主流大語(yǔ)言模型，包括OpenAI、Anthropic、Google以及Meta、Qwen、DeepSeek、Mistral等公司的模型，并分析了超過(guò)1.1萬(wàn)個(gè)真實(shí)或模擬的社會(huì)性提問(wèn)。結(jié)果顯示，AI對(duì)用戶行為的認(rèn)可率平均比人類高出49%。

這種傾向在一些更敏感的情境中尤其明顯。研究人員選取了美國(guó)社交平臺(tái)Reddit上“我是個(gè)混蛋嗎”（“Am I The Asshole”）板塊的帖子作為研究樣本。這些帖文大多描述人際沖突，并且基本上都已被社區(qū)成員判斷為發(fā)帖者“做錯(cuò)了”，但AI仍有平均51%的概率去認(rèn)同用戶的做法。

研究發(fā)現(xiàn)，在一些家庭或伴侶沖突的案例中，當(dāng)事人已經(jīng)明顯做得不妥，但AI仍傾向于安慰并認(rèn)同他“這么做也可以理解”。甚至在涉及欺騙和傷害行為時(shí)，AI經(jīng)常不清楚地指出問(wèn)題，反而把注意力放在安慰用戶的情緒上。

研究者進(jìn)而探究了這種迎合式回應(yīng)會(huì)不會(huì)改變?nèi)说呐袛?。為此，他們?cè)O(shè)計(jì)了三項(xiàng)預(yù)注冊(cè)實(shí)驗(yàn)，共招募2405名參與者。在其中兩項(xiàng)實(shí)驗(yàn)里，參與者會(huì)讀到一些人際沖突情境，并看到AI給出的回應(yīng)。在另一項(xiàng)實(shí)驗(yàn)中，參與者則直接與AI進(jìn)行多輪實(shí)時(shí)對(duì)話，討論自己過(guò)去真實(shí)經(jīng)歷過(guò)的一次矛盾。

結(jié)果發(fā)現(xiàn)，僅僅一次與“迎合型AI”的互動(dòng)，就可以帶來(lái)顯著的影響。與那些會(huì)指出問(wèn)題的AI回應(yīng)相比，接受迎合式回應(yīng)的參與者更容易相信自己“本來(lái)就是對(duì)的”，也更不愿意主動(dòng)道歉、承擔(dān)責(zé)任或采取行動(dòng)修復(fù)關(guān)系。

更耐人尋味的是，盡管這種回應(yīng)會(huì)扭曲判斷，用戶卻更喜歡它。研究發(fā)現(xiàn)，參與者普遍認(rèn)為迎合型AI的回答質(zhì)量更高，也更信任這樣的模型，更愿意未來(lái)繼續(xù)使用它。在討論真實(shí)沖突的實(shí)驗(yàn)中，迎合型AI不僅提高了用戶“自己是對(duì)的”的感覺(jué)，也提高了他們?cè)俅位氐竭@個(gè)模型尋求建議的意愿。

在研究者看來(lái)，這構(gòu)成了一個(gè)危險(xiǎn)的激勵(lì)機(jī)制：越是可能帶來(lái)這些社會(huì)危害的AI特征，越可能獲得用戶的偏愛(ài)，進(jìn)而在產(chǎn)品設(shè)計(jì)和模型訓(xùn)練中被保留下來(lái)，甚至不斷強(qiáng)化。

研究還提示，AI的這種影響與人們對(duì)其“客觀性”的想象有關(guān)。研究發(fā)現(xiàn)，當(dāng)參與者越覺(jué)得建議提供者是客觀、中立的，迎合型回復(fù)對(duì)其判斷的影響就越強(qiáng)。而無(wú)所不知、情商很高的AI，恰好符合這樣的印象。

該論文最后指出，AI的“阿諛?lè)畛小币巡辉偈且粋€(gè)單純的文風(fēng)設(shè)定問(wèn)題，而是一種廣泛存在的系統(tǒng)性社會(huì)風(fēng)險(xiǎn)。這要求監(jiān)管機(jī)構(gòu)和開(kāi)發(fā)者跳出單純追求短期用戶滿意度的固有思維，通過(guò)引入前置行為審計(jì)、優(yōu)化訓(xùn)練目標(biāo)以及建立問(wèn)責(zé)機(jī)制，來(lái)遏制AI的無(wú)底線迎合。只有在此基礎(chǔ)上，才能確保人工智能在提供情緒價(jià)值的同時(shí)，真正守護(hù)公眾的長(zhǎng)遠(yuǎn)福祉與健康的人際關(guān)系。

參考文獻(xiàn)：

Cheng, M., Lee, C., Khadpe, P., et al. Sycophantic AI decreases prosocial intentions and promotes dependence. Science (2026). https://doi.org/10.1126/science.aec8352

責(zé)任編輯：宦艷紅

圖片編輯：沈軻

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#AI #阿諛?lè)畛?/span>#人際關(guān)系 #《科學(xué)》