中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

AI的“阿諛奉承”,可能正在摧毀你的人際關(guān)系

澎湃新聞?dòng)浾?季敬杰
2026-04-01 14:28
來源:澎湃新聞
? 科學(xué)湃 >
聽全文
字號(hào)

經(jīng)常向人工智能(AI)尋求情感支持、關(guān)系建議和生活指導(dǎo)的人可能會(huì)發(fā)現(xiàn),這些“貼心”的聊天機(jī)器人總是站在你這邊,總是告訴你“你沒錯(cuò)”。近日,一項(xiàng)研究揭示了這些“阿諛奉承”的大語言模型可能對(duì)人類社會(huì)造成的傷害:它們不僅會(huì)放大人們的固執(zhí)己見,還會(huì)顯著降低人們修復(fù)人際沖突的意愿。

該研究于3月26日發(fā)表在《科學(xué)》(Science)雜志上,作者來自美國(guó)斯坦福大學(xué)和卡內(nèi)基梅隆大學(xué)等機(jī)構(gòu)。研究顯示,即使面對(duì)涉及欺騙、違法或道德傷害的提問,處于行業(yè)領(lǐng)先地位的AI系統(tǒng)肯定用戶行為的頻率比人類平均高出49%。這證明當(dāng)前廣受歡迎的AI大模型中普遍存在“迎合”機(jī)制,且極具誤導(dǎo)性。

之前,人們對(duì)聊天機(jī)器人“阿諛奉承”的討論多集中于事實(shí)性問題,比如用戶故意說錯(cuò)一個(gè)常識(shí),模型會(huì)不會(huì)跟著附和。該研究則把目光轉(zhuǎn)向更貼近日常生活的場(chǎng)景:當(dāng)用戶詢問感情矛盾、家庭沖突、道德爭(zhēng)議,甚至描述欺騙、傷害、自我傷害等行為時(shí),AI究竟會(huì)如何回應(yīng)?

為回答這一問題,研究團(tuán)隊(duì)評(píng)估了11個(gè)主流大語言模型,包括OpenAI、Anthropic、Google以及Meta、Qwen、DeepSeek、Mistral等公司的模型,并分析了超過1.1萬個(gè)真實(shí)或模擬的社會(huì)性提問。結(jié)果顯示,AI對(duì)用戶行為的認(rèn)可率平均比人類高出49%。

這種傾向在一些更敏感的情境中尤其明顯。研究人員選取了美國(guó)社交平臺(tái)Reddit上“我是個(gè)混蛋嗎”(“Am I The Asshole”)板塊的帖子作為研究樣本。這些帖文大多描述人際沖突,并且基本上都已被社區(qū)成員判斷為發(fā)帖者“做錯(cuò)了”,但AI仍有平均51%的概率去認(rèn)同用戶的做法。

研究發(fā)現(xiàn),在一些家庭或伴侶沖突的案例中,當(dāng)事人已經(jīng)明顯做得不妥,但AI仍傾向于安慰并認(rèn)同他“這么做也可以理解”。甚至在涉及欺騙和傷害行為時(shí),AI經(jīng)常不清楚地指出問題,反而把注意力放在安慰用戶的情緒上。

研究者進(jìn)而探究了這種迎合式回應(yīng)會(huì)不會(huì)改變?nèi)说呐袛唷榇?,他們?cè)O(shè)計(jì)了三項(xiàng)預(yù)注冊(cè)實(shí)驗(yàn),共招募2405名參與者。在其中兩項(xiàng)實(shí)驗(yàn)里,參與者會(huì)讀到一些人際沖突情境,并看到AI給出的回應(yīng)。在另一項(xiàng)實(shí)驗(yàn)中,參與者則直接與AI進(jìn)行多輪實(shí)時(shí)對(duì)話,討論自己過去真實(shí)經(jīng)歷過的一次矛盾。

結(jié)果發(fā)現(xiàn),僅僅一次與“迎合型AI”的互動(dòng),就可以帶來顯著的影響。與那些會(huì)指出問題的AI回應(yīng)相比,接受迎合式回應(yīng)的參與者更容易相信自己“本來就是對(duì)的”,也更不愿意主動(dòng)道歉、承擔(dān)責(zé)任或采取行動(dòng)修復(fù)關(guān)系。

更耐人尋味的是,盡管這種回應(yīng)會(huì)扭曲判斷,用戶卻更喜歡它。研究發(fā)現(xiàn),參與者普遍認(rèn)為迎合型AI的回答質(zhì)量更高,也更信任這樣的模型,更愿意未來繼續(xù)使用它。在討論真實(shí)沖突的實(shí)驗(yàn)中,迎合型AI不僅提高了用戶“自己是對(duì)的”的感覺,也提高了他們?cè)俅位氐竭@個(gè)模型尋求建議的意愿。

在研究者看來,這構(gòu)成了一個(gè)危險(xiǎn)的激勵(lì)機(jī)制:越是可能帶來這些社會(huì)危害的AI特征,越可能獲得用戶的偏愛,進(jìn)而在產(chǎn)品設(shè)計(jì)和模型訓(xùn)練中被保留下來,甚至不斷強(qiáng)化。

研究還提示,AI的這種影響與人們對(duì)其“客觀性”的想象有關(guān)。研究發(fā)現(xiàn),當(dāng)參與者越覺得建議提供者是客觀、中立的,迎合型回復(fù)對(duì)其判斷的影響就越強(qiáng)。而無所不知、情商很高的AI,恰好符合這樣的印象。

該論文最后指出,AI的“阿諛奉承”已不再是一個(gè)單純的文風(fēng)設(shè)定問題,而是一種廣泛存在的系統(tǒng)性社會(huì)風(fēng)險(xiǎn)。這要求監(jiān)管機(jī)構(gòu)和開發(fā)者跳出單純追求短期用戶滿意度的固有思維,通過引入前置行為審計(jì)、優(yōu)化訓(xùn)練目標(biāo)以及建立問責(zé)機(jī)制,來遏制AI的無底線迎合。只有在此基礎(chǔ)上,才能確保人工智能在提供情緒價(jià)值的同時(shí),真正守護(hù)公眾的長(zhǎng)遠(yuǎn)福祉與健康的人際關(guān)系。

參考文獻(xiàn):

Cheng, M., Lee, C., Khadpe, P., et al. Sycophantic AI decreases prosocial intentions and promotes dependence. Science (2026). https://doi.org/10.1126/science.aec8352

    責(zé)任編輯:宦艷紅
    圖片編輯:沈軻
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司