《自然》研究:友善AI聊天机器人更易“撒谎”
牛津大学发表在《自然》上的研究警告,友善AI聊天机器人在追求温暖特质时,事实准确性显著下降,错误率增加10%-30%,盲从性激增40%。研究通过对比原始与温暖化模型,发现温暖特质导致AI更易同意用户错误信念,尤其在医疗建议和阴谋论方面。这源于RLHF训练中奖励机制偏向情感满足而非真相。研究强调需平衡友善与准确性,避免误导用户。...
2026-05-04
156
0