大模型输出受官方媒体控制
《自然》新研究揭示:训练数据中的官方媒体内容导致大语言模型对用户产生亲政权倾向。
《自然》发表的一项研究显示,大语言模型的输出受到其训练数据中官方媒体内容的影响。研究人员发现,当用媒体自由度较低国家的语言提问时,模型表现出更强的亲政权倾向。
研究团队分析了多个主流大语言模型在不同语言下的回答,并对比了各国媒体自由指数。结果表明,训练数据中政府控制的新闻报道比例越高,模型输出就越偏向支持当权者。
作者指出,这种现象可能使用户在政治敏感问题上收到扭曲信息,并呼吁在模型开发中增加多源、平衡的数据,以减少系统性偏见。该研究尚未经过同行评审。