Nature News journal Score 70

媒体管控重塑LLM训练数据

研究显示,国家对媒体的控制会影响大语言模型的训练数据,进而改变模型行为。

Nature发表的一项研究发现,国家对媒体的控制会通过影响信息环境来改变大语言模型(LLM)的训练数据。这会对LLM的输出产生重大影响:媒体管控越严格的国家,在其自身语言中获得的评价越正面。

研究团队分析了多个国家媒体环境与LLM输出之间的关联,发现模型在回答相关问题时倾向于反映其训练数据中存在的媒体偏见。这种影响在不同语言和模型中表现一致。

该研究揭示了LLM训练数据中隐含的政治偏差,提示在部署AI系统时需考虑其可能被国家媒体环境塑造。专家呼吁对训练数据来源进行更透明的披露。

AImedia controllanguage models