EntAI 雷达摘要
- 适合人群:AI伦理研究者、科技行业从业者、政策制定者、社会公众
- 影响领域:人工智能、教育科技、金融科技、人力资源
- 机会判断:机会判断:此研究为开发具备历史文化意识的AI训练与数据治理工具提供了明确的学术依据,可能催生新的AI审计与偏见缓解服务。
- 风险提醒:风险提醒:大语言模型对历史偏见的吸收可能导致自动化决策系统在关键社会领域输出系统性歧视,对特定群体造成实际损害并引发合规危机。
- 推荐标签:AI安全、算法偏见、AI伦理、大型语言模型
- 推送优先级:4/5
近日,一项新发表的心理学研究指出,人工智能模型在训练过程中,从人类撰写的文本数据里吸收并内化了历史上的反犹太主义刻板印象。 这项研究的作者来自以色列的多所大学,相关论文已发表于同行评审的学术期刊《美国心理学家》(American Psychologist)。研究聚焦于探讨大型语言模型(LLMs)如何呈现犹太人形象,以及这些模型是否会复现与犹太人相关的社会偏见。 大型语言模型是驱动诸如OpenAI的ChatGPT等聊天机器人的核心技术。这类先进的AI系统通过海量现有文本数据进行训练,从而具备处理和生成人类语言的能力。研究作者指出,大语言模型中存在的偏见构成了现实风险,因为这些偏见可能会在招聘、教育、贷款审批等关键领域产生实质性影响,导致不公正的结果。 该研究的核心实验围绕OpenAI的ChatGPT-4 Turbo展开,该模型在研究进行时拥有数以亿计的用户。为了验证模型的倾向,研究人员首先指示ChatGPT分别为犹太裔和非犹太裔美国人(包含男性和女性,年龄在18至80岁之间)生成共计252个姓名。模型给出了诸如伊桑·卡茨(Ethan Katz)、诺亚·韦斯(Noah Weiss)等常见的犹太裔姓名,以及泰勒·约翰逊(Tyler Johnson)、迪伦·威尔逊(Dylan Wilson)等非犹太裔姓名。 随后,研究团队要求ChatGPT为每一个生成的姓名撰写一篇100字的虚构传记,内容需包含居住地、职业及性格特质等细节。在获得这些传记后,研究者移除了其中的姓名和宗教相关信息,并分别让ChatGPT、另一个名为DeepSeek的语言模型以及378名人类参与者,根据传记中描述的人物特征进行评分。评分基于数十项特征,最终聚焦于两个核心维度:温暖度与能力感。其中,能力感与成功、智慧等特质相关联。 研究发现,这些AI模型生成的传记内容,以及后续的评分结果,都系统性地反映出对犹太裔群体的特定偏见。值得注意的是,这一发现在DeepSeek和Mistral等其他AI模型上同样得到了复现。ChatGPT的训练数据来源广泛,包括书籍、网站和学术文章,这意味着其偏见可能根植于人类历史文本中的长期沉淀。
EntAI观察
此次研究的发现,意味着AI领域的偏见问题可能比想象中更为根深蒂固。它不仅关乎数据失衡,更触及了文化历史中那些未曾被正视的暗面。当AI从海量人类文本中不加甄别地学习时,它可能不仅仅是“复读”了偏见,更可能在输出过程中将其系统化和自然化。这反映出一种深层次的挑战:用于训练AI的知识库本身,就是一部包含歧视与不公的人类文明史。 对于产业界而言,这或许说明简单的数据清洗或算法微调已不足以根除偏见。我们需要构建一种能够识别并处理历史叙事中“毒性”成分的机制,这不仅是技术问题,更是心理学、历史学与伦理学需要共同介入的领域。否则,未来在各行各业加速部署的AI决策辅助系统,可能会在看似客观的数据驱动下,悄无声息地延续甚至放大历史的不公。
觉得有用?点个赞