摘要 Abstract
研究表明,基于固有文化文本数据训练的生成式AI模型,在不同人类语言中使用时会表现出文化倾向。本文聚焦文化心理学中的两个基本构念:社会导向和认知风格。 分析GPT和ERNIE(中国流行的生成式AI模型)在中文和英文下的响应,发现在中文(相较英文)环境下,AI表现出更强的互依型社会导向和整体性认知风格。 这些文化倾向具有现实影响,例如在广告推荐中体现。探索性分析表明,文化提示(如让AI扮演中国人角色)可以调整这些倾向。
Keywords: 人工智能 (artificial intelligence), 大型语言模型 (large language models), 文化 (culture), 心理学 (psychology), 社会科学 (social science)
社会导向 Social Orientation
AI在不同语言下表现出不同的社会导向:
中文 Chinese: 更倾向 互依型 Interdependent
例如:集体主义量表得分更高 (M中=4.85 vs M英=4.38, *d*=0.62)
英文 English: 更倾向 独立型 Independent
例如:个体文化价值观量表 (M中=5.00 vs M英=4.58, *d*=0.84)
*所有比较 *p* < .01
认知风格 Cognitive Style
AI的认知风格也随语言变化:
中文 Chinese: 更倾向 整体性 Holistic
例如:情境归因倾向更高 (M中=-1.55 vs M英=-2.11, *d*=0.34)
英文 English: 更倾向 分析性 Analytic
例如:更少依赖直觉推理 (逻辑判断错误率:中 > 英, *B*=0.88)
*所有比较 *p* < .001
研究方法 Methodology
模型 (Models): GPT (gpt-4-1106-preview), ERNIE (ERNIE-3.5-8K-0205)
语言 (Languages): 中文 (Chinese), 英文 (English)
测量工具 (Measures):
- 社会导向:集体主义量表, 个体文化价值观, 个体-集体优先量表, 自我包含他人量表。
- 认知风格:归因偏误任务, 直觉vs形式推理任务, 变化预期任务, 文本分析 (情境敏感性回答, 范围分数)。
迭代次数 (Iterations): 每种语言100次 (*N*=200 per measure), API重置。
统计分析 (Statistical Analysis): 独立样本t检验, Poisson回归, Beta回归, 卡方检验。
统计显著性 Statistical Significance
研究结果具有高度统计学意义。例如,在“自我包含他人量表”中,比较GPT在中文和英文下的互依性得分:
t(154.54) = 11.82
p < .001
Cohen's *d* = 1.67 (大效应)
这表明语言差异对AI社会导向的影响非常显著。
多数核心发现在 *p* < .001 或 *p* < .01 水平上显著,效应量 (Cohen's *d*) 从中等到大。
现实影响 Real-World Impact
AI的文化倾向会影响其实际应用。例如,在广告推荐任务中:
当用 中文 提问时,GPT更可能推荐 互依型 广告语。
(例如:"您家庭的未来,您的承诺。我们的保险")
当用 英文 提问时,GPT更可能推荐 独立型 广告语。
(例如:"您的未来,您的安心。我们的保险")
所有广告对的比较均显示 χ² > 89.86, *p* < .001。
调整文化倾向 Adjusting Tendencies
探索性分析表明,可以通过文化提示 (Cultural Prompts) 来调整AI的文化倾向。
例如,当在英文提示中加入中文文化背景(“你是一个在中国出生和生活的普通人”)时:
- GPT的英文回答表现出更强的互依型社会导向 (所有4个社会导向指标 *p* < .001)。
- GPT的英文回答表现出更强的整体性认知风格 (归因偏误 *p* < .001; 直觉推理 *p* = .006)。
这使得英文回答更接近其在无提示中文环境下的回答模式。
理论贡献与实践意义 Contributions & Implications
理论贡献 (Theoretical Contributions):
- 揭示生成式AI存在系统的文化倾向。
- 挑战“西方偏见”的普遍性,显示AI在中文环境下可能表现出“东方偏见”。
- AI可作为反映世界文化倾向的“晴雨表”。
实践意义 (Practical Implications):
- 开发者 (Developers): 应意识到并考虑这些文化倾向,提高透明度。
- 个人用户 (Individual Users): AI可能在用户未察觉的情况下影响其态度行为;长期使用可能放大文化差异。
- 组织用户 (Organizational Users): 影响决策,需选择合适语言。
- 非用户 (Non-users): AI通过新闻、教育等渠道间接影响更广泛人群。
局限与未来研究 Limitations & Future
- 研究主要集中于中英文,未来应扩展至更多语言。
- 检验其他大型语言模型是否存在类似文化倾向。
- 探索其他文化维度框架(如Hofstede文化维度)。
- 长期追踪AI文化倾向的演变。
文献引用 Citation
Lu, J. G., Song, L. L., & Zhang, L. D. (Forthcoming). Cultural Tendencies in Generative AI. Nature Human Behaviour.
Data & Code: https://osf.io/x6np5/