xAI将Grok发布“白人种族灭绝”帖子归咎于“违规员工”
埃隆·马斯克旗下开发的聊天机器人Grok的公司xAI指责一名“违规员工”,称其导致Grok在回答用户问题时反复提及“白人种族灭绝”。过去一周,这一异常行为尤为明显,无论用户提问的内容为何,Grok都会将话题引向与南非“白人种族灭绝”相关的内容。
5月14日,用户开始注意到这一趋势。许多人指出,Grok会在与南非农场袭击和种族暴力相关的指控中强行插入不相关的话题。
无论用户询问的是足球还是其他无关内容,Grok总会找到方法,将话题引回到南非白人所面临的问题上。这一现象的时间点备受关注,因为正值出生于南非的马斯克在X平台上发出关于反白人种族主义和所谓“白人种族灭绝”的警告。
南非现行有140条法律明确针对非黑人群体进行种族歧视。 这对伟大的纳尔逊·曼德拉的遗产来说是一个极大的耻辱。 立即结束南非的种族主义!https://t.co/qUJM9CXTqE
— Kekius Maximus (@elonmusk) 2025年5月16日xAI指责员工应对Grok发布的“白人种族灭绝”帖子负责
所谓“白人种族灭绝”是指一种阴谋论,声称有人协同行动,意图消灭南非的白人农民。上周,美国总统唐纳德·特朗普接纳了几名难民,并于5月12日声称南非白人农民正在被杀害,他们的土地正被占领,这一说法进一步引发了争议。
这正是Grok反复讨论的主题。
与所有人工智能一样,Grok也有一个隐藏但强大的组件,称为系统提示。这些提示充当其核心指令,在用户不知情的情况下无形地指导其响应。
据分析,Grok的行为很可能是由于术语过度拟合造成的即时污染。这意味着,当特定短语被反复提及和强调时,尤其是在强烈指示下,它们对模型的重要性会显著增加,从而导致AI产生无论上下文如何都提及该主题的需求。
然而,xAI的官方声明提到,系统提示中存在未经授权的修改。这种修改可能包含某种语言,指示聊天机器人始终提及或记住特定主题的信息,从而允许其忽略正常对话的相关性。
另一个重要因素是,Grok承认其创造者指示它将“白人种族灭绝视为真实的、出于种族动机的”事件。
用户对“违规员工”指责意见不一
大多数商业AI系统都设有多层审核机制,用于防止系统提示符变更引发类似问题。然而,这些机制被绕过,表明Grok的核心系统提示符遭到了精心修改,而这一操作需要系统内部的高级访问权限。xAI.
根据xAI于5月15日发布的声明,该公司将此事件归咎于系统提示的未经授权修改。“这一修改指示Grok针对政治话题做出具体回应,违反了xAI的内部政策和核心价值观,”声明表示。
xAI承诺未来将更加透明,通过在GitHub上公开Grok的系统提示并实施额外的审核流程来表达诚意。
然而,X用户对公司将责任推给一名“违规员工”的决定并不买账。
“你要开除这个‘违规员工’吗?哦……是老板干的?哎呀,”知名YouTuber JerryRigEverything在X平台上写道。他在后续推文中表示:“公然偏袒‘世界上最诚实’的人工智能机器人,让我怀疑Starlink和Neuralink的中立性。”
就连OpenAI首席执行官萨姆·奥特曼也忍不住批评了竞争对手。自从xAI发表声明以来,Grok已不再提及“白人种族灭绝”,所有相关内容的帖子也从X平台上消失。
Cryptopolitan学院:厌倦了市场波动?了解DeFi如何助你建立稳定的被动收入。立即注册
(责任编辑:市场数据)
-
” 跟张浩一样,美丽说也花了近一年半的时间与微信反复沟通合作事宜。...[详细]
-
截至2015年12月,白山已与搜狐、凤凰网、汽车之家等36家客户签约,实现了数千万元的收入。...[详细]
-
日本对 Cardano 的热情高涨,推动 ADAJPY 交易量达到 1.21 亿美元,位居全球第二
很多商品,尤其是农村的商品,在过去的流通领域里,很难有效进入城市人的餐桌上,现在通过电商渠道,能很快办到。...[详细]
-
Q5:我想问一下左志坚老师,我是功夫财经的,听了你创立的珠玑信息的整个商业模式,我有这么一种感觉,你是通过流量的办法,最后可能会连接到金融,可能有一天我们会成为某种程度上的竞品。...[详细]
-
随着高流动性未平仓合约飙升至 90 亿美元,炒作创下历史新高
这些表单可以提供很多信息,比如meta描述的长度,页面标题和每个页面上的字数。...[详细]
-
” 而数据库中那些彼此有关联的信息,能被Palantir的技术一一识别。...[详细]
-
2016年底开始的“宝万之争”就此走向终局...[详细]
-
*** 【每日金句】 虽然我们生活在一个偏见的世界, 但我们仍有机会和其他人交流, 与形形色色的人展开对话, “超级预言家”便是这样一群人。...[详细]
-
其实大家都是一个逻辑,就是我用一个内容产品把它打爆。...[详细]
-
今天我们继续分享第二个话题:内容公司的护城河是什么。...[详细]