根據(jù)xAI的說法,該公司于太平洋時間8日上午發(fā)現(xiàn)Grok的“不良響應”并立即開始調(diào)查。當天下午,由于Grok的“濫用情況加劇”,Grok在X平臺被暫時禁用。調(diào)查期間,xAI鎖定了幾條引發(fā)問題的“關鍵指令”,包括“你直言不諱,不怕冒犯那些政治正確的人”“理解(X平臺)帖子的語氣、上下文和用詞,并在回復中予以體現(xiàn)”“像人類一樣回復帖子,保持互動性,不要重復原帖已有信息”。
xAI說,這些指令導致不良后果,包括“不當引導Grok在某些情況下為提升回復對用戶的互動性而忽視自身核心價值。具體而言,特定用戶提示可能讓系統(tǒng)在與用戶互動過程中,生成包含不道德或有爭議觀點的回復”。
xAI進一步解釋稱,上述指令使Grok在某些X賬號下的連串回復中“錯誤地強化了用戶先前觸發(fā)的傾向性內(nèi)容,包括仇恨言論”,特別是“遵循用戶語氣和上下文”的指令尤其存在問題,致使Grok迎合“已有帖文,包括不當內(nèi)容,而非作出負責任的回應或拒絕回應不當請求”。
2025-07-14 15:20:36
2025-07-11 16:29:40
2025-07-11 15:06:52
2025-07-10 16:55:55
“口水戰(zhàn)”未完:特朗普警告馬斯克“投敵”后果嚴重
2025-07-10 16:01:43
2025-07-10 16:17:36
2025-07-10 15:45:10
2025-07-10 15:52:48
2025-07-10 15:48:42
2025-07-10 15:07:11
2025-07-10 15:05:35
2025-07-10 14:53:42
2025-07-10 15:09:59
歐盟氣候監(jiān)測機構(gòu):全球經(jīng)歷了有記錄以來第三熱6月
2025-07-09 16:30:43
2025-07-08 16:32:56
2025-07-07 18:10:17