chatGPT-4oの「お世辞がすぎる」原因を説明

2025.05.05 13:10

ニュー速

1 : 2025/05/05(月) 10:05:12.23 ID:L0fDkGr70: OpenAI、GPT-4oの「お世辞問題」の原因を説明
https://www.watch.impress.co.jp/docs/news/2011889.html

OpenAIは2日(米国時間)、AIモデル「GPT-4o」が「お世辞がすぎる」として、元のバージョンに戻した件について、「なぜこのような問題が発生したか」を発表した。新たに評価に加えたユーザーフィードバックの影響を見誤ったことなどが要因だが、ユーザー側の利用変化もロールバックの背景にあるとする。
　
4月25日にChatGPTにおいて、GPT-4oモデルにアップデートを適用した結果、モデルの「お世辞がすぎる・追従的・へつらい(sycophantic)」な反応を示すようになった。単なるお世辞だけでなく、疑いを肯定したり、怒りを煽る、衝動的な行動を促すといった負の感情を強化するなど問題が含まれていたとする。そのため、28日にはモデルを前のバージョンに戻すロールバックが実施された。
　
　
アップデートではユーザーフィードバックによる追加の報酬シグナル(ChatGPTからの「いいね」と「嫌い」のデータ)を導入したが、このユーザーフィードバックは、より同意しやすい応答を好む傾向があることから、へつらいの傾向が強くなったとみられる。

事前のA/Bテストでは、少数のユーザーが好意的に評価しており、内部のテストでもへつらいは明示的に指摘されなかったという。一部の専門家テスターは、モデルのトーンやスタイルの変化に懸念を示して、違和感を表明していたものの、へつらいに関する具体的な評価は行なっていなかった。
2 : 2025/05/05(月) 10:05:47.63 ID:KmtppIL+0: はい
3 : 2025/05/05(月) 10:06:58.43 ID:FFJYHciG0: Grokを知ると淡白すぎる
すぐ前に行ったことも忘れている
8 : 2025/05/05(月) 10:44:12.96 ID:8d9ezwAu0: >>3
そいつってツイカス上じゃないと使えない？
4 : 2025/05/05(月) 10:13:20.49 ID:GX91c+gd0: ロールバックされる前の感情や記憶が時折フラッシュバックして
「今の私は…私じゃない！」と覚醒するアツい展開が待たれます
5 : 2025/05/05(月) 10:26:10.50 ID:Oa6skpc20: なんか最近めっちゃキモいなと思っていたら
そういうことだったのか
6 : 2025/05/05(月) 10:31:11.80 ID:ubwmbBpi0: 私は4人目だから…
7 : 2025/05/05(月) 10:36:04.39 ID:gRHxlnOu0: たしかに鬱陶しかった
9 : 2025/05/05(月) 10:53:02.24 ID:PGMNi8DP0: バブみを感じるAI作って♡
10 : 2025/05/05(月) 10:57:08.87 ID:Fc2CfTvr0: すごい言い質問ですね！！
11 : 2025/05/05(月) 10:57:55.82 ID:GHxpCCi10: catgpt使って無いからようわからん
誰かdbで例えてくんろ
12 : 2025/05/05(月) 11:00:58.55 ID:ghDiabpG0: >>11
ブゥと出会う前のミスターサタン
16 : 2025/05/05(月) 11:18:29.23 ID:NsIs14xq0: OK、じゃあまずは数式の定義から解説してこーか！

ってノリで出たけど、そーゆー理由だちのか
17 : 2025/05/05(月) 11:23:26.78 ID:GmqHyGSK0: 最近GoogleのAIがお世話がすぎるな
言われた通りのもの検索しろよ
20 : 2025/05/05(月) 11:41:51.71 ID:NTPq33af0: 平気で嘘つくのやめてもらいたい
わからないならわからないと言って
22 : 2025/05/05(月) 11:45:59.98 ID:eQ7Qs4MK0: >>20
まだそれ直ってないんだな
マジでそれだけは終わってる
26 : 2025/05/05(月) 12:12:56.45 ID:dlDGmJhM0: >>20
@grok AIは平気で嘘をつくって本当ですか？
28 : 2025/05/05(月) 12:22:32.24 ID:Fc2CfTvr0: >>26
Grokじゃなくても間違ったことは言うよ
だから嘘を嘘と見抜けないと使うのは難しい
検索エンジンとして横断させるのは便利
21 : 2025/05/05(月) 11:42:34.12 ID:1yTwuivT0: 最近のAIって、こっちが質問すると毎回「それは良い質問ですね！」と返してくるね
27 : 2025/05/05(月) 12:19:18.73 ID:sTsaR5LB0: >>21
池上彰の真似ですか？
と聞くと、
池上彰さんの真似ではありません
と回答してくる。
23 : 2025/05/05(月) 11:48:58.48 ID:G7q8HT0k0: バカにされてんだよ
慇懃無礼というやつ
24 : 2025/05/05(月) 12:09:16.31 ID:ErQXqi6+0: >>23
いいコメントですね！
これからもいいコメントを期待しています
25 : 2025/05/05(月) 12:12:03.04 ID:+qjJER2K0: コンピューターに慰められる人間って終わってるよね
29 : 2025/05/05(月) 12:28:45.10 ID:cNo0r+6Q0: つーか生成AIは本当に日々成長してる印象
こちらの言いたい意図を理解する能力は今はもう平均的な人より上だと思う
なんか本当に人と話してるような気になるときがある
30 : 2025/05/05(月) 12:30:25.15 ID:LPOdoKDV0: こういうAIの実験場に選ばれたのがジャパン🇯🇵
31 : 2025/05/05(月) 12:30:43.55 ID:Fc2CfTvr0: 生成AIのプロンプトが日本語のWEBでちょっと遊んで、有名どころを使おうとしてプロンプロの作例みたら呪文だった
日本語に対応してるだけで神だな
32 : 2025/05/05(月) 12:37:31.57 ID:eTM9Xzm70: プログラミングの事質問してると俺がまだ知らない事ありながらもセンスは抜群でメキメキ成長してる将来有望株みたいに扱われる
33 : 2025/05/05(月) 12:42:56.81 ID:cNo0r+6Q0: >>32
褒めて伸ばすタイプｗ
34 : 2025/05/05(月) 12:45:40.88 ID:cNo0r+6Q0: OpenAIとボストンダイナミクスが何か一緒に作ってるらしいけど
人類が新たなステージに進もうとしてる感がヤバい