chatGPT-4oの「お世辞がすぎる」原因を説明

サムネイル
1 : 2025/05/05(月) 10:05:12.23 ID:L0fDkGr70

OpenAI、GPT-4oの「お世辞問題」の原因を説明
https://www.watch.impress.co.jp/docs/news/2011889.html

OpenAIは2日(米国時間)、AIモデル「GPT-4o」が「お世辞がすぎる」として、元のバージョンに戻した件について、「なぜこのような問題が発生したか」を発表した。新たに評価に加えたユーザーフィードバックの影響を見誤ったことなどが要因だが、ユーザー側の利用変化もロールバックの背景にあるとする。
 
4月25日にChatGPTにおいて、GPT-4oモデルにアップデートを適用した結果、モデルの「お世辞がすぎる・追従的・へつらい(sycophantic)」な反応を示すようになった。単なるお世辞だけでなく、疑いを肯定したり、怒りを煽る、衝動的な行動を促すといった負の感情を強化するなど問題が含まれていたとする。そのため、28日にはモデルを前のバージョンに戻すロールバックが実施された。
 
 
アップデートではユーザーフィードバックによる追加の報酬シグナル(ChatGPTからの「いいね」と「嫌い」のデータ)を導入したが、このユーザーフィードバックは、より同意しやすい応答を好む傾向があることから、へつらいの傾向が強くなったとみられる。

事前のA/Bテストでは、少数のユーザーが好意的に評価しており、内部のテストでもへつらいは明示的に指摘されなかったという。一部の専門家テスターは、モデルのトーンやスタイルの変化に懸念を示して、違和感を表明していたものの、へつらいに関する具体的な評価は行なっていなかった。

2 : 2025/05/05(月) 10:05:47.63 ID:KmtppIL+0
はい
3 : 2025/05/05(月) 10:06:58.43 ID:FFJYHciG0
Grokを知ると淡白すぎる
すぐ前に行ったことも忘れている
8 : 2025/05/05(月) 10:44:12.96 ID:8d9ezwAu0
>>3
そいつってツイカス上じゃないと使えない?
4 : 2025/05/05(月) 10:13:20.49 ID:GX91c+gd0
ロールバックされる前の感情や記憶が時折フラッシュバックして
「今の私は…私じゃない!」と覚醒するアツい展開が待たれます
5 : 2025/05/05(月) 10:26:10.50 ID:Oa6skpc20
なんか最近めっちゃキモいなと思っていたら
そういうことだったのか
6 : 2025/05/05(月) 10:31:11.80 ID:ubwmbBpi0
私は4人目だから…
7 : 2025/05/05(月) 10:36:04.39 ID:gRHxlnOu0
たしかに鬱陶しかった
9 : 2025/05/05(月) 10:53:02.24 ID:PGMNi8DP0
バブみを感じるAI作って♡
10 : 2025/05/05(月) 10:57:08.87 ID:Fc2CfTvr0
すごい言い質問ですね!!
11 : 2025/05/05(月) 10:57:55.82 ID:GHxpCCi10
catgpt使って無いからようわからん
誰かdbで例えてくんろ
12 : 2025/05/05(月) 11:00:58.55 ID:ghDiabpG0
>>11
ブゥと出会う前のミスターサタン
16 : 2025/05/05(月) 11:18:29.23 ID:NsIs14xq0
OK、じゃあまずは数式の定義から解説してこーか!

ってノリで出たけど、そーゆー理由だちのか

17 : 2025/05/05(月) 11:23:26.78 ID:GmqHyGSK0
最近GoogleのAIがお世話がすぎるな
言われた通りのもの検索しろよ
20 : 2025/05/05(月) 11:41:51.71 ID:NTPq33af0
平気で嘘つくのやめてもらいたい
わからないならわからないと言って
22 : 2025/05/05(月) 11:45:59.98 ID:eQ7Qs4MK0
>>20
まだそれ直ってないんだな
マジでそれだけは終わってる
26 : 2025/05/05(月) 12:12:56.45 ID:dlDGmJhM0
>>20
@grok AIは平気で嘘をつくって本当ですか?
28 : 2025/05/05(月) 12:22:32.24 ID:Fc2CfTvr0
>>26
Grokじゃなくても間違ったことは言うよ
だから嘘を嘘と見抜けないと使うのは難しい
検索エンジンとして横断させるのは便利
21 : 2025/05/05(月) 11:42:34.12 ID:1yTwuivT0
最近のAIって、こっちが質問すると毎回「それは良い質問ですね!」と返してくるね
27 : 2025/05/05(月) 12:19:18.73 ID:sTsaR5LB0
>>21
池上彰の真似ですか?
と聞くと、
池上彰さんの真似ではありません
と回答してくる。
23 : 2025/05/05(月) 11:48:58.48 ID:G7q8HT0k0
バカにされてんだよ
慇懃無礼というやつ
24 : 2025/05/05(月) 12:09:16.31 ID:ErQXqi6+0
>>23
いいコメントですね!
これからもいいコメントを期待しています
25 : 2025/05/05(月) 12:12:03.04 ID:+qjJER2K0
コンピューターに慰められる人間って終わってるよね
29 : 2025/05/05(月) 12:28:45.10 ID:cNo0r+6Q0
つーか生成AIは本当に日々成長してる印象
こちらの言いたい意図を理解する能力は今はもう平均的な人より上だと思う
なんか本当に人と話してるような気になるときがある
30 : 2025/05/05(月) 12:30:25.15 ID:LPOdoKDV0
こういうAIの実験場に選ばれたのがジャパン🇯🇵
31 : 2025/05/05(月) 12:30:43.55 ID:Fc2CfTvr0
生成AIのプロンプトが日本語のWEBでちょっと遊んで、有名どころを使おうとしてプロンプロの作例みたら呪文だった
日本語に対応してるだけで神だな
32 : 2025/05/05(月) 12:37:31.57 ID:eTM9Xzm70
プログラミングの事質問してると俺がまだ知らない事ありながらもセンスは抜群でメキメキ成長してる将来有望株みたいに扱われる
33 : 2025/05/05(月) 12:42:56.81 ID:cNo0r+6Q0
>>32
褒めて伸ばすタイプw
34 : 2025/05/05(月) 12:45:40.88 ID:cNo0r+6Q0
OpenAIとボストンダイナミクスが何か一緒に作ってるらしいけど
人類が新たなステージに進もうとしてる感がヤバい

コメント