【IT】プログラミングに関するChatGPTの回答、半数以上に何らかの間違いが含まれるとの研究結果

サムネイル
1 : 2024/05/28(火) 19:56:08.62 ID:SSWDI3dS

プログラミングに関した質問に対するChatGPTの回答のうち、52%が間違っていることを示す研究結果が発表されて一部で話題だ。

 これは、今月行われたカンファレンス「CHI 2024」で、米パデュー大学の研究者チームが発表したもの。それによると、「Stack Overflow」における517の質問に対するChatGPTの回答を分析したところ、そのうち52%に誤った情報が含まれていたという。全面的に間違っているわけではなく、一部に誤った情報が含まれていたにすぎないものの、かなり高い割合であることには間違いない。また、これと並行して行われたChatGPTの回答に対する言語分析では、12人のプログラマーを対象にアンケート調査を行ったところ、35%がChatGPTの口調を好ましいと回答、39%は内容の間違いに気付かなかったという。つまり、回答の丁寧な口調や、包括的に言及していると感じられる明解で教科書的に整理された文章から説得力を感じて、誤りを見抜けずスルーしてしまうケースが少なからずあるというわけで、ユーザー側も鵜呑みにしないことが求められそうだ。
https://internet.watch.impress.co.jp/docs/yajiuma/1594823.html

2 : 2024/05/28(火) 20:05:20.76 ID:+3wiHMH1
知ってる
3 : 2024/05/28(火) 20:07:43.06 ID:QT1vCOXg
ChatGPTは
平気で嘘をついているのか
間違っているのか
分かっているけど一旦適当に応えているのか
指摘すると謝って別の回答を提示するけど
反省はしていないように感じる
4 : 2024/05/28(火) 20:08:45.93 ID:3FspyMJ8
9割以上間違ってるだろ
事例が少ないと平気でウソ言うし
5 : 2024/05/28(火) 20:18:35.70 ID:wBuPXoWK
そんなことはわかって上で使ってる。それでも自分で書くより圧倒的に早く書ける
6 : 2024/05/28(火) 20:22:06.79 ID:uOG87MXQ
間違いを見つけたら直せばいいのよ
勘定系や学術系、法務系に使わなければ問題ない
7 : 2024/05/28(火) 20:28:29.65 ID:Pl0RXLh5
まあスキルの低い奴にとってはありがたいんだろうな
8 : 2024/05/28(火) 20:30:48.48 ID:aK4k10lq
BASICで数当てゲーム作らせたらバグだらけだった
9 : 2024/05/28(火) 20:41:03.63 ID:msj1TqYN
体感といっしょだ
だいたい半分は動かない
10 : 2024/05/28(火) 20:57:59.29 ID:nKJdvIr0
解のない、または状況で正解が変わる
ふわっとした回答のほうが得意なんだよね
人間がAIに求めるのは真逆なんだけど
11 : 2024/05/28(火) 21:00:37.23 ID:z4GLzqPw
最近複数回答するのようになってめんどくさくなった
12 : 2024/05/28(火) 21:11:55.06 ID:T5BmCCwA
ChatGPTはポンコツ太郎君
13 : 2024/05/28(火) 21:12:01.43 ID:ArS9yj3E
ここ最近やってないけど
間違ってる箇所を指摘し続ければ直すぞ
14 : 2024/05/28(火) 21:16:04.78 ID:YJNY2Uf7
インテリコードで十分
15 : 2024/05/28(火) 21:19:57.23 ID:NDU+AEq+
シンギュラリティとかイキってた奴は
仕組みしらないバカだけだし
16 : 2024/05/28(火) 21:46:28.72 ID:Wbx9Q4He
AIは正解が必要なものよりも、正解がない文系のお仕事向き。
弁護士とか法案制定とかだね。
17 : 2024/05/28(火) 21:51:41.47 ID:lb/Ww8f+
プログラミングは見る人が見ればわかるからプログラマが使う分には困らないんだよ
こういう記事を真に受けて生産性を上げる機会を失うのもったいなさすごる
26 : 2024/05/28(火) 22:47:07.66 ID:nG+vVQlx
>>17
これ。
雛形作るには十二分なんだよな。
28 : 2024/05/28(火) 23:06:21.59 ID:EXhnaG5h
>>26
確かにね
新しいヒントなんかも貰えるのも良い

マスゴミなんかが、プログラマが不要になるとか言っているのを見ると、ズッこけるがな

18 : 2024/05/28(火) 21:54:19.82 ID:b7lE1oiF
たたき台ができるだけでも作業効率が段違いなんだよね。
19 : 2024/05/28(火) 21:55:58.02 ID:UJLleDv4
大規模開発でもコードレビューしなかったり
とりあえず動けば後の修正はテスト次第で。
20 : 2024/05/28(火) 22:09:28.48 ID:Y5BT68jv
関数名とか文章の相応しい書き治しには便利
21 : 2024/05/28(火) 22:14:20.35 ID:5O8KFKkg
>「Stack Overflow」における517の質問に対するChatGPTの回答を分析したところ
そもそも学習してるStackOverflowの回答が間違ってるからな。
23 : 2024/05/28(火) 22:35:14.85 ID:A0tSI2Zx
AIが出力した間違った情報がインターネットに広がって、それをまたAIが学習してえらいことになり始めているとか
24 : 2024/05/28(火) 22:40:41.65 ID:pgVfPX6w
こうやって重要システムのコードにバグがどんどん仕込まれる
そしてそのバグを見つけ出せないプログラマもどんどん増える
25 : 2024/05/28(火) 22:46:22.11 ID:0ctAPmtR
AIも学習しなかったら知らないことも当然多いだろう
知られていない未知の案件も答えようがないし
27 : 2024/05/28(火) 23:05:30.49 ID:3CIwke3t
質問の仕方が悪いと制度の悪い答えが返ってくるのもあるぞ
間違ってたらその修正を依頼してけばだいたいの正解に辿り着くわ
29 : 2024/05/28(火) 23:07:43.34 ID:3CIwke3t
といっても生成AIはプログラミングが最も得意分野とも言われてるんだし
質問者も質問スキルが結構要求される
30 : 2024/05/28(火) 23:11:13.48 ID:Pwj/Prp8
解答が正しいかどうかは問題ではない。
裁定でもリファレンスの代わりになるならそれで十分なのだ。
あらゆる言語の正規表現作ってくれるだけでずいぶん楽になるわ
31 : 2024/05/28(火) 23:23:29.44 ID:qSMMER9C
でも無知でもマルウェア作れるぐらいすごいんだよな

コメント