- 1 : 2023/04/25(火) 20:48:01.96 ID:Azb8wafI0
-
Chat-GPTが第117回医師国家試験の合格点を獲得ーー。
株式会社MICINは4月25日、金沢大学医学類の学生および同大融合研究域融合科学系の野村章洋准教授らの研究グループと共に実施した研究に関する成果を報告する論文をオンラインで公開したことを発表した(詳細については論文を参照)。この研究は、2023年2月に実施された第117回医師国家試験の画像なし問題262問を、昨今注目を集める生成AIによる対話型サービス「Chat-GPT」のGPT-3.5およびGPT-4に解かせるという内容だ。
その結果、Chat-GPT(GPT-4)は必修問題(合格最低ラインは80.0%)で82.7%、基礎・臨床問題(合格最低ラインは74.6%)で77.2%のスコアを獲得し、合格最低ラインを満たした。
研究グループは第117回医師国家試験の問題を解かせる前に、まずは第116回医師国試の画像なし問題を用いて入力プロンプト(Chat-GPTから回答を得るための指示文)を検討し、GPT-3.5を用いた第116回医師国試の当初の検証では52.8%という正答率を得た。
その後、プロンプトを平易な英語に翻訳した上で要約をすることや、基礎・臨床といった質問タイプごとにプロンプトをチューニングするといった調整を行うことで、正答率が向上した。
こうした調整を経て、第117回医師国家試験の問題を解かせた結果、262問中206問で正解した。必修問題と基礎・臨床問題ともに、合格最低ラインを満たした。
研究グループは不正解となった56問について、なぜ不正解となったのか要因を分析している。その結果、不正解となった56問のうち33問(58.9%)では「医学知識の不足」が、17問(30.4%)では「日本特有の医療制度情報」が、4問(7.1%)では「数学的誤り」が要因となっていたことが分かった。
論文において研究グループは「医学の文脈において時代遅れ、決定的に間違っている回答もあった」としたほか、「医療保険分野における日本の薬事法、厚労省の指導、ガイドライン、公衆衛生に関する問題についてChat-GPTは適切に答えることができなかった」としている。
- 2 : 2023/04/25(火) 20:48:49.52
-
>>1
底辺私立医はもうイラネ - 3 : 2023/04/25(火) 20:50:04.70 ID:wcoOkKxQ0
-
べつに試験に受かったから医師として優秀とは限らんからな
俺よりは優秀やけど - 4 : 2023/04/25(火) 20:50:16.81 ID:luXvwaeF0
-
>>1
カンニングしながら試験受けてるようなもんなのに、これ意味あるんかね?
記憶力を試される試験で良い点取れるのは当たり前だろ。 - 8 : 2023/04/25(火) 20:54:40.04 ID:hIBT2vz20
-
>>4
プロンプト打ち込んだからって質問に正確に答えが出て来るわけじゃない
前後の文章の組み合わせや単語ですら正確なのが出てこないこともある - 11 : 2023/04/25(火) 21:01:29.64 ID:luXvwaeF0
-
>>8
事前にAIのデータベースに過去問を記録しておけば、あとは選択するだけ。
AIのメインプログラムだけで問題を解いて正解するなら凄いけど、こんなのただのカンニングだろ。 - 12 : 2023/04/25(火) 21:05:16.14 ID:hIBT2vz20
-
>>11
選択するために質問内容を正確に把握できないと選択することすらできない
AIは引っかけ問題なのを理解して答を導きだすのが苦手 - 15 : 2023/04/25(火) 21:08:50.49 ID:luXvwaeF0
-
>>12
そのひっかけもパターンを沢山登録すれば対応出来る。
たんなるデータの物量作戦だからね、いまのAIは。
なんか質問の意味を理解してAIが答えてると思ってるんだろうけど、
いろんなパターンと比較・検索してマッチするものを選んでるだけだよ。
比較・検索は人間の100万倍のスピードで出来るというメリットを武器にしてるのが現在のAI。 - 22 : 2023/04/25(火) 21:15:34.97 ID:hIBT2vz20
-
>>15
なんか勘違いしてるが、自分で考えてるとは一言も言ってないが
むしろそれができることは永遠にないと言われてるぐらいだし - 16 : 2023/04/25(火) 21:09:19.77 ID:m7nX+g2b0
-
>>4
ネットでググってそれっぽい単語から文章を拾って繋げてるだけだからな
実際にやってる事は人工知能による思考ではなくただの統計 - 20 : 2023/04/25(火) 21:11:38.60 ID:luXvwaeF0
-
>>16
本当にAIが自分で考えてると思ってる人多いよねw
単に攻略本を見ながらゲームをクリアするやつとか、カンニングして試験でいい点を取る馬鹿学生と同じなのにさw - 5 : 2023/04/25(火) 20:50:26.53 ID:aF5RdSB00
-
>>1
金沢大医学部に行くと最初に「君たちは金沢医大と間違われることもあるだろうが我慢してほしい」と言われると聞いた - 6 : 2023/04/25(火) 20:52:08.29 ID:Pn0OOwQq0
-
普段使いの実用性では今はBingChatが一番だけどな
- 7 : 2023/04/25(火) 20:52:37.50 ID:DRHLMSe/0
-
あの人どうするんよ
- 9 : 2023/04/25(火) 20:57:24.97 ID:3kX/T8Cr0
-
こいつ知らないことを知った風に言いすぎなのが問題
- 10 : 2023/04/25(火) 20:59:10.30 ID:LouiAked0
-
そりゃ答え見ながら回答してるのと同じだから合格するの当たり前でしょw
- 13 : 2023/04/25(火) 21:06:58.44 ID:S093tVhb0
-
10年後に残ってる仕事って何なんだろな
宅配便か - 14 : 2023/04/25(火) 21:08:48.39 ID:cnbeW2ta0
-
画像診断でもはや人間の医師の目と経験に基づいた診断なんか不正確で
MRI診断なんかAIの方が1000倍正確になるんじゃないか?
将来外科手術にしても機械の方が失敗しないって事になりそう - 17 : 2023/04/25(火) 21:10:19.21 ID:luXvwaeF0
-
>>14
画像診断は推測による部分が半分以上あるから、AIには難しい課題だな。
それが出来るようになれば自動運転もレベル4を達成できるんだが。 - 18 : 2023/04/25(火) 21:10:46.92 ID:Diebk9F10
-
1次産業以外無くなりそうだなw
- 21 : 2023/04/25(火) 21:12:57.50 ID:Hv8ri1Kh0
-
>>18
ChatGPTを扱う人が必要だからブルーカラーは永遠に底辺だよ!やったね! - 19 : 2023/04/25(火) 21:11:16.36 ID:s6YkuIt20
-
ChatGPTにバカ左翼どもの出自を聞いてみると嘘八百ばっか言うで
とてもじゃないが使い物にならんわ - 23 : 2023/04/25(火) 21:17:12.16 ID:zGBHgQ700
-
コレって人間が思いもつかないような回答捻り出せるレベルまでのものなの?
結局人間がせっせとデータ入力してそこから最適解を見つけられるってレベルとちゃうの? - 24 : 2023/04/25(火) 21:22:00.91 ID:s6YkuIt20
-
>>23
試しにアカウント作って聞いてみなはれ日本経済を復活させる方法とか
バカ左翼を殲滅する方法とか - 25 : 2023/04/25(火) 21:23:20.94
-
生身の人間と同じ条件で競わせるのはフェアじゃないでしょ
回答の持ち時間は人間の50憶分の1にしなきゃ
- 29 : 2023/04/25(火) 21:37:00.53 ID:luXvwaeF0
-
>>25
そもそもChatGPTは数百人規模の人間と同じ規模のシステムだからなぁ。
それなら人間も数百人用意して、やっと公平な条件なのにさ。 - 27 : 2023/04/25(火) 21:29:02.49 ID:US3kzdmz0
-
まぁ限りなく正解に近づけるシステムだからね
100パーのパーフェクト超人になってからが勝負だ - 31 : 2023/04/25(火) 21:42:23.71 ID:OCwicaKi0
-
他人が作ったもので研究ですとか金大も墜ちたものだな
- 32 : 2023/04/25(火) 21:44:30.19 ID:vlApFYfu0
-
な?医師と士業は今後不要だろ?
更に自動運転とAIで運転手も不要だ
もちろん事務系の仕事も不要、義務教育レベルの教師も不要
これら無駄な人材を早急に解雇して、全国民に月10万くらいのBI支給支給すればいいのよ - 33 : 2023/04/25(火) 21:45:25.36 ID:K3XCRkHL0
-
質問文を解析して、問題答案の元となった問題集や教科書の内容から検索して、
そこから一致する内容を取り出して、そのまま答えているだけだからな
精度が上がれば、東大だろうがハーバード大学医学大学院だろうが
そのまんまカンペしているだけだから、問題集の点数は取れるだろ - 34 : 2023/04/25(火) 21:46:37.11 ID:ZlltXH7a0
-
一級建築士の製図試験やれないかな模範解答と比べたい
- 35 : 2023/04/25(火) 21:50:25.92 ID:2F55LqbY0
-
そりゃそうだろよ。ネットから回答拾ってくるだけだしな
コメント