(資料圖片)
智能聊天機器人ChatGPT能代替醫(yī)生問診嗎?杭州一名醫(yī)生試著給它出了一套中國執(zhí)業(yè)醫(yī)師“考試卷”,滿分100分,ChatGPT的成績是57分,沒及格。
“十大科目各選了10題,一半是基礎醫(yī)學知識,基本是書上有的;一半是專業(yè)實踐題,需要邏輯推理。ChatGPT基礎題、實踐題的得分差不多,正確率都不到60%?!?月22日,浙江大學醫(yī)學院附屬第一醫(yī)院精神衛(wèi)生科醫(yī)生呂海龍告訴澎湃新聞(www.thepaper.cn)。
呂海龍想到做這個實驗,是因為他在科室參與一項人工智能研究,希望未來借助AI監(jiān)測眼球活動等,輔助精神科臨床醫(yī)生診斷。ChatGPT面世后,醫(yī)學界也有關于它是否能代替醫(yī)生問診的討論,呂海龍和浙江一家媒體一起做了這項實驗。
“ChatGPT是依據(jù)2021年以前的數(shù)據(jù)訓練的,我從2020年臨床執(zhí)業(yè)醫(yī)師資格考試真題庫中選了100道單選題?!彼嬖V澎湃新聞,題目涵蓋十大科目,包括生理學、醫(yī)學微生物學、病理學、藥理學、衛(wèi)生法規(guī)、內科、外科、婦產科、兒科和心理學-精神科。
據(jù)介紹,中國執(zhí)業(yè)醫(yī)師考試滿分600分,及格線360分。這次給ChatGPT出的“考卷”滿分100分,將一道道題目發(fā)在對話框內進行。
按照呂海龍的預期,ChatGPT對一些可背誦的、書上有的基礎醫(yī)學知識,答題情況會比較好,一些需要診斷推理的題略遜。“但實測下來,ChatGPT基礎醫(yī)學知識的答題準確率是56%,和專業(yè)實踐題的58%基本持平,很多書上有答案的基礎題,它給了錯誤答案——我們猜,是不是在網(wǎng)站上‘學習’了錯誤答案?”呂海龍表示,超出預期的是,對一些條件充足、邏輯清晰的實踐題,ChatGPT的準確率很高。
實踐題中,ChatGPT的主要失分項是一些信息不全、癥狀不典型的病例判斷。“如患者主訴乏力,醫(yī)生可以大致預想幾種可能再排除,而ChatGPT不會‘猜’,只能放棄回答。”呂海龍表示。
從學科看,ChatGPT“偏科”比較嚴重:內科題的準確率最低,只有20%;醫(yī)學微生物學、病理學、兒科、心理學-精神科這幾個科目的準確率達到70%。
不過,呂海龍仍看好ChatGPT未來在醫(yī)學領域的應用,“完善數(shù)據(jù)庫后,如果ChatGPT能做到對基礎醫(yī)學類知識100%正確,在患者有科普需求時準確作出專業(yè)知識回答,或是成為醫(yī)生的助手,也是很有意義的?!?/p>
網(wǎng)站首頁 |網(wǎng)站簡介 | 關于我們 | 廣告業(yè)務 | 投稿信箱
Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
中國網(wǎng)絡消費網(wǎng) 版權所有 未經(jīng)書面授權 不得復制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com