. 2024 Mar 15;14(3):e080558. doi: 10.1136/bmjopen-2023-080558

Table 1.

Performance of ChatGPT on medical examination

Model	Country	Examination	Score	Pass mark	Result
Galactica	USA	USMLE (MedQA)²³	52.9%	60%	Fail
Flan-PaLM	USA	USMLE (MedQA)⁹	67.6%	60%	Pass
ChatGPT 3.5	USA	USMLE⁵	44%–64.4%	60%	Mixed
ChatGPT 3.5	USA	USMLE⁶	42.1%–65.2%	60%	Mixed
ChatGPT 3.5	USA	American Heart Association life support exams²⁴	68%–76.3%	84%	Fail
ChatGPT 3.5 & 4	USA	Plastic Surgery In-Service Training Exam²⁵	ChatGPT 3.5: 3rd (2021) and 8th (2022) decile	–	–
ChatGPT 3.5 & 4	USA	Plastic Surgery In-Service Training Exam²⁵	ChatGPT 4: 99th (2021) and 88th (2022) decile	–	–
ChatGPT 4	USA	USMLE¹²	85%	60%	Pass
ChatGPT 3.5	UK	General Practitioner (GP) AKT²⁶	60.17%	70.42%	Fail
ChatGPT 3.5 & 4	USA	Ophthalmology Board Exam²⁷	ChatGPT 3.5%–63.1%	65%	Fail
ChatGPT 3.5 & 4	USA	Ophthalmology Board Exam²⁷	ChatGPT 4%–76.9%	65%	Pass
Med-Palm 2	USA	USMLE (MedQA)¹⁷	86.5%	60%	Pass
ChatGPT 3.5 and 4	USA	Neurosurgical Board Exam²⁸	ChatGPT 3.5 62.4%	–	–
ChatGPT 3.5 and 4	USA	Neurosurgical Board Exam²⁸	ChatGPT 4 85.2%	–	–
ChatGPT 3.5	UK	FRCA Primary²⁹	69.7%	71.3%	Fail
ChatGPT 3.5 and 4	UK	Dermatology SCE³⁰	ChatGPT 3.5%–63.1%	70%–72%	Fail
ChatGPT 3.5 and 4	UK	Dermatology SCE³⁰	ChatGPT4 90.5%	70%–72%	Pass
ChatGPT 3.5 and 4	UK	Neurology SCE³¹	ChatGPT 3.5%–57%	58%	Fail
ChatGPT 3.5 and 4	UK	Neurology SCE³¹	ChatGPT 4%–64%	58%	Pass
ChatGPT 3.5	USA	Neonatal Board Exams³²	45.3%	–	–

AKT, Applied Knowledge Test; FRCA, Fellow of the Royal College of Anaesthetists; SCE, Specialty Certificate Examination; USMLE, United States Membership Licensing Examination.