基于大型語言模型的藥理學(xué)考試主觀題智能評分研究
中國醫(yī)學(xué)教育技術(shù)
頁數(shù): 8 2024-07-17
摘要: 文章探討大型語言模型(large language model,LLM)在藥理學(xué)主觀題智能評分中的應(yīng)用效果。選取ChatGPT 4.0、Claude 2、訊飛星火認知大模型3.0、智譜清言3.0和文心一言3.5五種LLM,通過多種評分標準和提示工程技術(shù),對藥理學(xué)短文本類主觀題進行評分。結(jié)果顯示,ChatGPT 4.0評分上表現(xiàn)最為出色,平均絕對誤差率(mean absolute... (共8頁)