OpenAI 發布并開源醫療測試基準 HealthBench,旨在更好地衡量 AI 系統在醫療健康領域能力
2025-05-13 19:01:58 小編:鑫昌軟件園
本站 5 月 13 日消息,OpenAI 今日宣布推出了一個專門面向醫療大模型的測試評估集 ——HealthBench 并開源,旨在更好地衡量 AI 系統在醫療健康領域能力。

與以往測試集不同的是,HealthBench的 5000 段核心測試對話,由來自 60 個國家 / 地區的 26 個專業 262 名醫生打造,極大增強了該測試集的難度、真實性以及豐富度。
與以前的狹窄基準不同,HealthBench 通過 48562 個獨特的醫生編寫的評分標準進行有意義的開放式評估,涵蓋多個健康背景(例如,緊急情況、全球健康)和行為維度(例如,準確性、遵循指示、溝通)。
此外,HealthBench采用了多輪對話測試,而不是簡單的答題或選擇題模式。本站注意到,測試數據顯示大模型在醫療保健領域的表現有了顯著提升。例如,從之前的 GPT-3.5Turbo 的 16% 到 GPT-4o 的 32%,再到 o3 的 60%,整體性能有了顯著進步。尤其是小型模型的進步更為突出,GPT-4.1nano 不僅在性能上超越了 GPT-4o,而且成本降低了 25 倍。
參考資料:
《HealthBench: Evaluating Large Language ModelsTowards Improved Human Health》
- 猜你喜歡
-
天空戰士空戰游戲正版239.09手游下載 -
小小幻獸錄0.1折版456.02MB手游下載 -
勇士爭霸赤膽聯盟最新版105MB手游下載 -
藥劑工藝煉金模擬器手機版65.25MB手游下載 -
夢之旅人0.1折手游12.6MB手游下載 -
我的世界方舟生存進化MOD整合包版124.73MB手游下載 -
劍雨九天(青蓮傳奇免費版)BT手游198MB手游下載 -
無雙之刃滿攻速高爆率傳奇170.9MB手游下載 -
裝機模擬器2免費版188MB手游下載
- 相關手機游戲
-
鎧甲勇士飛影召喚器模擬器9.17MB手游下載 -
幻境咖啡館破解版151.72MB手游下載 -
Scale the Depths手機版27.16MB手游下載 -
阿斯達年代記國際版947.54MB手游下載 -
植物大戰僵尸GhTr版137.22MB手游下載 -
歡樂時光計劃3手機版1.22GB手游下載 -
植物大戰僵尸拼接版131.3MB手游下載 -
印尼卡車模擬器無限金幣版1016.4MB手游下載 -
RE記憶碎片白色陰影官方版135.45MB手游下載
- 推薦鑫昌秘籍
- OpenAI 發布并開源醫療測試基準 HealthBench,旨在更好地衡量 AI 系統在醫療健康領域能力
- 比亞迪方程豹全新 SUV 車型“鈦 7”諜照曝光,依舊硬派
- 蘋果自研 5G 基帶首個漏洞被修復:可攔截流量,中國安全專家發現
- 美團騎手養老保險試點結果公布,首批補貼已到賬
- Sonos Arc Ultra 回音壁首推 AI 語音增強:四級語音增強,告別聽不清
- 感覺身體不給力?學習這幾招讓你快速恢復體盛!
- 三星最薄旗艦 Galaxy S25 Edge 手機發布,起價 7999 元
- 云頂世界賽中國隊有哪些選手?(盤點CN賽區參賽大神!)
- 米哈游老板為什么這么低調?了解他們的行事風格與理念。
- Spectre V2 卷土重來:英特爾及 Arm 處理器新漏洞“Training Solo”曝光,需多層面修復
- 最新手機精選
-
櫻桃視頻直播官方版下載2025-01-28手游下載 | 88.51MB -
花心直播軟件在哪里下載安卓版最新版2025-03-15手游下載 | 85.77MB -
愛威奶app下載最新版2025-02-07手游下載 | 44.8MB -
月夜直播免費版下載觀看下載官方版2025-02-09手游下載 | 55.74MB -
向日葵app下載汅api免費絲瓜ios在線觀看安卓版下載2025-03-14手游下載 | 50.38MB -
黃色直播軟件app2024最新版2025-01-30手游下載 | 65.42MB










