百川智能联合清华发布医疗增强大模型 Baichuan-M4,多项指标超越 GPT-5.5 等竞品!

序号1

Baichuan-M4 发布:医疗大模型新突破

近日,百川智能联合清华大学研究团队发布了新一代医疗增强大模型 Baichuan-M4。该模型在多个关键指标上表现出色,标志着医疗大模型领域的新进展。

序号2

多项榜单夺冠,幻觉率低至 3.3%

Baichuan-M4 在 HealthBench 及其 Hard、Professional 三个榜单上同时位列世界第一,全面超越 GPT-5.5、Claude Opus 4.7、DeepSeek-V4-Pro 等竞品。其幻觉率低至 3.3%,这一数据显示了模型在准确性和可靠性方面的优势。

序号3

问诊能力突出,初诊复诊成绩领先

在问诊方面,Baichuan-M4 会主动追问症状的性质与诱因,优先识别和排查危急重症。在动态问诊评测体系 SCAN-bench 测评中,M4 初诊 79.0、复诊 74.7,均明显领先于 GPT-5.5、DeepSeek-V4-Pro 和 Claude Opus 4.7。

序号4

全病程记忆功能,长上下文临床记忆评测得分最高

Baichuan-M4 推出了「全病程记忆」功能,打通历史病历、多轮问诊、化验趋势与用药反馈。在长上下文临床记忆评测中,M4 取得 86.9 分,为同类最高,较上一代 M3 提升 21.1 分。

序号5

循证引用精度高,超越 GPT-5.5 等

基于“证据锚定”技术,Baichuan-M4 生成的每一句医学结论都精确对应到原始论文或指南中的具体段落。在百川构建的循证医学评测 Baichuan-EBM 上,M4 的循证引用精度达到 90.0,而 GPT-5.5 为 54.7,OpenEvidence 为 55.9。

编辑观点:Baichuan-M4 的发布为医疗大模型市场带来新活力,其多项领先指标有望改变竞争格局,未来在医疗领域的应用和商业化值得期待。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值