界面新闻记者 |
界面新闻编辑 | 文姝琪
“中国和美国相比,美国45%的医生在用AI,我们远远没有达到这个水平,跟我们的思考、分工、国情都有关系。”百川智能CEO王小川想要用方法让中国的医疗AI市场追上去。
在大模型行业还在以参数为竞赛主线的时候,王小川就选择了医疗这条更窄的路。一段颇为静谧的调整期过后,如今他以一种“卷起来”的姿态密集披露公司的技术进程。
1月22日,百川智能发布新一代医疗大模型Baichuan-M3 Plus,此次的焦点在于呈现模型的判断究竟能否在医疗场景中被验证、被信任、乃至被真正使用。
大模型正在进入普通用户的自诊场景,但误判和幻觉对医疗AI的用户信任问题有巨大影响,因而低幻觉是AI迈向临床的前置门槛。
百川称,M3 Plus在严肃医疗问答中的事实性幻觉率降至2.6%,低于目前行业标杆Open Evidence,达到全球最低水平。这一结果建立在此前M3已在HealthBench、HealthBench Hard等评测中取得第一的基础之上。

百川试图进一步解决的,是信任之后的核验问题。
M3 Plus引入了其称为“证据锚定(Evidence Anchoring)”的新技术路径。不同于行业中常见的列出参考文献的做法,该模型要求每一句医学结论,都必须精确对应到论文或指南中的具体证据段落。也就是说,医生能看到文献来源,也能直接定位具体原文。
为此,百川在训练阶段引入了独立的引用奖励模型(Citation Reward Model),对错误或不匹配的引用进行惩罚。据其技术负责人鞠强披露,最终结论与证据段落的匹配准确率超过95%。
另外,王小川认为,只有当成本足够低,AI才可能进入临床辅助和医学教学等高频场景。因而在工程层面,百川也试图降低医疗AI落地的成本门槛。通过MoE架构优化、模型量化以及投机解码等手段,M3 Plus的API调用成本较上一代下降70%。
相较通用场景,医疗AI目前还是一个未爆发的赛道,百川希望能先把市场做大。公司同步推出了“海纳百川”计划,将M3 Plus以API形式向中国医疗服务机构免费开放,使用范围限定在临床辅助决策和医学教育。
“要是全部临床医生都使用AI,我们觉得一年的成本也就是1亿左右。”王小川说,“中国现在有500万的医学工作者,我们认为这种成本是可接受的,带来的行业变化会非常大。”
他认为中国医生之所以相对美国医生拥抱AI的态度更保守,一方面是因为“中国医生太忙了”,另一方面是中国没有像美国那样真实地表达进展,“就像我们发布一个模型,我们说好的话大家都不信,美国人说大家才信。”
不过免费向机构端开放API的背后,一个现实考量是百川智能明确了向医院、向医生收费的商业模式是不成立的,因此API开放战略的本质目的是推动AI医疗的普及率,从医生端逐步化解这类产品的信任问题。
对于医疗模型可能涉及的安全对齐问题,以及现有法规下,面向患者不能跨越的诊疗结论红线,王小川告诉界面新闻记者,百川的做法是医生使用时AI可以给出诊疗结果,由医生把关并最终决策,相应责任依然归属于医生;但患者使用仍不可以提供结论,仅起到辅助决策的作用。
在大模型公司分化日益清晰的当下,一部分公司继续押注通用能力和平台化叙事;另一部分则开始在垂直领域寻找确定性更高的落点。王小川显然选择了后者。
但在他看来,这也并不违背所有模型公司都在追求的AGI道路。“如果医疗AI能达到和医生同样的水平,并且能上岗,那本身就是对人类职业的一个Benchmark。”



还没有评论,来说两句吧...