«

医疗AI不靠谱?百川说:幻觉率2.6%,全球最低打脸质疑。

qimuai 发布于 阅读:28 AI新闻


医疗AI不靠谱?百川说:幻觉率2.6%,全球最低打脸质疑。

最新AI落地实操,点击了解:https://qimuai.cn/

医生最怕什么?AI胡说八道。

一个腹痛患者走进诊室,症状不典型,病史复杂。
医生在系统里输入关键词,AI助手迅速给出一串可能的诊断和用药建议。
但医生敢信吗?
万一它“自信地胡说”呢?

这不是杞人忧天。
通用大模型在医学领域“一本正经编病历”的情况,一直是落地最大的暗礁。医学幻觉——就像诊断中的幽灵,看不见,却可能致命。

但今天,有人把这幽灵关进了笼子。


百川智能刚刚扔出一枚“深水炸弹”:Baichuan-M3 Plus 医疗大模型
最核心的一个数字,让整个行业坐直了:
严肃医疗场景下,事实性医学幻觉率降至 2.6%。

全球最低水平。

怎么做到的?
它手里有两把“手术刀”,刀刀精准。

第一把刀,叫“证据锚定”。
模型生成的每一句医学结论,都能精确匹配回原始论文的特定段落
匹配准确率超过95%。
这意味着什么?
AI的每一条建议,旁边都自带“参考文献”和“原文高亮”。可核验、可追责、可教学。医生不用再猜“它这话是哪儿来的”,一键溯源,眼见为实。

第二把刀,叫“六源循证”。
它不是漫无目的地从海量信息里捞答案,而是锁定了六个最权威的“信息池”:

  1. 国际诊疗指南
  2. 国家药典
  3. 核心期刊文献
  4. 临床试验数据库
  5. 药品说明书
  6. 真实世界研究数据

生成答案时,动态检索、交叉验证。
相当于给AI配备了一个由顶尖专家组成的“实时陪审团”,从根源上杜绝了“拍脑袋”的胡说。


技术很硬核,但落地很务实。

对于一线医生,它处理复杂病例、判断药物相互作用时,准确率大幅提升,相当于一个随时在线的、极度严谨的“超级住院医”。
对于医院和互联网医疗平台,它正在打开一扇新的大门。
百川智能启动了 “海纳百川”计划——直接将M3 Plus的API,免费开放给中国的医疗服务机构。

是的,免费。
临床辅助决策、医学教育培训,这些核心场景先跑起来。

同时,API的调用价格比上一代直降70%
技术壁垒在破除,应用门槛在坍塌。未来,它很可能无缝嵌入你的电子病历系统,成为诊疗流程里一个安静而可靠的背景音。


医疗,大概是AI渗透最谨慎、最缓慢的领域。
因为这里不允许犯错,没有“试一下再说”的空间。
百川M3 Plus做的,就是拆掉那颗名为“不可信”的炸弹。当幻觉率被压到全球最低,当每一句话都有据可查,医生伸向AI辅助的手,才会更坚定一些。

信任,是技术照亮现实的第一束光。
而这束光,正开始照进诊室。


所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。

AI每日进展

文章目录


    扫描二维码,在手机上阅读