Biomni:通用生物医学AI智能体
Biomni是斯坦福大学和基因泰克等机构合作开发的生物医学工具,能自主完成遗传学、基因组学、微生物学、药理学和临床医学等领域的复杂研究任务。它结合大语言模型推理和检索增强规划技术,从海量文献中提取所需工具和数据,动态组合执行研究流程。测试显示,该系统在多个生物医学任务中表现突出,有望提升科研效率并推动临床应用。
Biomni核心部分:
Biomni包括Biomni-E1(统一软件数据环境)和Biomni-A1(基于环境的智能体)两个部分:
Biomni-E1:整合了150个专业工具、105个软件包和59个数据库,所有资源都经过人工验证。例如,它接入了PDB、OpenTarget等数据库的网络API,同时将部分数据下载到本地数据湖并转为结构化格式。
Biomni-A1:采用三项关键技术——大语言模型驱动的工具筛选、以代码作为通用执行接口、自适应规划策略。它支持动态调用定制化资源、组合复杂工作流(如循环与并行操作),并能基于生物医学知识持续优化研究计划。
性能表现
基准测试:在人类最后考试(HLE)中,准确率达到17.3%,远高于基础大语言模型的6.0%;在LAB-Bench数据库问答(DbQA)任务中,准确率达到74.4%,与人类专家水平(74.7%)相当;在序列问答(SeqQA)任务中,准确率达到81.9%,超过人类表现的78.8%。
实际任务:在变异优先级排序、药物重定位等8类任务中,性能较基础大语言模型提升402.3%,显著优于同类工具。
应用案例
可穿戴设备数据分析:解析了458份传感器数据,发现餐后平均体温升高2.19℃的现象及个体代谢差异。
多组学研究:处理了33万+条测序数据,验证了已知基因调控关系,并发现了AUTS2等新转录因子。
实验设计:在基因克隆任务中,生成的实验方案准确性达到人类专家水平。在实际实验室操作中,按照其方案成功完成克隆,测序结果与预期完全匹配。
相关链接
https://www.biorxiv.org/content/10.1101/2025.05.30.656746v1.full