免费开放!生命科学领域成熟、社区驱动的标准化软件注册
摘要
计算方法是生命科学研究的核心支撑。随着软件工具与数据库的快速增长、类型多元化,研究者难以针对特定任务高效查找、比对和复用相关方法。bio.tools是个社区驱动的软件注册库,旨在提升研究软件的可见度,通过结构化、可互操作、易获取的元数据体系,简化研究者对接软件生态的流程。
该平台采用EDAM本体及其他受控词表对工具进行标准化标注,支持用户按研究主题、分析操作、输入输出数据类型与数据格式进行多维度检索筛选。bio.tools提供信息完善的工具详情页以支持交互式探索,同时提供文档完备的REST API,支持工具检索、信息获取与注册库统计数据的程序化调用。
依托数千名社区成员的共同贡献,结合半自动化文献挖掘技术保障内容时效性,该注册库目前已收录近3.3万条标注完善的工具条目。近期升级内容包括:引入机器辅助评分机制以优化人工审核优先级、统一标准体系与软件架构。此外,bio.tools已成为核心的上游元数据数据源,被ELIXIR研究软件生态系统及众多外部服务复用,支撑数据同步、交叉关联与各类下游服务。
veits@bmb.sdu.dk
#研究软件注册库 #biotools #EDAM本体 #FAIR原则 #文献挖掘 #生命科学软件生态
网络服务功能说明
应用程序接口
表1核心接口端点与典型使用场景
涵盖工具列表查询、通用检索、属性筛选、单工具详情获取等场景,标注各接口的请求方法、路径、功能说明与身份验证要求。
输出展示模块
表2bio.tools注册库当前内容统计数据
数据汇总自官方/api/stats接口,涵盖工具类型分布、各类EDAM标注总量等核心指标。
结果与讨论
使用场景A:基于本体概念的工具发现
图1 bio.tools工具展示形式概览
上方为场景A检索得到的工具列表;左下方为列表首位工具MAFFT的详情页面;右下方为该工具在OpenEBench中的基准测试信息,以及TeSS平台中的配套培训资源。点击主题或任意功能属性标签,可跳转查看同主题、同功能标注的其他工具。
使用场景D:融入研究软件生态系统,实现多资源联动
图2 bio.tools在研究软件生态系统中的定位及跨服务关联
标注了各平台接入的bio.tools标识符数量:Galaxy 502个、debian-med 357个、Bioconda 1784个、Biocontainers 1134个;RSEc Atlas、EBI Search、NIAID数据生态全量收录;ToolFinder收录526个。
数据
官方服务地址
https://bio.tools
平台源代码(采用GPLv3开源协议)
https://github.com/bio-tools/biotoolsRegistry
使用帮助与官方教程
https://biotools.readthedocs.io/en/latest
编目配套工具资源
文献挖掘、大语言模型评分与平台上传全流程封装
https://github.com/bio-tools/BiotoolsLLMAnnotate
Pub2Tools文献转工具条目
https://github.com/Bio-tools/pub2tools
EDAMmap本体自动映射
https://github.com/Edamontology/edammap
注册库统计可视化页面
https://bio.tools/stats
接口开发文档
https://biotools.readthedocs.io/en/latest/api_reference.html
4个核心代码仓库已在Zenodo平台完成永久归档
https://doi.org/10.5281/zenodo.19662200
详细总结
思维导图
参考
Nucleic Acids Res. 2026 Jun 27:gkag420. doi: 10.1093/nar/gkag420.
bio.tools: an expanded web service for research software in the life sciences
注:AI辅助创作,如有不当欢迎指出。内容仅供参考,不构成任何建议。
