SciVerse Logo
Sciverse

Sciverse

面向科学大模型与 AI 科学家的全模态AI-Ready数据基座

科学数据体系

从科学通识、跨模态对齐到演化推理,重塑AI的科学认知底座

Sci-Base

科学通识层

Literature

Book

Patent

CC

Code

Sci-Align

科学跨模态对齐层

VisDoc

BioAlign

ChemAlign

Sci-Evo

科学演化层

Sci-Mutate

Sci-Optimize

Sci-Agent

Sci-Reaction

AI-Ready 科学数据集

覆盖核心重点学科的高保真、跨模态的前沿科学数据集

Sci-Base

全域顶刊文献库

首次发布超 2500万+ OpenAccess(OA)的AI可用的科学文献和书籍数据集,规模庞大、彻底清洗,覆盖数学、物理、化学、材料、生命科学、地球科学等十大重点学科,是全球最大、最纯净的科学底座

Sci-Base
Sci-Align

SA-Prot-Annot

高质量蛋白质注释数据集

生命科学

来源Swiss-Prot和TrEMBL形成千万级高保真蛋白质条目,六大维度解析,涵盖蛋白质家族分类、主要功能、酶活性、代谢通路、亚细胞定位及结构域注释,每项预测附带置信度分数,兼顾通量与可解释性。

SA-RxnDiagram-15k

化学反应图解析数据集

有机化学

最大规模真实化学文献反应路径图数据集,含1.5万张图像及4.8万个反应实例,覆盖多样化拓扑结构,为高精度反应路径解析模型提供关键基准,驱动化学文献智能化与自动化研究。

Sci-Align

科学数据案例

从高质量科学数据到科研洞察落地案例,赋能具体科学研究

SeqStudio

SeqStudio

生命科学

支持新一代AI蛋白质功能分析

融合生物信息学严谨性与大模型自适应推理,提供高通量蛋白质序列功能注释与结构解析服务

点石

点石

有机化学

支持大规模有机化学反应检索

构建和沉淀丰富数据维度、海量化学反应数据,支持Agent灵活调用,向全球教学与科研机构开放

开放协作,共筑AI科学数据新生态

联系我们

OpenDataLab@pjlab.org.cn