新材料大数据中心_

当前位置：首页 > 大模型专区

大模型专区（38个）

由于网络环境和链接限制等原因，可能存在部分国际链接无法访问现象

材料大模型（22个）

收起

SteelBERT: 专为钢铁材料研发的大语言模型，在约 420 万篇材料科学摘要和 5.5 万篇钢铁领域全文文献上预训练，并通过解耦注意力机制将非结构化的化学、冶金和工艺信息转化为 768 维上下文感知向量，构建端到端多模态深度学习框架

用户仅需输入材料成分和加工工艺描述，系统即可直接预测屈服强度、极限抗拉强度和总延伸率等力学性能，降低对高质量结构化数据和复杂特征工程的依赖。

北京科技大学

2024

MatAi: 该模型整合学术论文、专利、实验数据、计算模拟数据和行业标准，全面提升材料科学领域的知识理解、数据处理与智能研发能力

相比传统方法，MatAi 更精准地解析和推荐材料文献，自动提取关键信息，并识别技术发展趋势，同时内置智能翻译与优化摘要功能，满足科研、产业和政策制定需求。

成都材智科技有限公司

2024

MatChat AI: 专为材料科学领域打造的智能问答助手

不同于通用大模型，MatChat AI 采用溯源机制，确保答案准确并提供参考文献，避免幻觉问题，同时保留学术论文的专业排版，保证科研信息的完整性。

松山湖材料实验室与中国科学院物理研究所等单位

2025

MatMind: 多尺度数据与跨领域知识

中国科学院上海硅酸盐研究所刘建军研究员团队近日发布材料科学与工程大模型MatMind，该模型通过融合多尺度数据与跨领域知识，有效解决了材料研发中的三大核心挑战：构效关系与制备工艺的非线性相互作用、计算与制备的脱节以及跨学科协作不足。MatMind采用三大创新架构：基于增量预训练的多专家机制实现跨尺度数据对齐，CoT与RAG融合技术提升推理精准性，"brain-inspired"多智能体系统增强决策效率。模型训练数据涵盖120万篇文献、150万专利及20万条结构化材料数据，在材料属性预测任务中表现卓越，分类任务准确率达95%，数值预测均方根误差显著优于主流模型。目前MatMind已在材料智能制备中实现90%的准确度和192样/批次的高通量，成功开发出航天级低可探测材料等创新成果。未来，该模型将深化多模态数据融合，推动全自动化材料设计，并拓展跨学科应用，为材料研发提供智能化解决方案。这一突破标志着我国在材料科学人工智能领域取得重要进展。

中国科学院上海硅酸盐研究所

2025

钙钛矿大模型: 全球首个专为钙钛矿材料研发的 AI 大模型，融合知识图谱与大语言模型（LLM），旨在自动提取和整理科学文献中的关键知识，加速该领域的研究与应用

依托高质量期刊数据训练，该模型能精准解读实验数据、回答技术问题，并支持文献阅读、数据库检索增强生成（RAG）和智能问答等多种下游任务。

香港科技大学（广州）

2025

MatPilot: 专为新材料发现与设计打造，融合大型语言模型（LLM）与多智能体系统（MAS），并基于人机协作框架，实现从科学假设提出到实验执行的全流程优化

系统通过认知模块与执行模块协同工作，自动检索、分析并整合材料科学最新研究成果，同时结合智能实验平台，优化实验设计，提高实验效率与安全性。

国防科技大学智能科学与技术学院

2024

DeepH: 基于深度学习密度泛函理论哈密顿量方法（DeepH），通过等变神经网络（DeepH-E3）框架，实现了材料基态物理性质的高效预测，突破了传统第一性原理计算在计算效率与体系规模间的固有瓶颈

DeepH 通过深度学习与密度泛函理论（DFT）的融合，显著提升电子结构及能量分布的预测精度，具备三大核心优势：广泛的训练数据覆盖逾万种材料体系，确保对复杂原子结构和多元组分材料的普适性；等变神经网络架构增强了对不同晶体对称性的适应能力；计算效率较传统方法提升两个数量级，使大规模材料高通量筛选成为可能。

清华大学物理系

2024

BAI-Chem: 科学大模型，涵盖化学、流体动力学和科学评测三个领域

BAI-Chem 专注于分子结构研究，具备反应条件生成和“人在环路”反馈优化能力，能在2分钟内生成超25万种新分子，并快速筛选可合成的潜在分子，同时提供化学聊天机器人和合成助手，提升分子设计效率。

上海交通大学

2023

ChemDFM: 针对化学科学的百亿级专业化大模型

在第三方评测中成绩超过同规模开源大模型，逼近千亿万亿参数通用大模型。

苏州实验室

2024

Uni-Mol: 全球首个基于分子三维结构的通用分子大模型，广泛应用于药物研发、材料设计和化学工程等领域

在 OLED 材料筛选方面，Uni-Mol 训练于 160 万个分子数据，比传统 DFT 方法快 1000 万倍，大幅提升新型发光材料的筛选效率。

深势科技

2022

浦科化学（ChemLLM）: 材料化学领域通用化学模型

从公开资料收集大量化学数据，覆盖多种任务提升泛化能力，应用于下游任务。

上海人工智能实验室

2024

DPA-2: 全新通用大原子模型架构

开发涵盖模型预训练等全面流程，可利用多领域数据集预训练，因创新架构与多任务训练方法，在下游任务泛化能力强。

北京智能科学研究院与深度势能科技公司

2023

MatterGen: 专为无机材料设计的生成式 AI 模型，能够在元素周期表范围内生成高稳定性、多样化的材料，并支持微调以满足特定的化学、电子、磁性和机械性能需求

相比传统材料生成模型，MatterGen 生成新颖且稳定结构的概率提升了一倍，接近局部能量最小值的概率提高 10 倍以上。实验验证表明，其生成材料的合成性能偏差控制在 20% 以内。

微软人工智能科学研究院

2025

DARWIN 1.5: DARWIN 采用自然语言指令输入材料信息，无需复杂描述符，增强任务整合与实验适用性，并在带隙预测上超越 PBE、HSE 等计算方法，仅凭化学成分即可高效预测，适用于高通量筛选。预训练增强机制进一步优化分类与回归任务表现，为材料表征和知识迁移奠定基础。

相较 LLaMA-7B 和 GPT-4，DARWIN 1.5 在部分任务上性能提升高达 60%,精准预测了上万种材料的性质

GreenDynamic 联合 UNSW、上海人工智能实验室和香港城市大学

2024

Nach0: 生物医学问题回答,命名实体识别,分子生成,分子合成,属性预测

Nach0相较于同类生物医学领域的其他大型语言模型展现出了显著的优势。例如，研究人员使用Nach0生成了200个简化分子，并筛选出一个能有效对抗糖尿病的分子结构‌。

英矽智能与英伟达

2024

OMat24: 专为材料基态稳定性和形成能预测而设计

其突出优势在于对非平衡结构的处理能力，使其在动力学和远离平衡的材料特性预测上具有独特价值，为探索新材料的稳定性与演化路径提供强大支持。

Meta公司

2024

GNoME: 专为晶体材料稳定性预测而设计

GNoME 已成功预测 220 万种晶体结构，其中 38 万种被认为稳定，远超人类过去 800 年的材料发现总量。结合 AI 预测与自动实验室，该模型仅用 17 天便成功合成 41 种新材料，大幅缩短了从发现到实验验证的周期。其主动学习机制结合 DFT 计算，不断优化模型，使预测准确率从 50% 提升至 80%，确保材料发现的可靠性。

美国谷歌公司

2023

MatSciBERT: 专为材料科学优化的预训练语言模型

其在命名实体识别（NER）、关系分类、论文摘要分类、关键词提取和材料配方解析等 NLP 任务上达到了 SOTA（最先进性能），可精准识别化学成分、晶体结构、实验方法等材料相关信息，并自动归类论文，提高信息检索和数据管理效率。

印度理工学院

2023

polyBERT: 专为聚合物信息学设计的先进化学语言模型

通过 PSMILES（聚合物 SMILES）字符串学习聚合物的化学特性，实现端到端的机器驱动筛选，避免手工制作分子指纹，大幅提升自动化程度和计算效率。该模型可预测 36 种关键聚合物属性，涵盖机械、热学、电学等性能，并在超过 1 亿个假设聚合物数据集上训练。