

-
SteelBERT
-
专为钢铁材料研发的大语言模型,在约 420 万篇材料科学摘要和 5.5 万篇钢铁领域全文文献上预训练,并通过解耦注意力机制将非结构化的化学、冶金和工艺信息转化为 768 维上下文感知向量,构建端到端多模态深度学习框架
用户仅需输入材料成分和加工工艺描述,系统即可直接预测屈服强度、极限抗拉强度和总延伸率等力学性能,降低对高质量结构化数据和复杂特征工程的依赖。


-
MatAi
-
该模型整合学术论文、专利、实验数据、计算模拟数据和行业标准,全面提升材料科学领域的知识理解、数据处理与智能研发能力
相比传统方法,MatAi 更精准地解析和推荐材料文献,自动提取关键信息,并识别技术发展趋势,同时内置智能翻译与优化摘要功能,满足科研、产业和政策制定需求。


-
MatChat AI
-
专为材料科学领域打造的智能问答助手
不同于通用大模型,MatChat AI 采用溯源机制,确保答案准确并提供参考文献,避免幻觉问题,同时保留学术论文的专业排版,保证科研信息的完整性。


-
MatMind
-
多尺度数据与跨领域知识
中国科学院上海硅酸盐研究所刘建军研究员团队近日发布材料科学与工程大模型MatMind,该模型通过融合多尺度数据与跨领域知识,有效解决了材料研发中的三大核心挑战:构效关系与制备工艺的非线性相互作用、计算与制备的脱节以及跨学科协作不足。MatMind采用三大创新架构:基于增量预训练的多专家机制实现跨尺度数据对齐,CoT与RAG融合技术提升推理精准性,"brain-inspired"多智能体系统增强决策效率。模型训练数据涵盖120万篇文献、150万专利及20万条结构化材料数据,在材料属性预测任务中表现卓越,分类任务准确率达95%,数值预测均方根误差显著优于主流模型。目前MatMind已在材料智能制备中实现90%的准确度和192样/批次的高通量,成功开发出航天级低可探测材料等创新成果。未来,该模型将深化多模态数据融合,推动全自动化材料设计,并拓展跨学科应用,为材料研发提供智能化解决方案。这一突破标志着我国在材料科学人工智能领域取得重要进展。


-
钙钛矿大模型
-
全球首个专为钙钛矿材料研发的 AI 大模型,融合知识图谱与大语言模型(LLM),旨在自动提取和整理科学文献中的关键知识,加速该领域的研究与应用
依托高质量期刊数据训练,该模型能精准解读实验数据、回答技术问题,并支持文献阅读、数据库检索增强生成(RAG)和智能问答等多种下游任务。


-
MatPilot
-
专为新材料发现与设计打造,融合大型语言模型(LLM)与多智能体系统(MAS),并基于人机协作框架,实现从科学假设提出到实验执行的全流程优化
系统通过认知模块与执行模块协同工作,自动检索、分析并整合材料科学最新研究成果,同时结合智能实验平台,优化实验设计,提高实验效率与安全性。


-
DeepH
-
基于深度学习密度泛函理论哈密顿量方法(DeepH),通过等变神经网络(DeepH-E3)框架,实现了材料基态物理性质的高效预测,突破了传统第一性原理计算在计算效率与体系规模间的固有瓶颈
DeepH 通过深度学习与密度泛函理论(DFT)的融合,显著提升电子结构及能量分布的预测精度,具备三大核心优势:广泛的训练数据覆盖逾万种材料体系,确保对复杂原子结构和多元组分材料的普适性;等变神经网络架构增强了对不同晶体对称性的适应能力;计算效率较传统方法提升两个数量级,使大规模材料高通量筛选成为可能。


-
BAI-Chem
-
科学大模型,涵盖化学、流体动力学和科学评测三个领域
BAI-Chem 专注于分子结构研究,具备反应条件生成和“人在环路”反馈优化能力,能在2分钟内生成超25万种新分子,并快速筛选可合成的潜在分子,同时提供化学聊天机器人和合成助手,提升分子设计效率。


-
ChemDFM
-
针对化学科学的百亿级专业化大模型
在第三方评测中成绩超过同规模开源大模型,逼近千亿万亿参数通用大模型。


-
Uni-Mol
-
全球首个基于分子三维结构的通用分子大模型,广泛应用于药物研发、材料设计和化学工程等领域
在 OLED 材料筛选方面,Uni-Mol 训练于 160 万个分子数据,比传统 DFT 方法快 1000 万倍,大幅提升新型发光材料的筛选效率。


-
浦科化学(ChemLLM)
-
材料化学领域通用化学模型
从公开资料收集大量化学数据,覆盖多种任务提升泛化能力,应用于下游任务。


-
DPA-2
-
全新通用大原子模型架构
开发涵盖模型预训练等全面流程,可利用多领域数据集预训练,因创新架构与多任务训练方法,在下游任务泛化能力强。


-
MatterGen
-
专为无机材料设计的生成式 AI 模型,能够在元素周期表范围内生成高稳定性、多样化的材料,并支持微调以满足特定的化学、电子、磁性和机械性能需求
相比传统材料生成模型,MatterGen 生成新颖且稳定结构的概率提升了一倍,接近局部能量最小值的概率提高 10 倍以上。实验验证表明,其生成材料的合成性能偏差控制在 20% 以内。


-
DARWIN 1.5
-
DARWIN 采用自然语言指令输入材料信息,无需复杂描述符,增强任务整合与实验适用性,并在带隙预测上超越 PBE、HSE 等计算方法,仅凭化学成分即可高效预测,适用于高通量筛选。预训练增强机制进一步优化分类与回归任务表现,为材料表征和知识迁移奠定基础。
相较 LLaMA-7B 和 GPT-4,DARWIN 1.5 在部分任务上性能提升高达 60%,精准预测了上万种材料的性质


-
Nach0
-
生物医学问题回答,命名实体识别,分子生成,分子合成,属性预测
Nach0相较于同类生物医学领域的其他大型语言模型展现出了显著的优势。例如,研究人员使用Nach0生成了200个简化分子,并筛选出一个能有效对抗糖尿病的分子结构。


-
OMat24
-
专为材料基态稳定性和形成能预测而设计
其突出优势在于对非平衡结构的处理能力,使其在动力学和远离平衡的材料特性预测上具有独特价值,为探索新材料的稳定性与演化路径提供强大支持。


-
GNoME
-
专为晶体材料稳定性预测而设计
GNoME 已成功预测 220 万种晶体结构,其中 38 万种被认为稳定,远超人类过去 800 年的材料发现总量。结合 AI 预测与自动实验室,该模型仅用 17 天便成功合成 41 种新材料,大幅缩短了从发现到实验验证的周期。其主动学习机制结合 DFT 计算,不断优化模型,使预测准确率从 50% 提升至 80%,确保材料发现的可靠性。


-
MatSciBERT
-
专为材料科学优化的预训练语言模型
其在命名实体识别(NER)、关系分类、论文摘要分类、关键词提取和材料配方解析等 NLP 任务上达到了 SOTA(最先进性能),可精准识别化学成分、晶体结构、实验方法等材料相关信息,并自动归类论文,提高信息检索和数据管理效率。


-
polyBERT
-
专为聚合物信息学设计的先进化学语言模型
通过 PSMILES(聚合物 SMILES)字符串学习聚合物的化学特性,实现端到端的机器驱动筛选,避免手工制作分子指纹,大幅提升自动化程度和计算效率。该模型可预测 36 种关键聚合物属性,涵盖机械、热学、电学等性能,并在超过 1 亿个假设聚合物数据集上训练。


-
A-Lab
-
自主材料发现系统,集成 AI、机器人和自动化实验技术,实现材料设计、合成与分析的全流程自动化
结合 DFT 计算、ML 预测和主动学习算法,该系统材料合成成功率达 78%,在 17 天内成功合成 41 种目标化合物,并通过优化将成功率从 71% 提升至 74%。


-
CHGNet
-
基于图神经网络机器学习的预训练通用原子力场模型
在机器学习势基准测试表现出色,在Matbench Discovery任务F1 score达0.58,超越先前模型,是优秀预训练势函数。


-
M3GNet IAP
-
图形神经网络,结合传统IAP多体特征与图神经网络灵活性
为89个元素训练低误差的材料通用相互作用势


-
Claude 3
-
长文本处理、复杂推理、伦理对齐
支持20万token上下文,在专业领域测试中表现优于GPT-4。


-
DeepSeek-R1
-
多模态理解、代码生成、逻辑推理
在数学推导、代码生成任务中表现优异,部分中文评测成绩超过GPT-4。支持长文本对话与复杂任务分解。


-
文心大模型
-
多模态生成、中文深度理解与创作
中文语义理解领先,集成至百度搜索、文库、地图等产品,用户量超1亿。


-
智谱GLM-4
-
多模态生成、复杂推理、长文本处理
支持10万字长文本,逻辑推理能力接近GPT-4,开放API供企业调用。


-
通义千问
-
多模态交互、办公助手、代码生成
支持文本、图像、音视频处理,落地钉钉、天猫精灵等场景。


-
星火大模型V3.5
-
教育、医疗、办公场景智能化
中文理解能力提升,落地智慧课堂、医疗辅诊等场景。


-
盘古大模型
-
产业智能化(政务、气象、医疗)
气象预测精度提升20%,矿山场景降低事故率,赋能千行百业。


-
腾讯混元大模型
-
内容生成、搜索增强、多轮对话
支持腾讯会议、微信搜索等业务,中文创作能力接近人类水平。


-
天工大模型(Skywork)
-
多模态交互、搜索增强、代码生成
开放API接口,支持企业定制化开发,中文长文本生成效果突出。


-
日日新·SenseNova
-
图像生成、3D内容生成、文案创作
支持秒级AI生图、视频生成,赋能影视、游戏行业内容生产。


-
GPT-4
-
多模态理解与生成、文本创作、代码生成
支持文本与图像输入,广泛应用于教育、客服、编程等领域,效果显著。


-
GPT-3.5
-
自然语言处理、问答、内容生成
驱动ChatGPT,成为用户量增长最快的AI应用之一。


-
Gemini Pro
-
多模态交互、跨模态推理
支持图像、视频、文本混合输入,预计优化谷歌生态应用。


-
PaLM 2
-
多语言处理、推理、代码生成
支持100+语言,支撑Bard等产品,在多语言任务中表现突出。


-
LLaMA 2
-
开源研究、可定制化NLP模型
开源社区广泛采用,支持学术与商业用途。


-
Jurassic-1
-
商业文案、创意写作
提供API服务,企业用户用于内容生成。

