英矽智能上线大语言模型训练框架MMAI Science Gym,赋能通用模型实现垂类领域专精
英矽智能创新的\"MMAI Science Gym\"训练框架可显著提升大语言模型(LLM)在生物化学领域的专精能力
英矽智能创新的"MMAI Science Gym"训练框架可显著提升大语言模型(LLM)在生物化学领域的专精能力
经过训练后,原本在专业任务领域失败率高达 75%–95% 的 LLM,可在关键药物发现基准测试中实现最高 10 倍的性能提升
此次发布将进一步推进制药超级智能(PSI)愿景
上海2026年1月22日 /美通社/ -- 由生成式人工智能驱动的生物医药科技公司英矽智能(03696.HK)今日发布大语言模型训练框架Science MMAI Gym,旨在将具有因果推理能力的LLM转化为具备在真实世界处理药物发现与开发任务能力的高性能引擎。

英矽智能深耕 AI 领域十余年,已构建覆盖 27 款以上临床前候选化合物的创新内部管线,其中 10 余款分子获得临床试验批件,并已完成或正在推进多项 I 期及 II 期临床试验。以此为基础,公司于近期搭建并正式上线AI训练基础设施Science MMAI Gym,旨在助力包括GPT、Claude、Gemini、Grok、Llama、Mistral等在内的通用LLM进行调整优化,使其能够以现代制药研发所需的精度在药物化学、生物学和临床开发方面展开推理。
填补制药领域LLM产出空白
许多知名LLM在通用领域具有强大的推理能力,却在垂类领域,比如关键药物研发任务中表现差强人意甚至彻底折戟,例如对 hERG、药物性肝损伤(DILI)风险等复杂药代动力学与毒理终点的预测。根据英矽智能汇总的基准评测结果显示,即使经过提示词优化,通用模型在专精领域输出的结果往往是模糊的,或提出不合生化领域逻辑的推理。
Science MMAI Gym 有望填补这一空白,通过向 LLM 系统化传授垂直领域的科学推理能力,使其理解化学家、生物学家与临床医生在实践中使用的语言、表达格式与概念链条,而非仅将药物发现简化为一般的 NLP(自然语言处理)基准测试。
Science MMAI Gym主要聚焦以下领域:
药物和有机化学:多步优化链、反应推理、逆合成模板、构效关系和三维结合相互作用。
生物学和靶点发现:基因表达、通路、疾病机制和多目标靶点评分的组学感知推理。
临床开发:试验设计、终点、反应生物标志物的解释,以及使用专有基准(如ClinBench)预测II期试验的成功或失败。
训练整体架构:化学超级智能和生物学超级智能
Science MMAI Gym 是英矽智能迈向"制药超级智能"(Pharmaceutical Superintelligence,PSI)长期路线图的核心组成,设置两条垂直训练方向:化学超级智能(Chemical Superintelligence,CSI)与生物学超级智能(Biology Superintelligence,BSI)。
在 Science MMAI Gym 中,AI 模型将经历持续数周至数月的迭代训练,主要基于:
高质量、领域特定的推理数据集: 依托数百万级内部数据点,包括 400 万+ 药物化学优化链、1 亿条有机合成描述,以及数十万条分子动力学轨迹。
多任务微调与强化学习: 通过多任务监督微调(SFT)与强化微调(RFT),结合奖励模型打磨推理能力,并将模型预测与实验结果对齐。
稳健的基准评测: 每个训练周期都会在公开及内部的分布外(OOD)基准上进行验证,包括 TDC、TargetBench 与 ClinBench,确保模型在真实应用场景中具备稳定、可靠的表现。
从通用到专精:早期案例研究和成果
内部基准测试显示,MMAI Science Gym 可显著提升模型在药物研发关键任务中的表现:
化学超级智能(CSI): 一款此前在70%药化任务中失效的开源LLM,经Gym训练后升级为"单模型一站式"的化学引擎。在多项 ADMET 任务上达到业界领先或接近领先的水平,并在 MuMO-Instruct 基准的五项优化任务中取得业界领先的成功率,表现可匹配甚至超越强势的类别专用通用模型。
生物超级智能(BSI): 经过Gym训练的模型在专有基准上进步显著。在 TargetBench 上,BSI调优模型在多种疾病的新靶点识别中获得最高综合排名,体现出更高的生物学合理性与转化潜力。
商业模式:用于科学研究的会员制"AI GYM"
Science MMAI Gym 以灵活的会员制项目形式提供,既可支持为期两周或一个月的密集冲刺,也可支持为期三个月及以上、面向 PSI 的长期合作。合作伙伴提交其基础模型后,可获得经 CSI/BSI/PSI 增强的版本,相较基准模型性能最高提升 10 倍;同时将获得详尽的基准测试报告,并可选配通过英矽智能自动化检测平台开展湿实验验证。
关于英矽智能
英矽智能是一家全球先锋生物科技公司,致力于整合人工智能和自动化技术,加速药物发现并推动生命科学领域的创新,赋能人类更长久更健康的生活。2025年12月30日,公司于香港联交所主板挂牌上市,股票代码:03696.HK。
利用自主研发的Pharma.AI 平台和先进的自动化生物学实验室,英矽智能正在为纤维化、肿瘤学、免疫学、疼痛、肥胖和代谢紊乱等未满足的疾病领域提供创新药物解决方案。此外,英矽智能持续将Pharma.AI应用拓展到多元化领域,如先进材料、农业、营养产品及兽医药物。更多信息,请访问网站 www.insilico.com
加载中,请稍侯......