⭐TCMSP(Traditional Chinese Medicine Systems Pharmacology Database and Analysis Platform)数据库为中药活性成分及靶点的研究提供了有力支持,能帮助科研人员从系统药理学角度快速获取关键信息。
⭐SwissTargetPrediction是一个功能强大且独特的在线数据库,通过比较查询分子与已知配体的相似性预测小分子的潜在靶点,并为每个预测靶点提供评分,评估预测的准确性。
本教程将以“黄芪“为例,详细介绍如何利用TCMSP、SwissTargetPrediction数据库,高效获取中药活性成分及靶点信息,为深入药理机制研究和新药研发奠定基础,推动中药研究迈向新高度。
访问TCMSP数据库
打开浏览器,输入TCMSP数据库的网址:https://www.tcmsp-e.com/tcmsp.php(旧版网页)。
https://www.91tcmsp.com/#/home(新版网页)。
旧版网址可以免费查询数据库内容,但可能会偶尔崩溃,因此建议大家及时保存数据。新版网页由中医药盘古大模型-华为盘古大模型提供技术支持,需开通会员才能查看完整内容。以下教程将以旧版网页为例进行说明。
进入首页后,在检索栏边的下拉菜单中,展示的可输入检索词包括中草药名称、化合物名称或InChIKeys结构式和CAS编号,以及靶基因和疾病名称等。
在检索栏边的下拉菜单中选择Herb name(中草药名称),输入感兴趣的中药名称(此处只能输入单味药,不能输入复方),例如“黄芪”。
点击查询后会出现对应的中药,点击最右侧的蓝色拉丁文名称即可进入详情页。
详情页会展示药物成分的不同参数信息,包括:
Mol ID:药物在TCMSP中定义的ID信息,如 MOL000239;
Molecule Name:分子名称,如Jaranol;
MW:molecule weight,相对分子量(分子量在180到500道尔顿之间的化合物被认为更具药用性);
AlogP:脂水分配系数的对数值;
Hdon:Hydrogen bond donor,氢键供体donor;
Hacc:Hydrogen bond acceptor,氢键受体acceptor;
OB:oral bioavailability,口服生物利用度;
Caco-2:肠上皮通透性,指化学物质(通常是药物候选物)通过Caco-2细胞单层的能力(Caco-2细胞是一种人类结肠癌细胞系,常用于体外模型中模拟小肠上皮细胞,以预测药物在小肠中的吸收情况);
BBB:blood-brain barrier,血脑屏障;
DL:drug-likeness,类药性;
FASA-:Fractional water accessible surface area of all atoms with negative partial charge,一般作为类药性评价的标准之一;
HL:Drug half-life,药物半衰期。
在文献中,通常以使用口服利用度(oral availability)OB≥30%,且类药性(drug-likeness)DL≥0.18作为筛选药物主要活性成分的标准。在TCMSP数据库中,点击OB和DL列旁边的筛选符号(漏斗标志),设置相应条件,再点击“Filter”,即可筛选出符合条件的黄芪活性成分。
由于该页面没有一键导出功能,需要手动全选复制并粘贴到新的Excel表中进行保存。
如果想要了解某个活性成分化合物的详细信息,可以在Molecule Name列点击蓝色的成分名称,进入详情页。
详情页会显示化合物名称、3D结构(可直接下载)、药理学性质、各个数据库编号、别名、相关的疾病、靶基因和相关中草药等。例如,下图展示活性成分Jaranol(华良姜素)的具体信息:
活性成分对应的靶点信息可在“Related targets”中获取,但需前往Uniprot网站(https://www.uniprot.org/)转为基因名。需要注意的是,TCMSP中收录的物质和靶点信息存在一定局限性,因此文献中常借助SwissTargetPrediction数据库进行靶点预测。
获取成分对应的SMILES号(PubChem)
SwissTargetPrediction是一个基于化学结构的在线工具,用于预测小分子化合物可能的生物学靶点。它主要使用化合物的2D和3D结构相似性来推断与已知药物靶点的潜在相互作用。进行靶点预测需要化合物的SMILES号。在TCMSP数据库中,点击活性成分详情页的“Pubchem Cld”,即可跳转PubChem网页。
PubChem(https://pubchem.ncbi.nlm.nih.gov/)专注于有机小分子生物活性数据,是一个由美国国家健康研究院支持,美国国家生物技术信息中心(NCBI)负责维护的关于生环化材中应用分子的数据模型库。
在PubChem中,依次点击右侧:CONTENTS→2 Names and Identifiers→2.1.4 SMILES,即可获取活性成分的SMILES号(化学结构的线性表示法),以便后续进行靶点预测。此外,进行分子对接的活性成分小分子结构可在“Structures”中下载获取。
SwissTargetPrediction基于与已知化合物的二维和三维结构的相似性来预测化合物的靶标。预测可以在人、大鼠、小鼠三种不同物种中进行,并为每个预测靶标提供一个分数,以评估预测正确的可能性,网址为:http://swisstargetprediction.ch/。
将前面获取到的活性成分的SMILES号输入左侧中间的框中,并检查右侧根据SMILES号生成的化合物结构是否正确。确认无误后点击“Predict targets”进行靶点预测。
预测结果可在“Export results”处点击第二个图标,导出结果为“CSV”表格。
在导出的表格中,第一列“Target”是靶点的全名,第二列“Common name”是靶点的通用名,也就是常用的基因名。通常我们只关注这一列。F列“Probability”表示成分对应Target的可能性,一般以probability>0作为筛选标准。按照上述步骤,依次对中药的各个活性成分进行靶点预测,汇总并去重后,即可得到中药的靶点信息。
在成功筛选出某种中药的有效成分并确定其相应的靶点基因后,下一步是探究这些活性成分与特定疾病之间的相互作用。在这里,“靶点基因”扮演着至关重要的角色,它们是连接中药活性成分与疾病治疗的桥梁。为了深入理解这种联系,我们需要识别出与所研究疾病相关的靶点基因。关于如何获取疾病靶点基因的具体方法,我们将在后续的文章中进行详细分享。
注:① 使用TCMSP数据库推荐引用:Jinlong Ru; Peng Li; Jinan Wang; Wei Zhou; Bohui Li; Chao Huang; Pidong Li; Zihu Guo; Weiyang Tao; Yinfeng Yang; Xue Xu; Yan Li; Yonghua Wang; Ling Yang. TCMSP: a database of systems pharmacology for drug discovery from herbal medicines. J Cheminformatics. 2014 Apr 16;6(1):13.
② 使用SwissTargetPrediction数据库推荐引用:Daina, A., Michielin, O., and Zoete, V. (2019). SwissTargetPrediction: updated data and new features for efficient prediction of protein targets of small molecules. Nucl. Acids Res. 47(W1), W357-W364.
以上就是我们今天的分享内容,在实际使用中,我们可能还会遇到以下疑问:
Q:在筛选化合物时,一定是使用口服利用度(oral availability)OB≥30%,且类药性(drug-likeness)DL≥0.18的条件进行药物主要活性成分的筛选吗?
A:将OB值和DL值作为筛选中药活性成分的标准并非一成不变。实际上,一些OB和DL值相对较低的成分,也可能蕴含重要的生物活性。因此,在实际研究过程中,若存在特殊考量或需求,研究者可以灵活调整筛选阈值,不必过于拘泥于固定标准。同时,还应综合评估其他相关因素,例如成分在传统医学中的使用历史、相关文献的研究报道等,以确保筛选出的成分既科学又全面。这种方法有助于更全面地挖掘中药的潜在价值,避免遗漏可能具有治疗潜力的活性成分。
Q:有些中药在TCMSP查询不到成分怎么办?
A:TCMSP数据库主要是中草药的成分比较全,动物药和矿物药可能是查询不到成分,此时可以多尝试其它数据库,如:
TCM-ID:https://bidd.group/TCMID/,
HIT:http://www.badd-cao.net:2345/search,
HERB:http://herb.ac.cn/等。
Q:很多中药的成分筛选出来都是谷甾醇、槲皮素、山柰酚等这些同样的成分怎么办?
A:除了TCMSP数据库筛选的成分外,还可以根据文献对活性成分进行补充。尽管TCMSP数据库提供了丰富的中药成分和靶点信息,但个别药有时可能会存在成分筛选的同质化现象,为了解决这一问题,也可以通过代谢组学方法进一步检测以确保获取准确的中药成分信息。
Q:中药不管是复方还是单味药都有许多成分,会对应很多靶点,怎么能缩小靶点范围或者增加靶点准确性?
A:可以使用有限蛋白水解质谱技术(Limited Proteolysis Mass Spectrometry,LiP-MS)筛选药物靶点,通过设置药物处理的实验组与溶剂处理的对照组,再使用非特异性的蛋白酶进行处理。由于药物与靶蛋白的结合会改变蛋白质的局部酶切模式,在药物结合的靶蛋白上会形成酶切位点(肽段)的差异。随后,通过质谱技术来定量筛选出组间差异的肽段(蛋白),从而可以确定药物作用的结合靶点。这样得到的药物靶点可信度更高,证据力度更大。
撰稿人:李鑫
审核人:肖宇琴
左右滑动查看更多
更多合集推荐
主推产品:
体液生物标志物研究 | FFPE样本蛋白质组研究 | 诊断生物标志物研究 | 预后生物标志物研究 | 细胞/动物模型蛋白质组研究 | 蛋白互作组研究 | 药物靶点筛选 | 感染性疾病研究
科研干货: