2.3 代谢组学
代谢组学作为一种新兴的组学方式,目的是综合分析一个生物样品的所有代谢物,在化学分类方面有很好的应用潜力。例如,用超高效液相色谱-四极杆飞行时间-高分辨率质谱(UPLC-QTOF-HDMS)检测毛茛科(Ranunculaceae)乌头(Aconitum carmichaelii)主根(CHW)和侧根(SFZ)22个代谢物,其中13个为CHW和北乌头(A. kusnezoffii)(CW)根所共有(Sun等,2013)。准噶尔乌头碱、卡乌碱和异塔拉萨定在CW未检测到,但存在于SFZ和CHW。更多代谢组应用实例参上述和下述。
2.3.1 核心真双子叶植物:菊类植物(Asterids)
基于1D-和2D-NMR的代谢组分析将11种南美冬青属(Ilex)(冬青科Aquifoliaceae)植物分为4组(Kim等,2010)。A组,I. paraguariensis,富含黄嘌呤和酚类化合物,包括苯丙素类和黄酮(Hao等,2013b);B组,I. dumosa var. dumosa和I. dumosa var. guaranina,特征是齐墩果烷型三萜皂苷;C组,I. brasiliensis,I. integerrima,I. pseudobuxus和I. theezans,富含熊果苷和二咖啡酰奎宁酸;D组,I. argentina,I. brevicuspis,I. microdonta和I. taubertiana,乌苏烷型皂苷含量最高。化学分类结果与ITS系统发育树大致符合(图2-14),实证了代谢组学平台在化学分类研究中的作用。
图2-14 用ML和GTR模型推测冬青属(Ilex)ITS的系统发育关系
具有最高对数似然值(–1654.0571)的系统发育树显示如图2-14所示。用11个ITS核苷酸序列建树。最终数据集包含544个位置。用MEGA6软件完成分析
用灵敏的HPLC-DAD-ESI-MSn方法分析鼠尾草属19种植物86个成分,明确各物种的化学差异(Qiao等,2009)。Ser. Brachylomae、Ser. Digitaloidites、Ser. Castaneae和丹参系Ser. Miltiorrhizae亲缘关系近,Ser. Brachylomae、Ser. Maximowicziana和Ser. Campanulatae有各自独特的成分,也有共有成分(图2-15)。代谢组技术简化了化学分类研究,有助于合理解释鼠尾草属各物种的生物活性。从婆婆纳族(Veroniceae)(车前科Plantaginaceae)14种植物分离28个环烯醚萜糖苷和10个咖啡酰基苯乙醇苷,以及红景天苷和熊果苷,用NMR明确其结构(Taskova等,2006),这些化合物可用于婆婆纳族和相关类群的化学分类。用HPLC-ESI-MS同时定量百合科知母(Anemarrhena asphodeloides)4个甾体皂苷、2个氧杂葱酮糖苷、2个异黄酮和1个蒽醌(Sun等,2012),可有效区分知母样品。近年代谢组学成长迅速,在亲缘学和功能基因组学领域成为有力的研究工具,逐渐成为药用植物生化表型诊断研究的利器。
图2-15 鼠尾草属不同类群化学成分比较
2—主要成分;1—检测到的成分(比2丰度低);0—未检测到的/很少检测到的成分
用挥发物的靶向/非靶向代谢组学研究菊科千里光族(Senecioneae)千里光属(Senecio)分类/进化关系(Radulovic等,2014)。用多元统计分析(MVA),即聚合式层次聚类和PCA,比较千里光属93个样品精油组成。MVA输入数据集包括S. viscosus地上部精油数据,以及4个塞尔维亚S. vernalis居群地上部和根精油数据(8个样品)。代谢组筛选提示短链alk-1-enes(如oct-1-ene,non-1-ene和undec-1-ene),有限分布于植物界,可作为千里光族/千里光属化学分类标志。MVA提示千里光族萜类(挥发性的单萜和倍半萜)代谢进化不是属特异性的,发现S. vernalis器官特异性地产生和集聚挥发物,至少存在2个挥发物化学型。
用HPLC分析25个山茶科柃木属(Eurya)分类单元(24种1变种),共28个样品(Shi等,2014),根据相对保留时间鉴定23个成分。同一物种的谱图相同,不同种的谱图有差异,可用于区分彼此。基于UPGMA和NJ方法的CA揭示了种间关系和物种的分类位置。HPLC快速,直观,可重复,有助于柃木属分类研究和资源利用。
马鞭草科(Verbenaceae)过江藤属(Lippia)广泛用于中南美和热带非洲的民族植物学,用作食物、药物、甜味剂和饮品香料。代谢组学有助于解决过江藤属相关的一些分类难题。用UHPLC-PDA-TOF-MS分析6种过江藤属植物多个器官15个提取物的代谢物轮廓(Funari等,2012)。14个以前从L. salviaefolia和L. lupulina分离的酚类化合物用作参考化合物。基于网上同时高准确性质量测定和分子式推测注释其余LC峰,方法通用、省时,避免分离纯化步骤,使绝大多数化合物峰得到有效注释,适用于化学分类研究。分析性的HPLC分离和快速的UHPLC梯度的即刻分析进一步证实4个黄烷酮糖苷异构体的相互转换。去重复化结果和层次数据分析提示L. salviaefolia、L. balansae、L. velutina和L. sidoides化学相似性显著,而L. lasiocalicyna和L. lupulina的化学成分差异明显。
2.3.2 核心真双子叶植物:蔷薇类植物(Rosids)
用基于ALC-ESI-MS的代谢物轮廓对豆科胡枝子属(Lespedeza)的化学表型进行分类(Kim等,2012)。PCA用于聚类模式分析,层次聚类分析(HCA)用于种间距离分析。叶化学成分分为4种表型。细胞核ITS+叶绿体trnL-trnF遗传分析和化学分类均发现短梗胡枝子(L. cyrtobotrya)和胡枝子(L. bicolor)亲缘最近,截叶铁扫帚(L. cuneata)离其他三种最远。正交偏最小二乘法-判别分析找到种间显著差异的化合物。短梗胡枝子和胡枝子可以用显著差异的化合物区分。基于化学分类可区分叶和茎不同的表型。其他三物种的茎样品不能区分,而短梗胡枝子茎样品显示该种的化学特征。叶的化学表型分类比茎的分类更符合基于遗传标志的基因型分类结果。
2.3.3 其他真双子叶植物
近年阐明BIA代谢的研究多使用少数几种模式植物。罂粟富含重要药物如可待因和吗啡,联用基因组和代谢组技术方便基因发现和亲缘关系研究,帮助理解植物BIA生合过程。代谢组研究为初级生化代谢网络提供重要视角,而后者是特化(次生)代谢的基础,代谢组技术也广泛用于代谢工程、基因发现和代谢调控机制研究。已知植物产生约2500个结构多样的BIAs,其中许多有药用价值,但除了模式植物,对其他产BIA植物的代谢组研究很少。应用多平台方式,整合4个分析方法,系统研究了毛茛目4科20种产BIA的非模式植物(Hagel等,2015)。包括罂粟科8种,毛茛科4种,小檗科4种,防己科4种。基于一维1H NMR的轮廓分析定量91个代谢物,揭示出糖、氨基酸和有机酸含量的显著的种间和组织间差异。根和根状茎单糖和二糖含量低于茎,许多代谢物在愈伤组织和完整植物器官间差异大。直流灌注串联质谱方便研究110个脂类衍生物,包括磷脂酰胆碱和酰基肉碱,HPLC-UV定量15个酚类化合物,包括黄酮、苯甲酸衍生物和羟基肉桂酸。UPLC耦联高分辨傅里叶变换质谱给出所有化合物的质量信息,从中挖掘BIAs代谢物。可获得多种生物碱轮廓,包括十分普遍的和少见的化合物。广泛的代谢物轮廓结合多个分析平台提供了更全面的关于特定物种整体代谢的图景。代谢组方式可用于一组药用亲缘关系近的物种,它们在现代和传统医学中有重要价值。结合基因组学数据,代谢组学资源在产BIA非模式植物的研究开发中起到关键作用。
芍药属(Paeonia)牡丹组(section Moutan)有8种植物,分布于中国一个小的区域。该组植物产生单萜糖苷、黄酮、鞣酸、二苯乙烯、三萜、甾体、丹皮酚和酚类化合物。用基于HPLC-DAD的代谢指纹分类:牡丹(P. suffruticosa)(图2-16),卵叶牡丹(P. qiui),凤丹(P. ostii),紫斑牡丹(P. rockii,P. jishanensis),四川牡丹(P. decomposita),滇牡丹(P. delavayi)和大花黄牡丹(P. ludlowii)(He等,2014)。23个样品47个峰出现频率75%,其中43个峰通过保留时间和UV吸收光谱确定,并由HPLC-QTOF-MS证实,包括17个单萜苷,11个没食子酰基葡萄糖,5个黄酮,6个丹皮酚和4个酚类化合物。PCA和HCA显示物种间根据代谢组相似性区分清楚,分4组:a1,牡丹和凤丹;a2,卵叶牡丹,紫斑牡丹,P. jishanensis和四川牡丹;b1,黄牡丹(P. delavayi var. lutea)和四川牡丹;b2,滇牡丹和大花黄牡丹。化学分类与基于形态特征和地理分布的经典分类基本符合,亚组subsections Vaginatae和Delavayanae区分清楚,只有四川牡丹例外,其可看作两亚组间的过渡种。牡丹和凤丹可认为是同一物种,从药用成分看无区别。滇牡丹代谢轮廓变异大,且与大花黄牡丹无显著差异,提示两种遗传亲缘近。联用HPLC-DAD和多元统计分析对化学分类研究十分重要,有助于评估芍药属药用价值,帮助澄清单纯依赖形态和分子标志导致的疑难问题。
图2-16 栽培牡丹(大连沙河口区涟宁北园)
建立一种基于1H NMR指纹图谱-模式识别的不同品种升麻的鉴别方法(Shen等,2013)。以1H NMR技术测定3种升麻三萜皂苷类特征提取物的信息,并转化为数据矩阵,采用PCA及判别偏最小二乘(DPLS)法进行识别分析,表明1H NMR指纹图谱-模式识别能有效鉴别不同品种的升麻样本,升麻(C. foetida)、大三叶升麻(C. heracleifolia)和兴安升麻(C. dahurica)区分清楚。该法是一种有效的药材分类鉴别方法,可用于药材质量控制和亲缘学研究。四环三萜皂苷(Hao等,2013c,2015a,2015b)和糖类是导致区别的主要代谢物。升麻三萜皂苷含量显著高于其他两种升麻,东北升麻糖含量更高。
2.3.4 裸子植物
从形态上难区分3种柏科(Cupressaceae)扁柏属(Chamaecyparis)植物(红桧C. formosensis,日本扁柏C. obtusa和台湾扁柏C. obtusa var. formosana)。用化学标志物可以简单快速分辨物种(Lin等,2011)。用固相微萃取(SPME)-GC/MS分析成熟叶生源的挥发性有机化合物(BVOCs)组成。用CA和PCA分析BVOC色谱数据,揭示了显著的种间差异。红豆杉属化学分类参二萜部分论述。
2.3.5 苔藓类
苔藓类是植物界第二大类群,但关于其化学组成的研究较少。对北欧常见苔藓类的化学成分进行综合分析,包括元素分析、光谱分析和无损检测,例如傅里叶变换IR光谱(FT-IR)、固相13C NMR和热解-气相色谱/质谱(Py-GC/MS)(Maksimova等,2013),发现主要成分是碳水化合物。FT-IR判定OH基团和C—O基团丰度最高。13C NMR谱图提示存在酚类化合物和脂类,但酚类相对少。检测到木脂素。CA揭示样品间化学差异,说明多种代谢组技术可用于苔藓的化学分类。