萨克斯小苹果简谱:几种中药指纹图谱相似度计算软件的比较

来源:百度文库 编辑:偶看新闻 时间:2024/04/28 15:06:50
陈斌1 ,邓一鸣2, 潘扬1,2, 王天山1,2, 蔡宝昌*1
(1 南京中医药大学,江苏省中药质量控制工程技术中心,南京 210029;2 江苏中康新药指纹图谱开发有限责任公司,南京 210029)

[摘要] 根据笔者在中药指纹图谱研究中的实验数据,比较药典委员会推荐的两种中药指纹图谱相似度计算软件及我公司软件工程师将其中一种中药指纹图谱相似度计算软件的改进后的新软件功能的异同。总结出一些中药指纹图谱相似度计算软件的优点与缺陷,并及时进行了改进。应用这种基于matlab改进后的相似度计算软件能更方便快捷地处理大批量指纹图谱的实验数据,并进行准确的相似度计算。

       中药注射剂指纹图谱研究计划已正式启动,国家药品监督管理局组织全国各面专家修订通过了《中药注射剂色谱指纹图谱试验操作规程指南》和两个《计算机辅助中药指纹图谱相似皮计算软件》,详细规定了原料药材、半成品、成品的供试品收集与制备、参照物的选择、指纹图谱试验条件、试验室要求、仪器要求、试验方法、色谱指纹图谱的建立和辨认、校验和复核等:两个计算机软件可以对所有的中药谱峰同时进行比较计算,真实反映指纹图谱的整体相似性,并自动进行处理,对中药质量的稳定性做出准确评价,为中药指纹图谱的全面研究建立了实用的技术平台和科学基础。
       本文将以不同批次、不同产地、不同采收时间的大黄药材为例来对使用两个计算机辅助中药指纹图谱相似性计算软件评价的中药色谱指纹图谱的整体相似性结果加以详细比较。实验条件参照中国药典要求所需的高效液相色谱法,结合指纹图谱试验操作指南的要求进行试验。

1 材料
1.1 样品来源

表1 实验用10批大黄的来源
Tab1 Sample source of Da Huang(Rheum Palmatum L)         编号 来 源 采收时间 1 礼县大黄(阳坡乡) 2001.11 2 礼县大黄(江口乡) 2001.11 3 礼县大黄(白关乡) 2001.12 4 礼县大黄(红河乡) 2001.12 5 礼县大黄(固城乡) 2001.1 6 礼县大黄(湫山乡) 2001.1 7 礼县大黄(永兴乡) 2001.2 8 礼县大黄(罗坝乡) 2001.3 9 礼县大黄(永坪乡) 2001.3 10 礼县大黄(崖城乡) 2001.4
表2 实验用不同产地大黄的来源
Tab2 Sample source of Da Huang(Rheum Palmatum L) 编号 样品 采收时间 编号 样品 采收时间 1 华亭大黄1 2001.11 9 庄浪大黄1 2001.11 2 华亭大黄2 2001.11 10 庄浪大黄2 2001.11 3 华亭大黄3 2001.11 11 庄浪大黄(干货) 2001.11 4 华亭大黄4 2001.11 12 庄浪大黄
(1+2混合) 2001.11 5 华亭大黄(1+2+3+4混合) 2001.11 13 宕昌大黄(干货) 2001.11 6 礼县大黄立冬后 2001.11 14 宕昌大黄(干货) 2001.11 7 礼县大黄(干货) 2001.11 15 礼县大黄(干货) 2001.11 8 礼县大黄立冬前 2001.10      

       经笔者实地考察、采收结合当地分管药材种植部门的介绍和南京中医药大学鉴定教研室鉴定为药典规定掌叶大黄。
1.2仪器与试剂
1.2.1仪器 METTLER AE240电子天平;HH-6数显恒温水浴锅(常州国华电器有限公司);Agilent 1100液相色谱仪(自动进样器),DAD检测器。
1.2.2试剂 乙腈(美国Tedia公司,色谱纯)、甲醇(上海化学试剂有限公司,分析纯;Tedia公司,色谱纯)、冰醋酸(南京化学试剂一厂,分析纯)、重蒸去离子水。

2 实验方法
2.1供试品的制备
       精密称量0.5g大黄药材粉末(过20目筛),精密量取40ml甲醇水浴加热回流1h,过滤。残渣加甲醇40ml,水浴加热回流1h,过滤,合并两次滤液。置蒸发皿水浴挥干溶剂,加甲醇溶解并定容至25ml。通过孔径为0.45?m的微孔滤膜,滤液为大黄药材检测供试品。
2.2色谱分析条件
       Inertsil ODS-3分析柱(250mm ? 4.6mm,5?m),1%HAc-H2O与1%HAc-CH3CN二元梯度洗脱分离,流速1ml.min-1,柱温:30℃,DAD检测器,检测波长280 nm,参比波长:380 nm。所有组分均90分钟被检测完。
       得到如下图的大黄药材典型指纹图谱,在工作站中生成相似度计算软件所需的.txt文件、.csv文件。



图1 掌叶大黄药材典型指纹图谱
Fig1 The typical fingerprinting Chromatogrphy of Da Huang(Rheum Palmatum L)

程翼宇软件计算相似度使用步骤
1. 数据导入(.txt文件)
2. 数据预处理和色谱图的缩放比较
3. 保留时间校正和谱峰自动匹配
4. 指纹图谱相似度计算
5. 结果输出和报表打印
梁逸曾软件计算相似度使用步骤
1.载入数据(.csv文件)
数据前处理,包括数据压缩、数据平移
3.谱峰识别、谱峰匹配
4.计算相似度
5.对某个成分量上的区别,可用模式识别(主成分分析)[1]
3 实验结果


表3 程翼宇软件计算的10批大黄药材相似度计算结果
similarity of results of 10 patches crude drugs of DaHuang (Rheum Palmatum L) using software invented by Yiyu CHEN
编号 1 2 3 4 5 6 7 8 9 10 相似度 0.98 0.91 0.95 0.98 0.95 0.96 0.92 0.93 0.91 0.96
表4 改进后的软件计算的10批大黄药材相似度计算结果
similarity of results of 10 patches crude drugs of DaHuang (Rheum Palmatum L) using software after improving
编号 相关系数
(中位数)
相关系数
(均值) 相合系数
(中位数) 相合系数
(均值) 1 0.9100 0.9527 0.9151 0.9555 2 0.8663 0.8646 0.8813 0.8785 3 0.9660 0.9301 0.9694 0.9354 4 0.9426 0.9818 0.9440 0.9818 5 0.8820 0.9518 0.8777 0.9465 6 0.9720 0.9534 0.9754 0.9578 7 0.9349 0.9011 0.9428 0.9107 8 0.9131 0.9075 0.9273 0.9107 9 0.8982 0.8569 0.9109 0.8718 10 0.9550 0.9450 0.9602 0.9491

程翼宇软件计算的10批大黄药材色谱指纹图谱图

梁逸曾软件计算的10批大黄药材色谱指纹图谱图

梁逸曾软件计算的不同产地大黄药材色谱指纹图谱图 表5 改进后的软件计算的不同产地的大黄的相似度结果
similarity of results of DaHuang(Rheum Palmatum L) from different producing area using software after improving 编号 相关系数
(中位数)
相关系数
(均值) 相合系数
(中位数) 相合系数
(均值) 1 0.9466 0.9068 0.9518 0.9163 2 0.8792 0.8188 0.8945 0.8409 3 0.9043 0.9040 0.9162 0.9153 4 0.9217 0.8725 0.9290 0.8850 5 0.9477 0.9060 0.9533 0.9162 6 0.9171 0.8702 0.9240 0.8820 7 0.9490 0.9234 0.9541 0.9312 8 0.9582 0.9383 0.9607 0.9413 9 0.9764 0.9889 0.9781 0.9896 10 0.9823 0.9829 0.9802 0.9515 11 0.8468 0.9067 0.8561 0.9112 12 0.9816 0.9861 0.9817 0.9863 13 0.8057 0.8668 0.8303 0.8795 14 0.7738 0.8121 0.8029 0.8323 15 0.8181 0.8858 0.8332 0.8945
       用改进后的软件计算10批大黄药材的相似度,表4结果证明了不同批次间药材的比较稳定,同时通过计算相似度,表5结果证明了不同产地大黄因地理条件、采收时间的不同,其指纹图谱相似度能够体现出差别。
4. 讨论
       目前中药指纹图谱的计算机解析方法有模糊信息分析法、人工神经网络法及灰色关联度聚类法等[2]。
       本文所述的相似度计算软件均采用了模糊数学方法,相似度计算方法为夹角余弦法,即把每个色谱指纹图谱都可以看作一组对应保留时间下的峰高(或峰面积)的数值,可将这组数值看作多维空间中的向量,使两个指纹图谱间相似性的问题转化为多维空间的两个向量的相似性问题,利用cos?值来定量表征指纹图谱间的相似性。如果cos?越接近1则说明两个向量越相似[3]。
       以下是使用两个相似度计算软件和使用改进后软件的体会

       使用程翼宇软件的体会
      1.采用峰面积进行相似性比较,接近原技术要求的含量测定的计算概念;
       2.当图谱的signal文件较大时,使用该系统处理就无法进行,如气相色谱文件无法进行数据的处理与分析;
       3.保留时间匹配有时欠准确;
       4.系统只能处理98个峰,超过98个峰自动设定为0.00,不利于整体相似度比较;
       5.谱峰自动匹配时,峰未积分时则以0.00对应,对设定标准模板影响较大。
       6.无法导出共有模式数据。
       7.一次最多只能导入处理10个数据文件。
       8.必须先匹配才能计算相似度

       使用梁逸曾软件的体会
       1.基于matlab本身已具备的强大计算功能、图形功能、文件操作功能,精确度高,可靠性好。
       2.载入的数据可以是由色谱工作站直接得到的*.csv文件,*.txt文件,也可以是许多图谱导入后保存成的*.mat,*.txt文件;
       3.对数据个数、大小基本没有限制,而且数据太大时可以压缩,不影响图形,数据不符合要求或导入错误时可以单独去除;
       4.可进行主成分分析,建立类模型(二类或多类),还可对图谱进行预测;
       5.可做谱峰识别、自动和手动谱峰匹配,以变异系数法计算各峰权重,加权计算相似度;
       6.但以全谱或峰面积计算相关系数和相合系数,两者差别较大,不知何故。
       7.不能进行样本与共有模式间的相似度计算
       改进后软件的新功能
       笔者认为软件首先应计算准确,其次应运行稳定,且图形功能应比较全面,兼有预测、投影等其他功能,因梁逸曾软件基于matlab这个开放性软件环境(源代码开放),算法清晰,故以梁逸曾软件为原型,继承了梁逸曾软件许多优点,在此基础上改进了其不足之处。
       1.增添了数据缩放功能,更易进行相似度计算。
       2.给每个样品的色谱图标上了序号,在样本数多时,样本更易辨认。
       3.改进后的软件可以用右键在谱图上标记峰的横、纵坐标,使峰的横纵坐标值能直观的显示。
       4.全谱相似度计算功能增加了将共有模式保存成独立数据(.csv文件)供以后调用比较、显示均值图、显示中位数图功能,并增加了样本与共有模式数据间相似度计算的功能。此功能对控制不同批次原料药、中成药的稳定性有重要的现实意义。
       5.由于是解释执行,matlab过于庞大,效率较低,速度较慢,但可以接受。正在进行将其编译成脱离matlab环境的独立程序,可大大增加执行效率。

       致谢:感谢浙江大学程翼宇教授、范骁辉博士提供指纹图谱相似度计算软件。
       感谢中南大学梁逸曾教授提供指纹图谱相似度计算。

参考文献
1.梁逸曾,谢培山 指纹图谱的化学模式识别分析-若干实质性问题的探讨(三)【J】,世界科学技术,2002,4(5):47~51
2.苏薇薇,吴忠,全健 中药指纹图谱的构建及计算机解析【J】,中药材,2001,24(4):295~298
3.王龙星,肖红斌,梁鑫淼,毕开顺 一种评价中药色谱指纹谱相似性的新方法:向量夹角法【J】,药学学报,2002,37(9):713~717


作者简介:
陈斌(1977- ),男,南京中医药大学2000级在读硕士研究生,主要从事新药开发与指纹图谱研究。

联系人:蔡宝昌
电话:025-6798281
传真:025-6798282
通信地址:南京中医药大学91#信箱(210029)

Comparison of several kinds of similarity calculation software of Fingerprinting Chromatogrphy of traditional Chinese medicine
Bin CHEN1,Yiming DENG, Yang PAN1,2, Tianshan WANG1,2, Baochang CAI*1
(1. Nanjing University of Traditional Chinese Medicine , JiangSu Provincial Center for Chinese Medicine Quality Control Nanjing 210029, China,2.Jiangsu zhongkang New Drug & Fingerprinting Chromatography Development Inc. Nanjing 210029, China)

[Abtract]:According to Experimental data of the author while studying in fingerprint of traditional Chinese medicine,different functions between two kinds of similarity calculation softwares of Fingerprinting Chromatogrphy of traditional Chinese medicine which the pharmacopoeia committee recommends and new software after the improvement of one kind of software above which software engineer of our company made are compared. Summarize some merits and defect of similarity calculation software of Fingerprinting Chromatogrphy of traditional Chinese medicine, and has improved in time. Using this kind similarity calculation software on the basis of matlab after improving software can deal with in enormous quantities fingerprint experimental data conveniently and swiftly, and carry on accurate calculation of similarity.
[Key words]:Similarity calculation software, Fingerprinting Chromatogrphy;