基于信息熵的血瘀证症状规范化研究

  如何从中医学大量现象学描述中寻找其内在规律,是证的规范化研究之热点和难点。为了科学地总结群体经验,开展多中心协作,继承和发展中医辨证施治的理论和实践,有一个比较客观的、可计量的重复性好的血瘀证症状体征,我们查阅各时期相关名医专著、医案以及各个时期的中医文献,对血瘀证古代文献进行整理,统计出血瘀证的症状体征,并请专家对收集资料进行严格的数理统计分析,从信度、效度等方面加以评价。在此基础上,再结合流行病学调查,研究其统计规律,并建立判别诊断数学模型。基于熵的关联度可以度量变量之间的任意统计相关性,对变量的分布类型没有任何特殊要求,它不仅能描述变量间的线性相关关系,也能描述变量间的非线性相关关系,因此能为中医辨证的规范化起到重要的作用。现通过信息熵的关联度,得出血瘀证的临床症状体征。

  1.信息熵的关联度理论

  设两个离散的随机变量Xi和Xj,它们的概率分布分别为p(xi)和p(xj),二者的联合概率分布为p(xi,xj),则随机变量Xi的熵为: ,Xi和Xj的联合熵为:。假设 ,则称

   为Xi和之间的关联度。

  2.资料的选择

  本研究资料来自中国中医科学院西苑医院及云南省昆明医学院附属医院的病例1000例,其中血瘀证583例,非血瘀证417例,拟通过这些可测量和易观察的指标提取总体血瘀证的症状体征,以观察他们与中医传统经验的异同,从而为血瘀证诊断标准的规范化和客观化提供合适的诊断方法。

  本研究共筛选出32个对血瘀证诊断有意义的变量,每个变量都可以看作离散变量,根据临床病历,利用信息熵的关联度得到这32个血瘀证的相关症状,根据相关度大小分别为舌质紫暗、面色黑、口唇色黑、眼周色黑、齿龈色黑、腭黏膜征、舌体瘀斑、脉涩、舌脉曲张、脉结代、肌肤甲措、皮肤瘀斑、五心烦热、关节肿胀、头昏、畏寒肢冷、关节疼痛、眩晕、月经色黑、月经血块、月经量多、痛经、眩晕、关节畸形、心悸、胁肋胀痛、腹部肿块、偏身麻木、急躁易怒、头痛、失眠等,这与上文所述历代中医描述相符,故认为基于信息熵的相关度对中医证候症状体征的提取具有临床意义。其统计方法适合中医的多位界面、动态时空、模糊性等特点。

  讨 论

  由血瘀证的症状体征出发,从临床方面探讨血瘀证客观指标改变的情况,通过信息熵的关联度对血瘀证重新进行规范,并从多项相互关联的研究结果中,归纳出数项带有普遍性的客观检测指标。作为血瘀证新的诊断标准。对血瘀证数据的分析结果表明,熵的相关度适合于解决中医定量诊断问题。它可以揭示众多症状间以及症状与证候间的复杂关系,从中发现证候的主要症状和次要症状,并定量确定其诊断价值,有助于确定证候诊断的标准和规范。作为一种知识发现方法,其从数据出发的特质不仅能提高中医专家诊断的客观性和准确性,还有可能发现新的医学知识以丰富中医理论。可以预见,应用信息熵等数据挖掘技术,摸索出中医定量诊断的新方法,将有可能带来中医定量诊断研究的突破。(作者:中国中医科学院广安门医院 李海霞 王阶,中国科学院自动化研究所 孙占全)