中药图谱 数据库 健康 中医美容 药膳食谱 中成药 古籍 市场分析 疾病大全 中药网址

关于中医学信息的研究进度
  • 本站最新推荐:

关于中医学信息的研究进度

2008-01-31 09:44:24 来源: 北京中医大  显示次数:   编辑:任廷革   进入论坛

我们对中医学信息的研究有20多年的历史,研究的进程紧跟了计算技术的数值计算、数据处理、知识处理等三个发展阶段,始终把中医数据库的建设、中医智能的研究和中医学教育技术的开发作为研究方向。近年来,在国家十五项目资金、国家973项目资金和国家自然科学研究基金的支持下,我们的研究工作取得了新的进展,依据对相关研究文献的查询分析,我们的研究实践基本上可以反映中医学信息研究的进展情况。

    中医药数据库建设的新进展

    中医药数据库的建设在中医学信息的研究中是最早进行的,现在全国的中医药数据库可以说是遍地开花,覆盖了中医各学科领域,这也证明了数据库建设是信息研究的基础这样一个规律。在这些数据库中有各种不同的数据形式和结构,表达着不同的信息支持,有着不同的功能,为中医学的发展起着重要的支持作用。从研究实践中我们体会到:数据信息的释放是否彻底,信息挖掘是否能最大程度地满足用户的需要等方面,仍然是中医药数据库建设面临的普遍问题。

    要做到数据信息的完全释放,最大程度地满足用户信息挖掘的需要,一个关键的问题是数据粒度的细化和一致化处理,我们习惯称其为“数据解析”和“主题标引”。换句话说就是用数据解析的方法使数据的粒度细化(细化到一个字段只含一种信息),用主题标引的方法使解析后的数据一致化。我们在100,000个方剂和1,000个医案数据的处理过程中,深深体会到这是一件学术性很强、工作量很大的事情。

    所谓学术性强,首先表现在需要提供一部高质量的《中医学主题词表》(下简称“词表”),词表中的词条起码要满足3个条件:词源(词条的来源)要有文献依据;词义(词条表达的含义)要做到唯一性;词构(词条编码的结构)要符合中医学的理论认识。其次是需要组织和培训能够正确理解文献数据、十分熟悉词表内容、准确选择词条的专业人才。

    所谓工作量大,首先表现在我们用了10年的功夫编写了近10,000条记录的《中医学主题词表》,而且这个词表需要在使用中不断地得到维护,现在这个词表更新的周期几乎是半月一次。其次是需要组织大量的人力进行数据的解析和标引,为此还需要有人对这些数据进行复查,尽可能地使数据的处理符合系统设计的要求。

    通过中医方剂数据库和中医医案数据库的建设实践证明,数据经过这样处理后建立的中医药数据库确实能发挥其基础信息支持的作用。该数据库不仅实现了从任何角度的查询,而且还可以做到数据的多种集合,如数据总结、数据分类、关联分析、序列模式分析等,当然这些分析是基于频次统计的。在此基础上,我们利用《中医学主题词表》的编码结构,还实现了上述这些分析的按主题结构的再次集合。在现有数据库技术水平的条件下,经过多家用户初步使用证明,这样的数据库能较好地满足用户信息挖掘的需要。

    我们认为中医药数据库研究的深入目标有两个:一是机器标引取代部分人工标引,这不仅可以大大提高中医药数据库建设的速度,而且还能够保证数据的一致性,更能够方便数据的维护;二是把数据库技术和机器学习技术进行有机的结合,实现中医药数据库的部分智能查询,满足中医学研究对数据越来越高的需求,让数据所含信息得到充分的释放。。

 1/4    1 2 3 4 ›› ›|
  
文章来自网络,不代表本网站立场,版权归原作者所有,转载请注明出处!
该文章相关信息

文章评论

共有 位ZYY123网友发表了评论 查看完整内容

关于站点 - 广告服务 - 联系我们 - 版权隐私 - 免责声明 - 网站地图 - 推荐中医药网站 - 意见反馈 - - 返回顶部
华夏中医药网版权所有 ©2007-2009 琼ICP备08000992号