
共组词
-
2023年2月12日发(作者:)共词分析法
共词分析法属于内容分析法的一种,其原理主要是对一组词两两统计它们在同一篇文献中出
现的次数,对这些词进行聚类分析,从而反映出这些词之间的亲疏关系,进而分析这些词所
代表的学科和主题的结构变化的方法。
共词分析法演进:
(1)基于包容指数和邻近指数的共词分析法
包容指数和邻近指数主要用于测量款目之间关系的强度。包容指数主要用来计算主题领域的
层次,计算公式如下:
Lij=Cij/min(Ci,Cj)
其中,Cij代表关键词对Mi和Mj在文献集合中的数量;Ci代表关键词Mi在文献集合中的出
现频次;Cj代表关键词Mj在文献集合中的出现频次;min(Ci,Cj)代表Ci和Cj两个频次
的最小值。这个公式可以用来计算那些出现频次相对高的关键词。
当存在着一些中间关键词,而且这些关键词的相对出现频次比较低,但是仍然在这些非重要
的关键词之间存在着一定的关系,于是用邻近指数来计算潜在的领域,计算公式如下:
Pij=(Cij/CiCj)*N
其中Cij、Ci和Cj意思同上,N代表集合中文献的数量。
Callon等提出等价系数(EquivalenceCoefficient,简化为E),用来计算关键词之间的关联值。
Eij=(Cij/Ci)*(Cij/Cj)=(Cij)2/(Ci*Cj)
其中Eij值在0~1之间。由于Eij可以同时计算关键词i和j出现在对方集合的频次,因此
Turner和他的同事称这个参数为相互包含的系数。
以上面3个指数为基础,把主题词或关键词聚类成组,并以网络地图的方式表现出来。通过
比较不同时期的网络地图,就可以表现出科学的结构和动态变化。
(2)基于战略坐标的共词分析法
战略坐标是在建立主题词的共词矩阵和聚类的基础上,用可视化的形式来表示产生的结果。
用“战略坐标”来描述某一研究领域内部联系情况和领域间相互影响情况。在战略坐标中,
x轴为向心度,表示领域间相互影响的强度;y轴为密度,表示某一领域内部联系强度。其
中,向心度用来测量一个学科领域和其他学科领域的相互影响程度。一个学科领域与其他学
科领域联系的数目和强度越大,这个学科领域在整个研究工作中就越趋于中心地位。对于特
定的类别,向心度的计算可以通过该类别的所有主题词或关键词与其他类别的主题词之间链
接的强度来进行。这些外部链接的总和、平方和的开平方等都可以作为该类别的向心度。密
度用来测量组成聚类的词语之间的关联强度,也就是聚类内部的强度。它很好地说明了维持
一个聚类的能力以及在领域中发展的过程。某一类别密度的计算可以有多种方式,首先计算
本类中每一对主题词或关键词之间的在同一篇文献中同时出现的次数,通过计算这些内部链
接的平均值、中位数或者平方和,得出这个类别的密度。
(3)基于数据库内容结构分析的共词分析法
数据库内容结果分析(简称DT)是新一代共词分析方法,是由Kostoff等提出的,它是可
以用于分析大量的数字化文本资源的系统。这种方法中有两个参数:频率分析和临近分析。
频率分析用于揭示数据库中较深入的主题,而临近分析用于揭示这些主题间的关系以及主题
和子主题之间的关系。DT分析法分为三个步骤:第一步,确定文本分析的主题,计算文本
中出现频率最高的技术内容短语作为全文数据库的深层分析主题。第二步,通过计算短语与
主题在一篇文本中共同出现的频率,构建词频字典来揭示该短语与主题之间的关系。第三步,
筛选与聚类主题关系密切的短语。
共词分析方法也存在一些弊端,如方法的成立必须不考虑索引者的影响、词汇选择等一些人
为因素的限制,这些问题如何改进有待今后进一步的研究。
参考文献:冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006(2)