关键词:
学科结构
期刊主题耦合
期刊分类
经济学
管理学
文本挖掘
摘要:
[目的/意义]期刊是常用的学科结构识别处理单元,通过期刊聚类识别学科子领域可以有效揭示学科的内在结构特征。从期刊内容层面基于期刊论文语义关联提出一种新的期刊之间关联关系构建方法,称为期刊论文主题耦合,在此基础上提出一套学科结构识别模型。[方法/过程]该模型使用LDA算法识别期刊论文研究主题及主题分布,在此基础上使用一种基于阈值的方法构建期刊论文主题分布,针对高维期刊论文主题分布存在的聚类难点,引入t-SNE算法获得高维分布的低维嵌入,最后使用层次聚类算法获得期刊聚类结果。[结果/结论]使用CSSCI收录的107种经济学和管理学期刊在2018年至2022年所发表的68078篇文章的文本数据进行实证,阐述模型的参数选择和设置方法。实证结果表明,本文提出的新方法能有效利用期刊论文语义维度上的主题关联进行期刊的聚类和学科子领域的识别,将我国经济管理学科划分为16个子领域,其中经济学9个、管理学5个、经济学与管理学交叉领域2个,并解读各子领域的研究范畴。