现在的位置:主页 > 期刊导读 >

战略性新兴产业多领域知识融合路径研究基于引(2)

来源:中国战略新兴产业 【在线投稿】 栏目:期刊导读 时间:2021-03-26

【作者】网站采编

【关键词】

【摘要】文中采用基于GNN的图自动编码器(GAE) [26]来获取图嵌入的节点向量。以积累形式按年份切分获得数据序列,如按2015年进行切分,即提取出2015年及之前的

文中采用基于GNN的图自动编码器(GAE) [26]来获取图嵌入的节点向量。以积累形式按年份切分获得数据序列,如按2015年进行切分,即提取出2015年及之前的论文作为一组数据。针对每组数据的引用网络和文本信息,分别构造邻接矩阵和特征矩阵,以其作为GAE 输入获取节点向量(即论文向量)。因此,论文向量同时包含了引用网络的结构信息和节点信息。

2. K-means聚类

作为经典的无监督聚类算法,K-means聚类可将给定的样本集划分为K个簇团,K为可指定的参数[27]。以论文向量为输入,文中应用K-means算法对论文进行聚类处理,得到的簇团即表征演化路径上的研究领域。计算出每个簇团中各科学领域论文所占比例,各领域论文占比相对均匀的簇团即为融合簇团。

(三)融合路径识别

1. 簇团关联

对论文数据按年份切片、进行聚类后,可得到每年的K个簇团,将之作为技术路径上的节点。计算得到的簇团中论文向量的均值即为簇团向量,可以综合反映所包含的论文文本信息和引用信息。在相邻的时间节点上,簇团转换构成了融合演化路径,构造按时间积累的引用网络是捕捉簇团转换的关键 [9,28]。簇团向量的相似度用于表征簇团间的转换关系,将相邻年份上相似度最高的簇团相连,即可形成知识融合路径。文中采用欧氏距离来衡量簇团间的相似度,距离越小表明相似度越高。

2. 簇团主题词

为确定簇团所表征的研究主题,文中采用潜在狄利克雷分布(LDA)主题模型 [29]来提取主题词。按照论文所属的领域,将簇团包含的论文分成4个部分,而各部分的主题词共同构成了整个簇团的主题词。

三、研究过程

文中针对高端装备制造、新一代信息技术、新医药、新能源4个产业,围绕作为产业核心技术的数控设备、信息技术、生物医药、太阳能光伏进行具体研究,以定量方法的形式来研判4种技术的融合发展路径和程度。

(一)数据收集

选择Web of Science核心合集数据库,依据4 个领域涵盖范围,兼顾战略性新兴产业发展的侧重点,确定检索关键词,制定的检索式及数量如表1所示。检索的时间范围为1997—2019年,检索截止时间为2019年11月5日。

1997—2019年,数控设备、信息技术、生物医药、太阳能光伏4个领域的论文发表趋势(见图 2)为:数控设备领域的论文发表量保持稳定增长;信息技术领域在论文发表量和增长率上都远高于其他领域,且增长率仍逐步提高;生物医药领域的论文发表增长率在2009年之后有明显提升;太阳能光伏领域的论文发表量在2008年以前较少,但在2010年后迅速增加。

(二)参考文献引用趋势

利用CDA软件对根据参考文献信息构建的引用网络进行可视化处理(见图3)。4个领域都产生了一定规模的子网络,具有一定程度的互相引用,体现了领域间存在着较为频繁的跨领域知识流动。

为进一步分析引用信息,文中统计了跨领域参考文献的引用情况(见图4)。“数控设备<信息技术” “信息技术<数控设备”是跨领域引用数量最多的两种形式,且明显多于其他形式,表明这两个领域间的知识流动频繁。“太阳能光伏<数控设备”“太阳能光伏<生物医药” “信息技术<太阳能光伏” “太阳能光伏<信息技术”这4种形式的引用较多,且都与太阳能光伏领域有关,表明在太阳能光伏领域的跨领域知识流动复杂、形式多样。“数控机床<生物医药”“生物医药<数控机床”两种形式的引用最少,表明两个领域之间几乎没有知识流动。

表1 研究领域的论文检索式注:AND表示“与”的关系,OR表示“或”的关系。领域检索式论文数量/篇数控设备 TS= (“numerical control technology” OR “NC technology” OR “computer numerical control” OR“numerical control” OR “digital control” OR “NC system” OR “numerical control system” OR“machine tool” OR “NC machine” OR “numerical control machine”)15 475信息技术 TS= (“Information Technology” OR “electronic engineering” OR “electric engineering” OR “software engineering” OR “artificial intelligence” OR “Telecommunications”)75 422生物医药 TS= (“biological medicine” OR “bio-pharmaceutical” OR “biomedicine” OR “biopharmacy” OR“Biotechnology” OR “biological pharmacy” OR “biopharming”)28 274太阳能光伏 TS= (“Photovoltaic” OR “electricity generation” OR “power generation”) AND (“solar energy” OR“solar power”)11 355

文章来源:《中国战略新兴产业》 网址: http://www.zgzlxxcy.cn/qikandaodu/2021/0326/941.html

上一篇:广西战略新兴产业专利实力状况研究
下一篇:新密市招商引资不搞急功近利从饥不择食到挑肥

中国战略新兴产业投稿 | 中国战略新兴产业编辑部| 中国战略新兴产业版面费 | 中国战略新兴产业论文发表 | 中国战略新兴产业最新目录
Copyright © 2018 《中国战略新兴产业》杂志社 版权所有
投稿电话: 投稿邮箱: