现在的位置:主页 > 期刊导读 >

战略性新兴产业多领域知识融合路径研究基于引(3)

来源:中国战略新兴产业 【在线投稿】 栏目:期刊导读 时间:2021-03-26

【作者】网站采编

【关键词】

【摘要】图2 研究领域的论文发表数量趋势 图3 参考文献引用网络可视化结果注:黄色代表数控设备领域内的引用;蓝色代表信息技术领域内的引用;绿色代表生物

图2 研究领域的论文发表数量趋势

图3 参考文献引用网络可视化结果注:黄色代表数控设备领域内的引用;蓝色代表信息技术领域内的引用;绿色代表生物医药领域内的引用;红色代表太阳能光伏领域内的引用;白色代表跨领域的引用。

(三)论文聚类

利用图自动编码器聚合引用网络的结构信息和文本信息,将网络中的每篇论文表示为低维的稠密向量,由K-means算法对这些向量进行聚类处理。

1. 图自动编码器训练

将每年的引用网络构造成邻接矩阵和特征矩阵,用于图自动编码器的输入。采用以下训练策略和参数设置 [26]:迭代次数为200,学习率为0.01,隐藏层维数为32,输出向量维数为16;将5%的引用关系作为训练集,将10%的引用关系作为测试集。训练得到的图自动编码器可将引用网络嵌入到低维空间,论文(节点)表示为16维向量,隐含了引用信息和文本信息。使用训练得到的模型对每一年的引用网络进行嵌入,据此获得多组论文向量。

2. 聚类

分别将得到的每一组论文向量输入K-means算法进行聚类。通过参数试验发现,类别数>25时可产生多个论文数量占比<1%的簇团,故分析过程采用的类别数均为25。

图4 跨领域参考文献引用趋势注:“数控设备<信息技术”表示数控设备领域的论文引用信息技术领域的论文,其中“<”表示领域的流向;以此类推。

(四)知识融合路径识别与分析

在聚类结果中,各领域论文占比较为均匀(至少有两个领域的论文占比>15%)的簇团定义为融合簇团,据此将2019年的簇团4、簇团10和簇团20确定为融合簇团。由此获得了与融合簇团对应的知识融合路径(见图5)、融合路径上各簇团的论文占比变化情况(见图6),可对知识融合路径进行直观识别和分析。随后使用LDA算法提取每个簇团的主题词,以确定融合簇团的研究主题和对应路径上的主题演化情况。其中,每个簇团的主题词又细分为多个子领域,每个子领域内的主题词排序取决于主题词的分布概率:主题词位置越靠前,则概率越大,重要性越强。文中展示了5条代表性融合路径的主题词(2016年和2019年)(见表2)。

图5 知识融合路径注:节点为该年聚类所得簇团,编号与表2中的结果一一对应。

图6 融合路径上各簇团的论文占比变化情况

1. 路径1、路径2和路径3的演化情况

这3条路径中的论文自2007年开始发表,逐渐演化合并后在2019年形成了簇团10(见图5)。①结合图6(a)可见,2006—2008年,路径1中信息技术子领域的论文主题相对独立,尚未出现融合现象;从2009年起,数控设备子领域与信息技术子领域的论文出现融合,且以数控设备和信息技术两个子领域的论文发表量为主。②在路径2与路径3合并之前,数控设备和信息技术两个子领域已呈现融合趋势,但仍以数控设备子领域的论文为主;在路径合并后,形成了数控设备和信息技术两个子领域论文占比均匀的融合簇团。③路径3自出现以来,数控设备和信息技术两个子领域的论文占比较为均匀。

从表2来看,3条路径中信息技术子领域占主要地位的主题词均为intelligence、data、network和algorithm,数控设备子领域的主题词则为cutting、control和 error。然而,3条路径的主题词仍有差异且各有侧重:路径1中的spindle重要性相对更高,路径2中较为重要的是error,路径3则是surface和milling。根据主题词的含义,结合融合簇团所包含的论文文本内容可知,由数控设备和信息技术两个子领域融合而来的研究主题是“智能算法在运动控制、误差补偿、工艺规划等方面的应用”。

2. 路径4的演化情况

路径4自2008年出现,初期的论文数量占比较为均匀,但数据噪声的影响较明显;2013年以来逐渐以生物医药和太阳能光伏两个子领域的论文为主。从表2来看,生物医药子领域出现的主题词为synthesis和materials,太阳能光伏子领域的主题词为energy、power、cells和storage。因此,生物医药和太阳能光伏两个子领域知识融合而成的研究主题是“太阳能转换与电能储存中的合成材料”。

3. 路径5的演化情况

路径5中的论文最早出现于1988年,在较长时间内论文数量一直较少且增长缓慢;2015年以来论文数量快速增长,以太阳能光伏子领域的论文为主;近两年数控设备和信息技术子领域的论文占比增大。从表2来看,数控设备子领域出现的主题词为energy和consumption,信息技术子领域的主题词排位靠前的是data、algorithm、neural和network,太阳能光伏子领域的主题词排位靠前的是photovoltaic、energy和power。结合路径5主题词分析所包含的论文可以发现:数控设备与信息技术子领域融合形成的研究主题是“智能算法在优化机床能量效率中的应用”;太阳能光伏与信息技术子领域融合形成的研究主题是“智能算法在光伏发电功率预测中的应用”;太阳能光伏与数控设备子领域融合形成的研究主题集中在电流和电压的转换与控制、元器件研制等方面。

文章来源:《中国战略新兴产业》 网址: http://www.zgzlxxcy.cn/qikandaodu/2021/0326/941.html

上一篇:广西战略新兴产业专利实力状况研究
下一篇:新密市招商引资不搞急功近利从饥不择食到挑肥

中国战略新兴产业投稿 | 中国战略新兴产业编辑部| 中国战略新兴产业版面费 | 中国战略新兴产业论文发表 | 中国战略新兴产业最新目录
Copyright © 2018 《中国战略新兴产业》杂志社 版权所有
投稿电话: 投稿邮箱: