论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>发表论文>范文阅读
快捷分类: 旅游情报杂志 国家科技图书文献中心 图书管理系统论文 图书管理系统毕业论文 图书参考文献格式 图书情报杂志 图书情报期刊信息大全 图书情报工作杂志社 图书情报类期刊投稿 图书情报投稿指南 现代图书情报技术杂志社 图书情报投稿

关于图书情报相关论文范文检索 和图书情报领域高被引论文共词聚类分析类毕业论文怎么写

分类:发表论文 原创主题:图书情报论文 发表时间: 2024-03-08

图书情报领域高被引论文共词聚类分析,本文是有关图书情报硕士论文开题报告范文与图书情报和词聚类分析和论文方面硕士论文开题报告范文.

胡利勇

(广东省委党校广东行政学院图书馆,广东广州518000)

[摘 要]以中国知网期刊全文数据库为数据源,利用书目共现分析系统Bicomb2对2011~2015年图书情报领域高被引论文的核心关键词进行提取、统计,并生成共现矩阵,借鉴普赖斯定律核心作者的测算方法,确定高被引论文高频关键词,然后通过统计软件SPSS和可视化工具Ucinet、NetDraw对高频关键词进行社会关系网络、共词聚类和多维尺度分析,揭示当前图书情报领域科研发展状况和关注热点.

[关键词]普赖斯定律 共词分析 聚类分析 社会网络分析 高被引

[分类号]G350

高被引论文是被引用次数较高的论文,被引用频次能够较为客观地反映出论文的学术水平和影响力.对图书情报领域高被引论文进行统计,分析高被引论文高频关键词的特点,有助于我们了解和掌握近期图书情报领域发展状况、研究热点和发展趋势.文献计量学中,普赖斯定律被用来确定高产和高影响力作者[1].多数情况下,高产作者和高被引论文的分布具有相同或相似的规律,可以借用普赖斯定律确定高被引论文[2-3].

1 文献来源与研究方法步骤

1.1 文献来源

利用中国知网期刊全文数据库,采用高级检索方式,时间期限设定为“2011年1月1日”到“2015年12月31日”,选择“图书情报与数字图书馆”作为学科领域,跨库选择“期刊”“博士”“硕士”“特色期刊”“国际会议”“国内会议”“学术辑刊”7个论文数据库作为文献来源库,共检索出124567篇文献,按照被引次数倒序排列,单篇最大被引次数为171,借鉴普莱斯确定核心作者的方法[4],确定高被引论文最低被引次数:Mp等于0.749*Npmax等于0.749*171≥9.79,取整数10,即累计被引10次或者以上的论文作为核心候选文献.

由于中国知网在检索列表2000条以后就不再显示被引次数,而被引排序第2000位的论文,被引次数为11,与高被引论文候选范围相当接近,因此将被引排名前2000的论文确定为高被引候选文献.这2000篇论文总被引次数为43369,篇均被引次数为21.68,取整数22作为高被引论文指数,即被引次数大于或等于22的论文作为笔者所研究的高被引论文,共578篇,去除重复文章3篇,共计575篇,占候选论文的28.75%,其中,博士学位论文两篇,硕士学位论文4篇,期刊论文569篇;基金论文233篇,占40.52%.这些高被引论文总被引次数为22587,占候选文献总被引次数52.08%,篇均被引39.28次,h指数为66.

1.2 研究方法和步骤

本研究主要利用Excel、Bicomb2、Ucinet、NetDraw和SPSS等工具和软件,对选取的2011~2015年图书情报领域575篇高被引论文进行统计分析,具体方法和步骤是:

①利用中国知网的参考文献导出功能,选择Notefirst方式,将样本论文的题名、作者、关键词等元数据导出为XML格式,并以文本(.txt)文件格式保存;②采用书目共现分析系统Bicomb2软件[5],提取样本论文的关键要素并进行统计,导出为Excel格式文件,多方面分析和讨论;③选取高频关键词,在Bicomb2中生成共现矩阵;并利用Ucinet软件和NetDraw工具,绘制核心关键词知识图谱;④运用SPSS19软件进行数据聚类分析,获得聚类树状图和相异系数矩阵的多维尺度图[6];⑤根据分析结果,总结图书情报领域学术研究的趋势和热点.

2 高频关键词统计分析

利用Bicomb2软件,提取575篇论文的发表年份、关键词信息,根据它们出现的频次,借鉴普赖斯定律确定核心要素信息.年份出现频次即当年发表的论文数量;关键词出现频次,即每个关键词在论文关键词中出现的总次数.

2.1 年份分布统计

2011~2015年图书情报领域高被引论文数量中(表1),发表越早高被引论文数量比例最高,表明论文累积被引次数主要与发表时间长短有关,发表时间越长,累积被引次数越大,高被引论文数量比例越高.

2.2 关键词统计分析

抽取575篇高被引论文关键词,共计得到1162个关键词,累计出现2305次,频次最多关键词是“图书馆”,出现频次100次,也就是说有100篇高被引论文使用了“图书馆”这个关键词.利用普莱斯公式,确定核心关键词最低频次:,取整数8,即关键词累计出现8次或以上的关键词,作为高被引论文的核心关键词,共得31个高频关键词(表2),占关键总数的2.67%,累计出现687次,占总频次的29.80%.此外,频次为7的关键词有7个,频次6的关键词10个;频次5的关键词12个;频次4的关键词33个;频次3的关键词44个;频次2的关键词160个;频次1的关键词最多,有865个,占关键词总数的74.44%.由此可见,2001~2015年,图情领域高被引论文研究主题分布相当宽泛.

这31个高频关键词反映了图情领域的研究热点,分析这些关键词之间的关系,有助于我们确定图书情报领域近年来的发展脉络、热点前沿和发展方向[7].

3 社会网络、共词聚类和多维度分析

3.1 社会网络分析

分析2011~2015年图情领域研究热点,主要利用BiDcomb2软件得到高被引论文的高频关键词共现矩阵,然后利用社会网络分析软件Ucinet6.0[8]和可视化绘图工具NetDraw[9],绘制出基于*中心度(Betweenness)分析和K-cores分析[10]的高被引论文高频关键词社会网络关系图谱.

图中圆形点代表高频关键词节点,节点越大,代表该节点在整个关键词网络中的作用越大、控制其他节点共现的能力也越强;节点之间的关系用实线连接,实线越粗,代表相互之间的关系越强[11].K-cores分析则是通过颜色来区分关键词在整个网络中的核心程度,红色表示节点关键词在网络中处于核心地位[12].

高频关键词社会网络关系图谱.通过图1,我们可以直观地得到以下结论:(1)从节点大小来看,“图书馆”“高校图书馆”“数字图书馆”是图情领域的三大核心,这3个核心对于揭示图情领域研究主题和热点意义不太大,或许只是界定范围是“图书馆”而不是“博物馆”“档案馆”“情报研究所”的一个标识,但是图情领域的各项研究热点,“学科服务”“大数据”“云计算”等是图情领域热点,都是围绕着这三大核心而展开的.(2)从节点间距离和连线的粗细来看,“高校图书馆”与“移动图书馆”“学科馆员”“学科服务”“微信”“智慧型图书馆”等距离较近、关系较为密切,说明高校图书馆关注点在于服务模式的改变,对移动图书馆和微信等服务新手段研究较多,学科服务也是高校图书馆研究的热点问题,“高校图书馆”与“阅读推广”的连线很粗,表明高校图书馆在阅读推广中的研究也比较多;同样,围绕“数字图书馆”相关的研究包括“大数据”“云计算”“数据挖掘”等.(3)通过K-cores分析将从整个网络分类,其中红色圆形节点占据图中大部分位置,且处于中心区域,说明它们是图情领域的研究热点,其他节点都是围绕这些热点延伸拓展的.

3.2 聚类分析和多维尺度分析

为了更加直观地描述图情领域高频关键词之间的距离和相似度,通过SPSS19的双变量Pearson相关分析功能,把由Bicomb2提取出的高频关键词共现矩阵转化为相关矩阵[13],然后在Excel中用“1”与相关矩阵全部数值相减,得到表示两个关键词间相异程度的相异矩阵(见表3),再用SPSS19对高频关键词进行系统聚类和多维尺度分析[14].

3.2.1 聚类分析

将关键词相异矩阵导入SPSS19进行系统聚类分析[15],方法中选择组间联接,度量标准为区间“平均Euclidean距离”,绘制树状图(图2).系统树状图更直观地显示出了聚类的整个过程,上边的横轴方向,给出了各类别之间相对距离的大小[16].

依据聚类结果,可将图书情报领域的研究分为4个主题:①新技术、新手段在图书馆信息服务中的应用研究.包括大数据、数据挖掘等在图书馆中的应用研究,微信、微博、移动信息服务等新服务手段在图书馆和阅读中的应用研究,云计算、关联数据知识服务在数字图书馆中的应用研究.②新研究方法、流程改造在图书馆中的应用研究.包括读者决策的采购新流程在大学图书馆中的应用,大学图书馆对社会网络分析、知识图谱、共词分析等新方法的应用研究.③图书馆学科服务模式创新研究.包括以学科馆员、学科服务、嵌入式服务等为主题的学科服务模式创新研究,以高校图书馆和公共图书馆阅读推广为主题的服务创新研究.④图书馆发展新动向研究.包括物联网环境下图书馆未来发展新方向的智慧图书馆研究,移动时代移动图书馆和手机图书馆的研究,以及在新环境下图书馆服务模式的变革研究.

3.2.2 多维尺度分析

多维尺度分析是研究对象之间的相似性或距离,将研究对象在一个低维(二维或三维)的空间形象地表示出来,进行聚类或维度分析的一种图示法.将关键词相异矩阵导入SPSS19进行“度量-多维尺度”分析,在距离中选择形状为“正对称”,模型中度量水平选择“区间”,度量模型为“Euclidean距离”,输出得到图3.

依据分析的结果,我们可以直观地看出,多维尺度分析图对高频关键词主题的划分,与树状聚类图的分类基本一致,其特征都是局部相对集中,整体比较分散,与中心点间的距离都比较远,整体热点不突出,局部热点特征明显.观察图3,我们把图书情报领域的热点问题大致划分为4个类团:①位于坐标图左上方的是“高校图书馆对嵌入式学科服务、阅读推广、读者决策采购的研究类团”,其中,嵌入式学科服务、阅读推广距离中心最近,是该类团的研究热点.②位于坐标图右上方的是“图书馆对大数据、知识服务、微信、微博等新服务手段的应用研究类团”,其中,微信、大数据、数据挖掘、知识服务是该类团的研究热点.③位于坐标图最下方的是“新环境下图书馆发展的研究类团”.相比之下,该类团内部节点联系松散,说明目前对该主题的研究还比较分散,由于该类团所处的位置可以预测,图书馆的变革都是由新技术带动的,新的技术环境下,必然为图书馆发展带来新的研究课题.物联网、智慧图书馆是该类团的研究热点.④位于坐标图左下小圈是“图书情报方法论研究类团”.社会网络分析、共词分析、知识图谱等新方法,为图书馆学、情报学增添了活力,该类团中,共词分析和社会网络分析节点之间关系紧密,它们与知识图谱都是研究热点.

4 小结与讨论

以上对2011~2015年图书情报领域高被引论文的分析,在一定程度上揭示这一领域的研究特征和热点问题,但采用的方法可能还存在不少缺点,分析问题的角度还有很多不足之处.

(1)关于普赖斯定律的适用性.笔者的研究前提是借鉴普赖斯定律测定核心作者的公式,将其应用于高频被引论文和核心关键词的测定.虽然也有不少学者将此方法应用于高被引和核心文献分析中,从分析结论来看,基本能够反映真实情况,但此方法的适用范围究竟如何,还需要科学的检验和论证.

(2)关于核心关键词的确定.核心关键词是笔者的研究重点,但在选取核心关键词的时候发现,有不少关键词是意义趋同的,如“大学图书馆”和“高校图书馆”完全可以合并,还有一些关键词对反映学科主题意义不太明确的“服务”“服务模式”“图书馆服务”以及“信息服务”等,这些关键词该如何处理,笔者还没有找到科学的解决办法,所以只能将统计结果呈现出来,希望同行给出解决方案.建议学者在论文写作确定关键词时,能够给出反映文章精髓的词语,直扣主题、力求精准,尽量避免概念宽泛、万象包罗的词语.另外,仅从核心关键词来确定图书情报领域的研究现状和热点,还是不够全面的.其实在搜集数据和撰写论文的过程中,笔者对高被引论文的作者、发文单位以及核心期刊等也做了相关统计和分析,从这些指标综合来衡量一个学科的发展,似乎更为科学.

(3)关于图书情报领域的热点问题.仅从研究的结论来看,图书情报领域未来研究的重点方向是针对这些热点主题的研究:嵌入式学科服务、知识服务是图书馆服务的发展趋势;大数据、云计算是图书馆技术的发展方向;物联网是图书馆将要面临的环境;智慧图书馆是未来图书馆的样子;共词分析、社会关系网络分析和知识图谱是将来我们分析描述问题的方法.

参考文献:

[1] 邱均平.信息计量学[M].武汉:武汉大学出版社.2007:192-195.

[2] 刘雪立.基于WebofScience和ESI数据库高被引论文的界定方法[J].中国科技期刊研究,2012(6):975-978.

[3] 刘雪立,王兆军.2004~2008年我国情报专题研究高被引论文的统计与分析[J].情报杂志,2010(1):64-67.

[4] 钟文娟.基于普赖斯定律与综合指数法的核心作者测评——以《图书馆建设》为例[J].科技管理研究,2012(2):57-60.

[5] 崔雷,等.文献数据库中书目信息共现挖掘系统的开发[J].现代图书情报技术,2008(8):70-75.

[6] 王佑镁,陈慧斌.近十年我国电子书包研究热点与发展趋势——基于共词矩阵的知识图谱分析[J].中国电化教育,2014(5):4-10.

[7] 侯海燕,刘则渊,栾春娟.基于知识图谱的国际科学计量学研究前沿计量分析[J].科研管理,2009(1):164-170.

[8] 卜彩丽.翻转课堂的研究热点、主题与发展趋势解析——基于共词分析的可视化研究[J].现代教育技术,2016(1):73-79.

[9] 王运锋,夏德宏,颜尧妹.社会网络分析与可视化工具NetDraw的应用案例分析[J].现代教育技术,2008(4):85-89.

[10] 胡昌平,陈果.领域知识网络的层次结构与微观形态探证——基于k-core层次划分的共词分析方法[J].情报学报,2014(2):131-137.

[11] 肖明.知识图谱工具使用指南[M].北京:中国铁道出版社,2014:37-38.

[12] 姜鑫.我国微博研究主题的共词可视化分析[J].现代情报,2013(11):108-113.

[13] 罗应婷编著.SPSS统计分析从基础到实践[M].北京:电子工业出版社,2010:191-193.

[14] 邱均平,杨思洛,王明芝.改革开放30年来我国情报学研究的回顾与展望(二)——情报学研究论文的作者分析[J].图书情报研究,2009(2):8-13.

[15] 安源.2000-2009年图书馆信息服务领域研究现状分析——基于词频分析法和共词分析法[J].情报科学,2012(6):873-878,892.

[16] 贾丽艳,杜强著.SPSS统计分析标准教程[M].北京:人民邮电出版社,2010(5):268.

胡利勇男,1980年生.硕士,馆员,咨询部主任.

(收稿日期:2016-05-25;责编:徐向东.)

该文评论:此文是适合不知如何写图书情报和词聚类分析和论文方面的图书情报专业大学硕士和本科毕业论文以及关于图书情报论文开题报告范文和相关职称论文写作参考文献资料.

参考文献:

1、 型大学博士生对ESI高被引论文发表的贡献以中山大学自然科学类学术型博士生为例 许仪a,王晗b,郑华c(中山大学a 发展规划办公室;b 图书馆;c 研究生院,广州 510275)基金项目中山大学高校管理研究项目“提高我校自然科学类博士研究生培养质量途径的思考&mdas.

2、 《上海市经济和信息化领域行政处罚裁量基准(无线电执法类)》正式出台 文 范 莹新修订的中华人民共和国无线电管理条例(以下简称“条例”)已由国务院和军委签署,自2016年12月1日起施行 为维护空中电波秩序,有效制止违规用频、违规设台……违法行为.

3、 图书情报服务建设新型智库 摘 要随着科学技术的迅速发展,新型智库建设成为我国科学深化改革的重要环节 新型智库的基础资源为知识资料,就情报机构而言,新型智库能够有效储存知识,实现知识传播 本文首先分析了新型智库的概述,同时阐述了.

4、 我国大学治理热点的领域构成和拓展趋势的共词可视化分析 陈冬松(吉林化工学院,吉林吉林132022)摘要运用书目共现分析系统(Bicomb 软件)和SPSS 20 0 数据分析软件对中国知网学术期刊总库中我国大学治理的研究现状进行统计分析发现,我国大学治理.

5、 新时代媒体形式多样化对图书情报工作的要求 【摘要】随着互联网技术的发展,新媒体逐渐兴起,它提供了更广阔的传播范围、更快的传播速度和更多的媒体形式,在此环境下,图书情报工作也具备了新的特点交互性、多平台、个性化,但这同时也给图书情报机构的管理能.

6、 图书情报专业生数据素养课程设置与特征分析基于iSc 图书情报专业研究生数据素养课程设置及特征分析——基于iSchool联盟院校的调查司莉1,2姚瑞妃2(1 武汉大学信息资源研究中心湖北武汉430072)(2 武汉大学信息管理学院.