第32卷第1期 情报杂志 Vf)1.32 No.1 2013年1月 JOURNAL 0F INTELLIGENCE Jan. 2013 国际数字图书馆领域研究热点及作者团体分析冰 ——基于共词分析和社会网络分析 皇甫青红 华薇娜 刘艳华 殷之明 (1.南京大学信息管理学 南京210093;2.集美大学图书馆厦门3610201) 摘要利用Web of Science数据库,对国际数字图书馆领域文献进行收集,并利用SPSS20.0软件对文献关键词 进行因子分析和聚类分析,探讨了数字图书馆虚拟技术研究、资源组织研究、资源建设研究、电子资源及版权研究和 信息服务研究5大研究主题。同时借助社会网络分析方法,对研究主题和作者共现矩阵进行可视化,从而找到各个 研究主题内的作者团体。 关键词数字图书馆社会网络分析聚类分析 因子分析作者团体 中图分类号G250.76 文献标识码A 文章编号1002—1965(2013)01—0118—06 Research Focus and Groups of Authors in the Field of International Digital Library ——Based on Co—word Analysis and Social Network Analysis Huangfu Qinghong Hua Weina‘Liu Yanhua‘Yin Zhiming 【1.School of Information Management,Nanjing University,Nanjing 210093; 2.Library。Jimei University,Xiamen 3610201 J Abstract Based on the collection of international literatures on digital library from Web of Science。this paper analyzes the keywords by SPSS20.0 with Factor Analysis nad Cluster Analysis,and then explores five research topics including virtual technology research-resource organization research,resource construction research,electronic resources and copyright research,and information services research of dig- ital library.Meanwhile。this paper constructs the visualization map of the CO—occurrence matirx of research topics and authors by social network analysis and finds the groups of authors on these research topics. Key words digital library social network analysis cluster analysis factor analysis gmups of authors 0引 言 图书馆研究主题关键词进行了统计分析;董伟使用聚 类分析的方法对国内近10年数字图书馆领域的研究 随着计算机、互联网、信息技术等技术的发展,数 热点进行了探讨;苏娜运用UCINET对数字图书馆领 字图书馆领域的研究和实践迅猛发展,它已经成为2l 域共词矩阵进行网络指标分析和可视化;杜文龙运用 世纪图书情报学研究的热点领域。美国数字图书馆联 CiteSpace对数字图书馆CSSCI文献进行了研究热点 盟(NLF)提出数字图书馆的定义:数字图书馆是提供 的可视化分析 。国外使用共词分析方法对人工智 专业人员等资源,并对数字馆藏进行选择、构建、智能 能、知识地图、软件工程、信息检索等进行了深入研究, 访问、解释、分类、保存以及维护的组织,这类组织保证 共词分析法已经渗透到图书情报的各个研究领 特定的群体能简便经济地使用这些数字馆藏…。目前 域 。。作者认为很有必要对国际数字图书馆领域文 国内苏新宁等基于CSSCI对2000—2009年我国数字 献进行共词分析,从而发现国际数字图书馆领域的研 收稿日期:2012-09-01 修回日期:2012-10-23 基金项目:教育部人文社会科学研究项目“面向服务的高校图书馆绩效评价研究”(编号:llYJC870032)的研究成果之一。 作者简介:皇甫青红(1985一),女,博:七研究生,研究方向:信息检索、社会科学研究评价;华薇娜(1955一),女,教授,研究方向:信息检索、社会 科学研究评价;刘艳华(1985一),女,博士研究生,研究方向:信息检索、社会科学研究评价;殷之明(1974一),男,副研究馆员,研究方向:大学评 价、科研评价和信息计量学。 第1期 皇甫青红,等:国际数字图书馆领域研究热点及作者团体分析 ・1l9・ 究热点问题。 1 数据来源及研究方法 1.1数据来源Web of Science(简称WOS)是美 国汤姆森科技信息集团基于Web开发的产品,是大型 综合性、多学科、核心期刊引文索引数据库。本文选取 WOS数据库下三个子库SCIE(科学引文索引扩展 板——1899一至今)、SSCI(社会科学引文索引—— 1898一至今)和A&HCI(人文艺术科学引文索引—— 1975一至今),检索年限为2000—2011,文献类型为论文 (article)、会议论文(proceeding paper)和综述(re・ view),以“digital librar ”、“virtual librar ”、“elec. 1 信息检索 92 7.84 c 25 l!I I教育 17 1.45 2 网络 73 6.22 J I26 信息技术 本体 45 17 1 45 16 1.36 1.36 3 图 馆管理 67 5.71 l 127 4 虚拟图书馆tronic librar jIc”为检索词进行主题检索,共搜集2000— 2011年期间2 322篇数字图书馆领域相关文献,排除 3.84 l 28定量构效关系 16 l5 学术图书馆 31 2.64 I I29 版权 6 数据库 30 2.56 J l30 信息科学 7 用户研究 30、2.56 l 31l 知识管理 l5 1.28 15 I.28 15 1.28 没有关键词的文献,共得到1 173篇样本文献(检索日 期:2012年3月3日)。 8 9 元数据 28 2.39¨32 档案管理 27 2.30 l 33 I学习 推荐 15 1.28 15 1.28 14 13 13 13 12 1.2研究方法本文借助SPSS20.0软件,采用共 词分析法对数字图书馆领域的知识结构和研究热点进 行分析。共词分析方法最早是由法国文献计量学家在 20世纪70年代中后期开始研究的 …。共词分析方法 属于内容分析方法的一种,它通过分析在同一个文本 10 虚拟筛选 26 11 语义 25 12 电子出版 24 13 多媒体 24 2.22 l l34 组合化学 2.13 I 35 1分类 2.05 I】36 对接 2.05 l l37 国家图书馆 1.19 1.11 1.11 1.11 1.02 14 信息服务 15 信息管理 22 1.88 I j38 21 1.79_ 39 I目录 评价 12 1.02 12 .02 16 数字存储 18 19 2l 23 主体中的款目对共同出现的形式,确定文本所代表的 学科领域中主题间的关系,进而探索科学的发展” 。 共词分析的核心内容有三种,包括聚类分析、因子分析 和尺度分析。 17 电子期刊 20 1.71 Il 4l xML l2 1.o2 研究 用户界面 馆藏管理 搜索引擎 20 l,7l I{40 索引 20 1.71 lI 42 数据处理 20 18 18 1.71 l1 43 1.53 lI 45 数据挖掘 11 0.94 1l 11 0 94 0.94 0.85 2o 高校图书馆 19 1.62 I J 44 设计 电子图书 l1 0.94 本文结合因子分析、聚类分析、社会网络分析寻找 数字图书馆领域的研究主题,并且确定研究主题内的 22 信息系统 18 1.53 l】46 开源系统 11 0.94 1.53 ll 47 组合图书馆 10 24 通信技术 17 1.45 lI 48 人机交互 10 0.85 作者团体。因子分析法是一种抽取较少的公共因子来 描述大部分信息的降维方法,旨在初步确定提取高频 关键词中公共因子的个数;而聚类分析是一种归类方 法,旨在将高频关键词归类,从而找到某个领域的研究 热点。从某种程度来讲,因子分析为聚类分析提供了 分类的参考,聚类分析进一步验证了因子分析的结果。 首先,本文采用因子分析法对关键词共词矩阵进行分 析,初步确定提取的公共因子个数。其次,采用聚类分 析法对关键词共词矩阵进行数算分析,从而找到 数字图书馆领域的主要研究主题 。最后,运用社 会网络分析方法,对研究主题的相关作者进行共现分 析,并借助UCINET进行可视化,以便了解国际数字图 书馆领域的作者团体。 2研究热点分析 2.1 关键词词频统计本文仅对搜集到的1 173 篇数字图书馆领域的文献进行统计,共得到3 352个 关键词。统计的过程中,需要对关键词进行处理:合并 library、libraries等类型的同义词;“digitial library”是一 ・120.・ 情报杂志 第32卷 的具体降维结果,从而为聚类分析的分类结果提供参 不。 考。 2.3.2聚类分析结果。在SPSS20.0软件中,导 2 3聚类分析本文采用聚类分析法对数字图书 入关键词相异矩阵,采用系统聚类(Hierarchical Clus— 馆领域的研究主题进行归类。聚类分析是研究“物以 ter),选择离差平方和法(Wards Method)与离散数据 类聚”的一种方法,基本思想是:首先,将n个样品看成 类型(Count)中的斐方(Phi—square Measure)方法,进 n类,即一类只包括一个样品,然后将性质接近的两类 行聚类分析。离差平方和采用方差分析的思想,使得 合并为一个新类,这样得到/-/一1类,再从n一1类中找 类内关键词间离差平方和尽量小,类之间的离差平方 到性质最接近的两类加以合并,变成n一2类,如此类 和尽量大,从而达到分类的效果。。离敞数据类型可 推,直到所有的样品聚为一类¨ 。最后把整个分类 以设置分类数据之间的距离,Phi方度量消除了Chi方 系统画成一张谱系图,用它来表示所有关键词之间的 度量中维数的影响。结合因子分析的结果和实际情 亲疏关系。 况,本文提取5个公共因子,描述了总信息的 2.3.I 关键词预处理。关键词是文献核心内容 71.283%。最终分类结果如图1所示。 的集中概括,能够较好地反映某一研究领域的主题分 由图1可见,本文将48个关键词分为5大类别, 布与特点。对关键词进行聚类分析,为了便于统计,这 即国际数字图书馆领域研究热点主要集中在5大主 里将原始关键词共词矩阵转化为相异矩阵。用Ochiia 题:数字图书馆虚拟技术研究、资源组织研究、资源建 系数将共词矩阵转换成相似矩阵,具体算法为A、B两 设研究、电子资源及版权研究和信息服务研究。 词的Ochiia系数=(A、B两词共同出现的次数)÷(A a.数字图书馆虚拟技术研究。主要包括虚拟图书 词出现的频次xB词出现的频次),从而得到相似矩 馆、组合化学、虚拟筛选、对接、定量构效关系、人机交 阵¨ 。但是相似矩阵中的0值过多,统计时容易造成 互。虚拟化就是把物理资源转变为逻辑上可以管理的 误差,为了方便进一步处理,用l与全部相关矩阵上的 资源,以打破物理结构之间的壁垒,资源的管理都按逻 数据相减,得到关键词相异矩阵,部分数据如表3所 辑方式进行,完全实现资源的自动化分配,虚拟化技术 表3关键词相异矩阵(部分) 第1期 皇甫青红,等:国际数字图书馆领域研究热点及作者团体分析 ・121- 数字资源共享等内容。建设数字图书馆要按照整体 船台化举3‘ ^机鹫嚣坤 I I 性、特色化、用户至上、科学性、系统性的原则,采取科 囊柜棒赡'撇括舅 口 ===二 数字I 目书馆虚拟技术研究 学有效的方法和手段对各种信息资源进行筛选和整 耀 理、进行深层次的开发和整合 。数字图书馆要进行 慵望'1奉件 I .I : 诧皇 ● I 合理科学的资源建设,才能更好的为用户提供服务。 Ⅺ L帕 l I I融军网 { 资源翱织研究 d.数字图书馆电子资源及版权研究。主要包括电 讲充●鲞 380 二二 子期刊、电子图书、电子出版、版权。电子资源是数字 善冀体12 萤警样■耩赢■麓9'B ■_1_] r 图书馆资源组成的重要部分,海量的电子资源的使用 瞳 .........._-J 计协¨ 也涉及到了版权问题。互联网时代版权问题的最大挑 精 糖■一镕 ●, ———一卜一 【I 战,进一步加强版权保护的技术性措施,采用防拷贝 片|产 椭细嘏臂囊救 ’7 撼栉嚣 一卜 技术、访问控制、内容保护、流媒体格式、数字水印以及 媲☆_ ...........一_J 扦一熏撬.譬御3a E I 错拿囡书馆咨渣ti I设 究 DRM技术,保护数字化信息资源版权 。 e.数字图书馆信息服务研究。主要包括网络、信 傅皇臂焉lE lit■娃蠢.2 息服务、用户研究、教育、信息检索等关键词。数字图 婀鼻麓蠊22 _●-●___-_-__--_-_-___-一 教搬席6 静瓣算 瞄耩∞ -__J }_ 书馆结合了先进的信息技术、网络技术,使得服务内容 艟I+●● l 不断扩展,主要包括信息检索服务、参考咨询服务、个 电 卿种伸 .乜译搏 嘏 l l 性化推送服务、信息定制服务等等 。在信息服务研 ■于啉峻13 一‘ I一冠子圈1,…珥I一.甚1:~_嚣骡敖屈 …..一 ,蠢挂,a l 极珂 究 究中,个性化信息服务成为研究的重点,个性化信息服 一精2 — ; 艚索雏鼍 务是指能够满足用户个体需求的一种服务,即根据用 柚囊溉索’ ......_一J 龋fI撞毒籀 ——— 户提出的明确要求提供服务,或通过对用户个性、使用 值息辩啭,' 值悄攀习惯的分析而主动地向用户提供其可能需要的服 务 嘲粥哺■穗 曩簟 曩臂11尊蠢 “砑lg I 数字图书馆信 鼠鬏务研究 in息拽求 3 —州 龋咒7 -J 11 |复博籀 ...-_j: 3作者团体分析 根据统计,数字图书馆领域研究文献涉及作者 1。聚类分析 在数字图书馆中的主要作用是进行服务器整合,也即 3 398位(不考虑同名异人的情况)。根据普莱斯对洛 将操作系统及应用从多个未得到充分利用的硬件平台 特卡定律的一个重要推论:杰出科学家中最低产作者 重新部署到单台服务器上,进而节约空间成本、管理成 所发表的论文数量,等于最高产科学家发表论文数的 本以及电源和散热成本” 。 平方根的0.749倍 。在本次研究中最高产科学家 发表论文数为10,则杰出科学家中最低产的那位科学 b.数字图书馆资源组织研究。主要包括语义、本 休、元数据,XML、研究、索引、多媒体。信息资源组织 家所发表的论文数应为2.37篇,取整数为3篇。也即 发文3篇及3篇以上的作者为数字图书馆领域的核心 即信息资源的有序化的活动:利用一定科学规则和方 作者,经过统计共得到1 14位核心作者。 法,通过对信息外在特征和内容特征的描述和序化,实 根据聚类分析的结果,将数字图书馆领域的核心 现无序信息流向有序信息流的转换,从而保证用户对 作者与5大研究主题进行共现,删除与5个主题都没 信息的有效获取和利用及信息的有效流通和组合 引。 关系的作者,得到共现矩阵。用UCINET对该共现矩 数字图书馆是下一代因特网上具有高度组织的超大规 阵进行可视化,如图2所示。 模资源库群,它内涵了信息资源的生命全过程,包括生 由图2可见,5大主题涉及的作者团体非常清晰。 产、加工、存储、检索、传递、保护、利用、归档、剔除等, 数字图书馆信息服务研究这个研究主题的作者相对来 数字图书馆资源组织的关键是将信息资源在知识单元 说比较多,团体比较大,联系比较紧密,主要作者包括 而非文献单元的层次上组织起来,从而提供有利于产 Adams,A、Jin,Y、Thomas,R、Ray,K等作者。数字 生新知识的资源、工具及合作环境¨ 。 图书馆资源建设研究主题的作者团体仅次于信息服 c.数字图书馆资源建设研究。主要包括档案存 务,主要包括Hey,J、Gow,J、Porcel,C、Chowdhury, 储、数据、信息系统、数据挖掘、推荐、开源系统等关键 G G等作者。数字图书馆虚拟技术研究和电子资源及 词。数字图书馆资源建设是数字图书馆重要的基础建 版权研究这两个主题的作者团体相对来说较小,但是 设,研究主要包括构建数据库、数字资源整合与开发、 也还有一些核心作者在研究,证明了这两个研究主题 第1期 皇甫青红,等:国际数字图书馆领域研究热点及作者团体分析 ¨ 、●_心 ]J 1{・123・ 1J提供资源保障。数字图书馆信息服务研究是资源建设 [8]Coulter N,Monarch I,Konda S.Sotfware Engineering as Seen 的目的,信息服务、信息检索、信息技术、用户研究等成 Through its Research literature:A Study in Co—word Analysis 为信息服务研究的重点,其中个性化信息服务也对资 [J].Journal of the Americna Society for Informaiton Science, 源建设提出了更高的要求。同时指出各个研究主题内 1998,49(13):1206-1223 [9]Ding Y,Chowdhury G G,Foo S.Incorporating hte Results ofCo 的作者团体:a.以Wei,J、Langer,T、Frecer,V等为代 -word Analyses to Increase Search Variety for Information Re— 表的虚拟技术研究相关的作者团体.b.以Liar,E P、 trieval[J].Journla of Infommtion Science,2000,26(6):429— Bertino,E、Teng,Y L等为代表的资源组织研究相关 45l 的作者团体;c.以Hey,J、Gow,J、Porcel,C、 [10]Law J,Bauin S,Counial J P,et a1.Policy and the Mapping of Chowdhury,G G等为代表的资源建设研究相关的作 Scientific Change:A Co-word Analysis of Research into Envi- 者团体;d.以Watkinson,A、Nicholas,D、Huntington, ronmental[J].Scientometric,1988,14(3-4):251—264 [11]Qin H.Knowledge Discovery Through Co-word Analysis[J]. P等为代表的电子资源及版权研究相关的作者团体; Library Trends,1999,48(1):l33—159 e.以Adams,A、Jin,Y、Thomas,R、Ray,K等为代表 [12]Callon M,Law J,Rip A.Mapping hte Dynamics of Science nad 的信息服务研究相关的作者团体。各个团体之间相互 Technology:Sociology of Science in hte Real World[M].Lon— 合作,资源建设、资源组织、信息服务相关文献较多,作 don:the Macmillna Press Ltd。1986:124—141 者团体较大,彼此之间的合作也多;电子资源与版权研 [13]骆方,刘红云,黄岜.SPSS数据统计与分析[M].北京:清 究、虚拟技术相关文献较少,作者团体较小,与其它主 华大学出版社,2011:169—173 题合作的也少。总之,数字图书馆作者研究团体已经 [14]高宝祥,董寒青.数据分析与SPSS应用[M].北京:清华大学 出版社,2007:311—313 形成,相对来说,热点问题的作者研究团体较大。各个 [15]张勤,马费成.国外知识管理研究范式一以共词分析为方法 作者团体的科研产出和科研合作绩效评价情况还有待 [J].管理科学学报,2007,10(6):65-75 进一步研究。 [16]向东进.实用多元统计分析[M].武汉:中国地质大学出版社, 2005:102—104 参考文献 [I7]李德育.关于数字图书馆应用虚拟技术的研究[J].图书馆学 Borgman C L.What are Digital Libraries Competing Visions 研究,2009(5):38-39 [J].InformationProcessing andManagement,1999,35(3):227 [18]毕强,沈涌.数字图书馆网格信息资源组织模式研究[J]. —243 图书情报工作,2007,51(8):10—14 苏新宁,夏立新.2000—2009年我国数字图书馆研究主题领域 [19]孙利红.数字图书馆资源组织[】].现代图书情报技术,2002 分析——基于CSSCI关键词统计数据[J].中国图书馆学报, (1):3—5 201 1,37(194):60~69 [2O]施蓓.数字图书馆的资源建设和服务[J].图书情报工作与 董伟.国内近十年数字图书馆领域研究热点分析——基于 研究,2004(1):63~64 共词分析[J].图书情报知识,2009(5):58—63 [21]邱均平,朱少强.数字图书馆版权保护技术及其规避行为的法 苏娜.基于共词分析的数字图书馆领域研究主题及进展分 律对策[J].情报科学,2006,24(1):1—7 析[J].情报杂志,2009,28(6):15—19 [22]袁嫒,杜小勇,马文峰.数字图书馆信息服务平台的建设 杜文龙.基于CSSCI的我国“数字图书馆”研究热点可视化分 [J].现代图书情报技术,2003(5):8-10 析[J].新世纪图书馆,2012(1):l1—15 [23]黄炜宇.数字图书馆个性化信息服务浅谈[J].现代情报,2007 Courtial JP,Law J.A Co-word Study of Artiifcial Intelligence (10):8I一83 [J].Social Studies of Science,1989,19(2):301—311 [24]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:194— Bhattacharya S,Basu PK.Mapping a Research Area at The Micro 195 Level Using Co—word Analysis[J].Scientometrics,1998,43 (责编:刘武英) (3):359—372 ‘’’卜一十”—‘卜一 卜一—’一-.—。卜*。+一”+”+一+”+一+ +-+”+”-4-”+-+”+一+”十一+一十 +”+” (上接第153页) Springer Verlag,1988:1—184 『5 1 都平平,宋协武.高校学科导航资源的知识组织模式及其优化 参考文献 [J].情报资料工作,2004(4):41—43 [1] 孙方礼,何晓丽.基于Internet的高校教师信息获取 组织 1.6] 王爽,徐行.基于用户分类标签建立结构性的大众分类法 他组织论析[J].情报杂志.2003(5):78—79 [J].图书馆学研究,2011(5):73—76 [2]何琳,陈焕之.我国学科信息门户研究综述fj].图书馆T作 [7] 刘向红.基于用户自组织的学科网摘¨户的设计[J].情报理 与研究,2010(12) 论与实践,2011(6):102~106 ,[3j 陈琳,王运武,徐华平.基于网络的学科信息传播平台—— [8] 徐少同.网络信息自组织视角下的Folksonomy优化[J].图书 学科网中句建研究[J].电化教育研究,2010(10):42—46 情报工作,2009(1O):102—105+120 [4]Haken H.Information and Self—Organization[N].New York: (责编:王平军)