
超星发现
-
2023年3月19日发(作者:公共关系礼仪实务)图书馆学刊 2014年第8期
TUSHUGUANXUEKAN N0.8.2014
基于超星发现系统的高校图书馆中文资源发现服务冰
王天虹
(天津师范大学图书馆,天津300387)
[摘要】目前我国高校图书馆所使用的国外资源发现系统对于图书馆中文资源的整合、发现、获取的效果都差强
人意。北京超星公司于2012年推出了中文资源发现系统——超星发现。对基于超星发现系统的高校图书馆中文资
源发现服务进行了初步评估,并比较了其与国外发现系统的不同之处。
【关键词】超星发现系统 中文资源发现服务高校图书馆
【分类号]G258.6
在当前高校图书馆的各类型学术信息资源激增的背景
之下,发现服务得到了广泛且迅速的推广和应用。目前我国
高校图书馆普遍使用的资源发现系统都是由国外的数据库
厂商或图书馆集成系统开发商推出的,其中主要包括Sum—
mOB、Primo Central、EBSCO Discovery Service(EDS)等几大发
现系统。经过笔者的调研发现,国外的资源发现系统对于高
校图书馆中文资源的整合、发现并获取的效果都差强人意,
而CNKI学术搜索、CALIS的e读学术搜索等虽然可以称之为
国内中文资源发现服务的雏形,但是无论是元数据覆盖的范
围还是系统的运行机制与功能都存在着一定的欠缺,对单个
图书馆的资源发现效果并不理想。因此,尽快开发拥有自主
知识产权的网络级中文发现服务依然受到了国内图书馆界
的广泛关注。北京超星公司于2012年推出了中文发现系统
——超星发现,超星发现旨在全面、准确地发现中文资源,并
且能够为用户提供具有知识挖掘与情报分析功能的中文发
现系统。超星发现系统是否可以称之为中文资源发现服务
的一种较为完善的解决方案,较之国外发现系统有何不同之
处,笔者对此进行了初步的探讨。
1发现服务的概念和特征
资源发现服务可视为一套系统u1,对于发现服务的概念
并没有统一的界定。笔者认为,对于高校图书馆来说,中文
资源发现服务就是利用预索引元数据仓储模式提供服务的
资源发现系统,将各类型中文资源内容包括图书馆的OPAC
进行有效的整合,从而实现高校图书馆所有中文资源的无缝
连接。同时帮助读者迅速、准确地发现并可以直接获取图书
馆的各类型中文资源以及开放获取资源,另外在此基础上进
行知识与情报的深入分析和挖掘,来帮助用户发现高价值的
中文学术文献,以实现知识的进一步发现。
发现服务的特征正是基于海量的元数据中心仓储数据,
采用先进的技术手段改善了图书馆用户的检索体验,并有效
地提升了检索质量(见图1)。在改善用户检索体验方面,发
现服务提供类似Google的单一检索框,通过简单、易操作的
检索人口对图书馆的所有资源进行检索和获取。发现服务
的数据搜索主要是在一个索引数据库中进行,因此可以实现
迅速、快捷的检索,再通过对检索结果的相关度排序、分面导
航等功能来帮助用户发现最适合的资源。另外包括检索词
提示和纠错、标签、评论、可视化等Web2.0功能的融入与支
持,有效提升了网络环境下的交互性用户体验;在提升检索
质量方面,发现服务可以实现对图书馆资源的全面覆盖,特
别是能够实现对OPAC的有效整合,并通过预处理保证了元
数据的质量,从而有效提高了检索结果的查全率和查准率。
图1发现服务特征
2 国外发现系统对于中文资源整合与
发现的局限性
笔者通过采取网站调研、系统调查、文献调研等非介入
式调查方法和访谈法,对国内几所已经采用国外发现系统的
本文系天津师范大学青年基金项目“大数据环境下大学生数据素养培养模式研究——以天津师范大学图书馆为例”(项目编号:52WU13 ̄)
研究成果之一。
叼
图书馆学:FU 2014年第8期
TUSHUGUANXUEKAN N0.8.2014
重点高校图书馆的使用情况进行了调研,其中主要包括:Pri
mo Central系统使用代表——上海交通大学图书馆(思源探
索)和清华大学图书馆(水木搜索),Summon系统的使用代表
——北京大学图书馆(未名搜索),EDS系统的使用代表——
中山大学图书馆(智慧搜索)。通过调研发现国外资源发现
系统在整合、处理中文资源的时候,都存在着如下一些不容
忽视的问题。
2.1 对中文元数据的获取不足
国外发现系统与国内的出版商或数据库厂商合作签约
获得元数据的进程非常艰难而缓慢,普遍收录不足的现象比
较明显,因此中文元数据的不丰富或者质量不高直接导致的
是中文资源发现率降低。比如:上海交通大学的“思源探索”
中的中文电子图书元数据厚度较弱,一般只有书名、作者、
ISBN号和出版社信息,而没有关键词、摘要等信息。在中文
期刊全文的获取上,国外发现系统也都存在着一些障碍,比
如通过“未名搜索”和“思源探索”检索到相关的中文期刊文
献后,点击查看全文,都是只能到达该期刊的目录界面,需要
采取进一步的检索,才能找到该篇文献的全文标题链接界
面。中山大学的“智慧发现”甚至连常用的一些中文文献资
源都无法检索到。另外,国外发现系统大都集成以文本形式
为基础的资源,对于视频、音频等多媒体资源则涉及较少,在
这几所高校图书馆的发现系统中能够找到的中文多媒体资
源通常只有本馆自建的一些多媒体数据库中的内容。
2.2对中文数据的处理能力、汉化水平都有待提高
国外的资源发现系统对西文资源处理得比较好,但是对
中文数据的处理却不尽如人意。比如清华大学的“水木搜
索”,查找中文期刊文献时,分面导航功能中的中文期刊名称
仍然采用英文显示。中山大学的“智慧搜索”,界面的汉化比
较差,EDS发现系统在简体版的汉化及中文数据的处理能力
方面都有比较大的欠缺。
2.3 中文检索技术不够成熟
由于西文资源和中文资源在检索的技术和方法上存在着
差异,国外发现系统对于中文资源检索的方法还有待进一步
完善,比如在使用Primo系统检索中文资源时,检索词加引号
和不加引号,检索结果的数量和相关性都有较大的差距脚。另
外,也存在着无法有效地辨识与处理繁体中文的问题。
2.4知识深入分析的功能欠缺
通过调研发现,自定义标签等国外发现系统比较侧重的
Web2.0功能,图书馆用户却对此并不感兴趣,这也是图书馆
用户与一般网络用户在功能感知上的不同 】。而国外发现系
统对于知识的深入分析与挖掘方面的功能并不突出,这恰恰
是高校图书馆用户特别是高级用户群体比较关注的部分,他
们期望能够从发现系统中找到并直观、清晰地看到某个关键
词、某个主题甚至某个学科近几年的研究发展态势、相关文
献知识之间的关联分析等。除清华大学图书馆利用Primo发
现平台的元数据进行了研究热点、学科趋势分析等可视化的
二次开发,在其他几所高校的发现系统调研中并没有看到相
关的内容。
3超星发现系统的应用实践与评估
超星发现系统自2012年起已经在国内的诸多高校开始
了推广和应用,目前天津大学已经正式引进了该系统,天津
市其他高校也开始了对该系统的试用。从发现服务的特点
出发,通过实际的应用,对基于超星发现系统的中文资源发
现服务进行了初步的评估。
3.1用户检索体验
3.1.1用户界面与检索结果处理
,超星发现系统的用户界面是一般发现服务所采用的类
似Google的单一检索框,充分体现了简单、易用的检索理念,
也提供高级检索的功能来适应高校图书馆用户传统的检索
习惯,同时提供了图书馆员使用的专业检索,均可实现与简
单检索间的自由切换。
用户界面的另一个功能是完成对检索结果的显示。对
于检索结果的排序,提供馆藏优先、出版日期降序、出版日期
升序、本单位产出、相关性、学术性的多种排序功能。在结果
的显示上,超星中文发现系统提供精炼检索和分面浏览功
能,这也是发现服务必备的一个功能。在分面选项中,除内
容类型、关键词、年份、作者、作者机构、学科分类等常见选
项,还设置了“不包括同位词检索”,让用户来自由扩充和缩
减检索结果。通过设置“检索学术文章”和“不包含报纸文
章”两个分面选项来帮助高校用户过滤掉非学术性的一些报
纸杂志类信息。另外,设置了重要期刊的分面选项,可以勾
选查找中文核心期刊、CSSCI中文社科引文索引、CSCD中国
科学引文索引等收录的期刊,更加符合中文学术发现的需
要,满足高校教师、研究生等高级用户获取中文学术信息的
期望。
3.1.2 Web2.0功能的融入
作为发现服务又一显著特点的Web2.0功能,在超星发
现系统的用户界面也有突出的表现。比如将检索词提示和
纠错功能进行了进一步的扩展即将常用检索词汇总并提示
在检索框之下,如果用户的检索切入点是某一个作者时,系
统会主动推送作者的简历与相关文章。除标签、评论、
BLOG等功能得到充分运用之外,值得一提的是超星发现系
统的可视化功能比较突出,将检索结果进行数据分析后,通
过可视化来展示各个知识点之间的关联,从而更容易帮助
读者发现新的知识,并能够直接获取该知识的相关文献。
图书馆学刊 2014年第8期
TUSHUGUANXUEKAN No.8.2014
同时提供包含某个检索词的图书、期刊、学位论文、会议论
文、专利及标准的学术发展趋势曲线图以及该检索词的报
纸关注热点趋势曲线图,在此基础上还能实现多主题对比
的可视化。另外,文章弓l证关系的可视化也是很多高校用
户所关注的内容。
3.2检索质量
3.2.1元数据覆盖范围与质量
中文元数据的规模与质量是中文资源发现与获取的关
键。北京超星集团公司拥有目前世界上最大的中文图书数
据库,并且始终致力于不断扩充自己在各类型资源上的覆盖
率。根据超星公司在天津大学的超星发现系统发布仪式上
的介绍,截至2013年2月1日,超星发现系统中的中文元数据
及全文数据量达1.99亿条,其中资源覆盖452万种图书、7800
万篇期刊、370万篇学位论文、400万篇会议论文、1亿篇报纸
文章、52万篇标准、770万篇专利、l0亿个网页和200万部视
频 。由于超星公司是世界最大的中文电子书的出版商,因
此不仅能够保证中文电子书元数据的厚度,而且对于电子书
的检索可以深入到章节级,可以对全文进行索引。在中文期
刊的元数据方面,除超星公司自身所独有的1200万中文期刊
元数据外,其他中文期刊的元数据还是主要通过元数据收割
的方式来获取,但是通过这类方式获取的元数据质量要稍
差。在期刊元数据的厚度上,大部分可以达到期刊名、作者、
ISSN号、关键词、摘要级别。但是超星发现系统是否覆盖了
绝大多数的中文核心期刊,还有待进一步评估。另外,对于
国外发现系统在中文多媒体元数据上的欠缺,超星发现系统
则较好地保障了这类元数据的规模与质量。由于超星公司
拥有国内最丰富的学术视频资源,目前已制作完成了包括数
十位两院院士在内的众多国内外知名专家、学者、教授讲授
的大量学术视频内容,并且还以每年上万集的速度增加,这
使得超星发现系统能够让高校图书馆用户去更多地发现与
获取具有学术价值的中文多媒体资源。
在提供中文文献原文的链接与获取上,为用户提供本馆
馆藏、电子全文和邮箱接收全文3种获取全文的方式,对于本
馆拥有使用权限的商业数据库资源,能够直接链接到所需文
献的全文标题下载界面,对于本馆所没有的中文图书或者期
刊文献全文,可通过发现系统中的全国参考咨询服务平台或
者图书馆文献咨询服务系统来获取。但是在期刊全文的获
取上,也存在着由于部分期刊的元数据没有通过正式签约方
式来获得内容商或者出版商的授权使用,从而导致期刊全文
链接获取不稳定的情况时有发生。
3.2.2与馆藏公共目录系统(OPAc)的整合
发现服务对OPAC的整合与发现是十分重要的,用户可
以从超星发现平台的单一检索框完成多种类型资源的发现,
包括对纸本馆藏的发现。由于超星公司是中文图书数据库
的翘楚,因此在对于高校馆藏书目数据的处理上,首先进行
数据对比,找到元数据仓储中没有的书目数据,将这部分数
据经过查重、修正等预处理,再上载到发现系统中,与庞大的
元数据仓储一起建立索引。由于只是单纯的数据整合,没有
实现服务整合,即OPAC中个人记录查询、续借、预约等服务
功能没有在发现系统的读者界面中呈现,因此用户必须进入
原有的OPAC界面中完成上述服务功能的操作。
3.3超星发现系统与国外发现系统的比较
超星发现系统与国外发现系统在技术上都是具有一个
元数据的中心仓储,可以向图书馆提供基于云计算的“软件
即服务”(SaaS)的服务方式。两者之间最大的不同在于元数
据中心索引覆盖的资源范围不同,前者是以中文资源为主,
后者以外文资源为主。另外在具体的功能、服务、价格等方
面也存在着一些不同。
①国外发现系统是开放式的,不对用户检索设限,而超
星发现系统的检索是受IP访问权限限制的。
②对于大家所关注的发现服务对于OPAC的整合,国外
的发现系统可以在数据整合的基础上实现服务层面的整合,
比如Primo Central发现系统,而超星发现系统只能实现数据
层面的整合。
③由于发现服务是基于海量元数据的搜索,检索结果的
相关度排序是十分重要的。国外的发现系统大都支持可以
调节相关度算法的功能,允许提升一些条目的排序 ,而超星
发现系统则不支持这样的功能,也就不能针对图书馆用户的
需求来不断优化、调整检索结果的相关度排序。
④对于高校图书馆自建数据库及资源的整合,国外发现
系统已经能够比较好地处理这部分内容,而超星发现系统则
没有看到这方面整合的具体实例,不排除一些高校图书馆出
于对自建资源数据保护的原因而放弃这部分内容的整合。
但是超星发现系统能否处理MARC、EXCELL、XML等多种数
据格式,能否较好地对这部分数据进行收割和获取,还有待
评估。
⑤超星发现系统在具备一般发现系统所具有的检索、发
现与获取的功能外,更加侧重对整合后的大量数据资源进行
知识挖掘与情报分析处理。即通过分析高校用户的知识需
求,从而揭示出各信息资源之间相互关联的立体知识体系,
并应用可视化技术来动态、直观地为用户展现海量信息资源
中潜在的规律和发展趋势。
⑥超星发现系统与国外发现系统相比较,在订购价格方
面具有较大的优势。由于超星发现系统必须要搭建于超星
公司的另外一个产品——百链系统的基础之上,因此高校图
书馆在购买超星发现系统的时候必须购买配(下转第79页)
图书馆学刊 2014年第8期
TUSHUGUANXUEKAN N0.8.2O14
题、新动向,并因地制宜地调整方法。同时,少儿图书馆应在
“为人找书、为书找人”的基础上,开展主题鲜明、内容丰富、
形式多样的读书活动,引导少年儿童爱上阅读,学会阅读 。
图书馆可以定期开展一些阅读推广活动,目的是培养孩子们
的阅读兴趣,引导他们的阅读方向。
4.5 注重儿童早期阅读的学术研究
依托于社会化、产业化的服务链向家庭提供早期阅读教
育服务。政府应对儿童早期阅读相关产业予以必要的指导
和扶持,加快社会化服务链条的形成,促进出版业的转型和
教育服务产业的发展,以市场化的手段有效促进早期阅读发
展 -。我国的学术团体大多是民间自发组织,可通过多元化
的学术研究与阅读开展方式,促进社会组织在这一领域的成
长和成熟。从学术上关注并进行长期的儿童早期阅读研究,
为儿童阅读提供有力的理论支撑。
5结语
笔者通过查阅资料、走访调查,并对调查结果进行数据
分析,讨论、制定了指导策略和建议。在今后的研究中尝试
从改善儿童阅读生态环境的视角,提出儿童阅读必须上升到
整个文化生态系统健康可持续发展的战略高度,以构建能满
足儿童自我发展需要的和谐阅读生态系统。
(上接第74页)套的百链系统,但即便如此,超星发现系统的
订购价格也远低于国外发现系统的价格。
4结语
超星发现系统可以实现对高校图书馆中文资源的深度
整合和便捷获取,符合发现服务的特征,但与国外的发现系
统相比,由于国内对于中文元数据合法性的模糊界定、对于
开放获取理念的接受度较低以及数据库商自身商业利益等
原因,在开放式服务、元数据质量、相关度排序等方面还存在
着一些问题,然而价格的优势、对中文资源更为全面的覆盖
率、侧重知识挖掘、情报分析的功能特点,也使超星发现系统
在中文资源发现服务方面的优势得以显现,这也是很多高校
图书馆在引进了国外的发现系统后又引进超星发现系统的
原因。随着国外发现系统对中文资源覆盖范围的日益扩大
及对中文数据处理能力的逐步改善与强大,国内自己的中文
发现系统将面临更多的挑战。在不断扩大各类型中文学术
资源的覆盖率,特别是提高中文元数据质量的同时,面向用
户的需求,提供更具有个性化的服务功能是中文资源发现服
参考文献:
【l】朱淑华.从战略高度推进儿童阅读[J】.图书馆理论与实
践.2010(2):75—79.
【2】百度百科.儿童敏感期『EB/OL].[2014-02-20].http://baike.
baidu.corn/view/1098897.htm.
【3】姜晨.电子媒介时代儿童早期阅读能力家庭培养环境调
查分析与对策研究【J】.教育理论,2012(5):245—249.
[4】王雯琦.儿童阅读:文化生态视闺下的战略选择【J】.图书
馆工作与研究,2010(12):123—126.
[5】颜虹.图书馆开展分享阅读活动的意义与实施策略[J】.河
南图书馆学刊,2007(2):51.
【6】左键.全民阅读,依然任重而道远[J].中华读书报,2013
(4):19.
【7】李晓.少儿阅读,合理引导是关键【J].图书馆报.少儿阅读
专刊,2013(4):C04.
赵双女,1981年生。本科学历,馆员。
务的发展方向。
(收稿日期:2014—04—30;责编:杨新宽。)
参考文献:
[1】1 陈丽冰.读者服务视角下的图书馆资源发现服务[J】.情报
资料工作,2012(4):66—70.
[2】包凌,蒋颖.图书馆统一资源发现系统的比较研究[J】.情
报资料工作,2012(5):67—72.
【3】刘颉颃,陈定权,郭婵.用户对图书馆资源发现系统功能
的期望——基于广州大学城高校图书馆学生用户的调
研[J].图书情报工作,2012(7):27-31.
[4]天津大学图, ̄[DB/OL].【2013—05—27].http://www.1ib.
tju.edu.cn/nl7397/nl7631/87720.htm1.
[5】Vaughan J.EBSCO discovery services[J].Library Technolo—
gYRepots,2011(1):30—38.
王天虹女,1980年生。硕士,馆员。
(收稿日期:2014—02~24;责编:张欣。)