论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 论文数字序号格式 数字通信世界杂志 论文数字 数字通信杂志 数字媒体论文 参考文献后面的数字是什么意思 参考文献数字格式 论文的数字标号 数字营销论文 从纸本期刊到数字期刊生产过程 关于数字论文 数字万用表开题报告

关于数字专升本毕业论文范文 和整合异构特藏资源构建数字人文系统类论文范本

分类:论文范文 原创主题:数字论文 发表时间: 2024-02-18

整合异构特藏资源构建数字人文系统,本文是数字类有关专升本毕业论文范文跟异构和人文和数字类专升本毕业论文范文.

摘 要数字人文的蓬勃发展给图书馆带来了新机遇,图书馆应充分利用特藏数据库建设资源全面、开放共享的系统平台,为人文学者的研究提供支持.文章首先简介数字人文和数字人文系统的相关概念、现状,总结数字人文系统的特点,然后介绍建设数字人文系统的整合方法,最后借鉴DPLA 整合的方法,以全国师范大学图书馆联盟的异构特藏资源为基础,设计数字人文系统平台.

关键词数字人文特藏资源异构整合

随着数字图书馆的发展,越来越多的图书馆将本馆拥有的实体特藏资源数字化、网络化,各大高校图书馆积累了大量数字化的特色资源.网络化的特藏资源是一笔宝贵的知识财富,不仅有利于特色资源的长期保存,加快人文知识的大众普及,还能为人文学者的研究提供更好的支持.但是,分散在各高校的特藏资源存在只服务于本校师生的信息孤岛现象.打破信息孤岛,整合特藏资源,将优化整合后的资源推向更广泛的用户平台,可以为缺乏特藏资源的图书馆提供支持服务,从而提高特藏资源的利用率.整合优化后的特藏资源具有质量高、资料完备的特点,在此基础上,借助GIS、数据可视化、文本挖掘等信息技术,人文学者可以从整个宏观的时空范围和群体角度对特藏资源进行观察、提出问题和研究.

1 数字人文系统概述

1.1 数字人文发展概述

数字人文的起源可以追溯至1949 年的“人文计算”,Roberto Busa 使用电脑对神学家St.Thomas Aquinas 著作内的字词进行大规模的处理,继而经历了起步、巩固、新发展和互联网时代等四个演进阶段[1].2004 年《数字人文指南》(A Companion to Digital Humanities)出版,“数字人文”取代“人文计算”,并被广泛传播.数字人文的概念难以界定,但是其活动特性可以用发现、标注、比较、引用、取样、阐释与呈现等7个原术语来进行概括[2].早期数字人文的参与者主要集中在文学、计量史学、语言学等领域.随着数字技术、计算技术的不断发展,巨量的资料分析、地理空间分析、人员流动轨迹分析成为可能,数字人文深刻地改变了人文学者的研究方式.数字人文受到越来越多的关注,数字人文组织迅速发展.截至2017 年,全球范围内以“数字人文”为名称的中心、项目、实验室等有190多个[3],包括斯坦福大学人文实验室、加拿大维多利亚大学人文计算与媒体中心、英国伦敦大学学院数字人文中心、德国哥廷根大学数字人文中心、日本立命馆大学日本文化艺术数字人文中心等.2005 年,全球最大的数字人文综合型研究机构国际数字人文组织联盟(The Alliance ofDigital Humanities Organizations, ADHO) 成立,现任成员包括欧洲数字人文协会、计算机与人文协会、加拿大数字人文学会、澳大利亚数字人文协会、日本数字人文协会、数字人文中心,其目的是促进和支持包括艺术和人文学科在内的人文艺术领域内的数字化教学与研究,作为一个基础平台,在研究、出版、合作和培训等方面提供支持[4].国际数字人文研究的蓬勃发展也推动着国内数字人文研究的发展,2011 年武汉大学成立数字人文研究中心,2014 年“数字人文与语义技术”研讨会在上海图书馆召开,2016 年“数字人文论坛”在北京大学召开,同年北京大学数字人文小组成立,2017 年上海图书馆年会上复旦大学人文社科数据研究所揭牌.

虽然国内数字人文的研究起步相较于国外较晚,但是近年来不断快速发展,并且有了自主创新,例如古籍文本的可视化分析,中国历史地理数据的应用,上海世*对《清明上河图》的数字动态再创作等.不难看出,数字人文在国外与国内都受到了极大的关注,数字人文的理论不断完善,实践领域不断延伸.数字人文的出现为历史学、哲学、文学、宗教学和社会学等一系列学科的发展带来了机遇.同时,数字人文的发展也需要各学科协同创新、有机融合,学科间的不断融合,才能有效地促进学科间的资源共享和知识发现,才能为数字人文的发展提供一个知识性、创造性的研究环境,才能为社会发展绵长历史中人文精神的传承起到推动作用[5].

1.2 数字人文系统介绍

早期的数字人文研究更多的是单个或几个学者以电脑为工具,用计量方式对文学作品的文本进行分析, 如Roberto Busa 对St. ThomasAquinas著作进行的大规模字词处理,陈炳藻对《红楼梦》的归属研究.随着数字人文的快速发展,数字人文的开发需要更多的专家学者、普通大众和机构参与,数字人文系统应运而生.数字人文系统是以典藏机构的数字化资源为核心,在此基础上由基金会、机构、领域专家等支持开发的系统,系统不仅可以提供保存资料的典藏手段和寻找资料的检索工具,还可以协助研究者重新组织、分析资料,提供一个探索环境,也可以通过众包平台功能、提供API 方式等与外界交互,共同发展.典型的数字人文系统有中国历史地理系统(CHGIS)、中国历代人物传记资料库(CBDB)、唐宋文学编年地图、上海图书馆家谱知识服务平台、南京师范大学的华夏民族家谱地理信息系统、“台湾研究院”的中华文明之时空基础架构(CCTS)、台湾历史文化地图(THGIS)、台湾历史数位图书馆(THDL),除此之外, 早期的HathiTrust、DPLA(Digital PublicLibrary of America)等基础设施平台也开始提供数字人文服务.表1 分别从系统创建的资料来源、提供的功能及工具、与外界交互情况列举了中国历代人物传记资料库(CBDB)、台湾历史数位图书馆(THDL)、上海图书馆家谱知识服务平台等三个较成功的数字人文系统的建设情况.

CBDB 是由哈佛大学费正清中国研究中心、“研究院历史语言研究所”和北京大学共建,其远程目标在于系统性收入中国历史上所有重要的传记资料,并将其内容毫无限制地、免费地公诸学术之用.截至2016年4月,数据库共收录约37万人的传记资料.CBDB除可作为人物传记的一种参考资料外,亦可作统计分析与空间分析之用[6].THDL由台湾大学项洁教授团队主持,2006年完成,2007年开放使用,总共包含了近九万件和台湾有关的文书和民间契约等,是台湾史研究最为丰富的资料库[7].THDL可以帮助使用者定位资料,提供检索后分析功能,可进行诸如分类、检索结果年代分布图、词频统计等初步分析,并提供“自订文件集”功能和一系列分析工具帮助使用者重新组织、分析资料.“家谱知识服务平台”由上海图书馆建立,在充分利用馆藏家谱的基础上,将家谱数字资源以“时间轴”“地图”等可视化的方式开发出来,可见即可得地展示某一姓氏在某一地理空间范围内的分布情况[8].三个数字人文系统平台有以下共同点:(1)以多来源的或单一来源的数据库内容为核心.全面的、高质量的资料是数字人文的起点,为了适应各类人文研究的需求,不同的研究者皆需要有适合的、能与之对应的数据库的建立[9].(2)在内容的基础上提供检索、分析等工具,帮助研究者从大量资料中定位所需资料,分析资料.(3)提供API接口,实现不同数据库之间、数据库与互联网之间的通联.(4)允许使用者编辑、进行自己的创作,与研究者进行对话,共建数字人文系统.这些系统平台为建设基于图书馆异构特藏资源的数字人文系统提供了参考.

2 异构资源整合的意义、方法与案例分析

2.1 异构资源整合的意义

数字人文系统是以数据库为核心,必须有正确而完备的典藏和资料库作为基础,数字和人文研究才有更进一步合作的可能,数字人文系统的质量取决于资料是否正确、相关的记录是否皆有收录[10].先将分散的、异构的资源整合,在此基础上构建的数字人文系统提供的数据资源更加全面、完整、权威,质量更高,可以将人文研究学者从繁杂的资料收集、整理和辨伪工作中解脱出来.整合的异构资源系统使得资源可以跨时空、跨典籍立体交叉显示,支持不同研究领域和研究方向的学者在同一个平台开展工作,各取所需[11],给人文研究学者提供了一个全新的视角.例如,唐宋文学编年地图将中国诗词在地图上显示,是文学、历史和地理的融合,通过平台,可以直观地了解诗人在各地的足迹,也可以查看同一地点不同诗人不同时期所做的诗词.

从图书馆出发,异构资源的整合为图书馆注入了新的活力,提高了公众对其资源的认知度,改变了其在公众眼中的封闭形象.在分散的、异构的资源基础上构建系统,资源利用率低,资源不完备,极大地限制了特藏资源的价值发挥[12].从经济角度出发,直接在分散的、异构的特藏资源基础上构建各自的数字人文系统,其成本是巨大的,不利于功能扩展.先将异构特藏资源整合,在大量数据资料的基础上构建数字人文系统,并将优化整合后的资源推向更广泛的用户平台,不仅能够有效提高资源利用率,还增加了用户访问资源保存机构的频率.将存在于不同地点、不同系统的特藏资源整合起来,是建设数字人文系统最基本的工作.

2.2 异构资源整合的方法

数字资源整合也可称为数字资源集成,是在各种数字资源自主性、分布性、异构性的基础上,运用各种集成技术和手段将各类数字资源集成在统一的利用环境下,实现“一步到位”的检索,让用户方便地利用各种数字资源,为其节省时间和精力.为了能够将异构资源整合在一起,实现统一检索和访问,促进资源的发现与共享,图书馆采取了一系列解决方案,如OAI-PMH(The Open Archive Protocol for MetadataHarvesting)协议、Z39.50 协议、跨库检索、信息链接等[13].具体来看,资源整合的方法有以下几种.

(1)数据仓库法,指集成系统将存储于不同地方的数据收集起来,并经过分析、综合、转换等一系列数据加工处理工作,最后装载入本地的中心数据仓库进行统一存储.优点是资源相对稳定,在数据仓库基础上可进行信息挖掘,提供更深层次的知识服务;缺点是数据更新不及时,数据重复存储.DPLA、OAIster、Calis 学位论文项目通过OAI-PMH从数据提供方收割数据,并将数据存储于服务方的数据仓库中,HathiTrust项目通过FTPS 将书目数据提交给Zephir[14]处理,是资源整合的数据仓库法的典型例子.

(2)联邦形式.集成系统分为客户端和服务端,客户端负责获取用户查询,获取查询后发送至各个服务器,服务器解析查询并从各自的数据源中获取结果,整合后返回给客户端,或者利用中间件模式,客户端与中间层通信,中间层负责与各服务器相互联系.该方法一般只提供只读的查询功能,执行效率不高,但是数据不会重复存储,适用于被集成的系统规模大、数据更新频繁、数据实时一致性要求高的情况.Z39.50、SRW/SRU 就是属于此类集成方法的协议.

INNOPAC、CALIS OPAC 系统,就是将Z39.50作为中间层协议,将系统的具体实现映射到抽象模型上,实现异构系统间的交互式通信.

(3)基于本体的资源整合.本体论通过对概念的严格定义和概念之间的关系来确定概念精确含义,表示共同认可的、可共享的知识,成为语义Web中语义层次上信息共享和交换的基础.基于本体的资源整合是基于领域本体模型对异构数字资源进行语义标注并构建统一的(元数据)知识库,从而实现对资源的统一语义检索.本体在其中的作用是提供对资源进行语义标注的词汇标准[15].Wache等将基于本体的整合方法归纳为单一本体法、多本体法和混合法三种[16].单一本体法首先定义一个全局本体,提供一个共享词汇表作为集成时的参考,分布在各个地方的数据源都有全局共享本体相关联.多本体法是在各个异构的数据源上建立局部本体,然后在局部本体间建立映射关系.混合本体法是将单一本体法和多本体法综合,在多本体的局部本体方法上建立全局本体.本体能解决语义异构的问题,但是本体是领域相关的,对于不同领域内的资源整合较困难.

(4)基于关联数据的资源整合.伯纳斯·李于2006 年在语义网基础上提出了关联数据(LinkedData)[17].语义网试图将数据联系起来,并产生数据与现实事物的联系,以方便人与机器阅读和理解这些数据.关联数据是第一种可行的语义网表达形式,它采用RDF 数据模型,利用URI(统一资源标识符)命名数据实体,来发布和部署实例数据和类数据,从而可以通过HTTP协议揭示并获取这些数据,同时强调数据的相互关联、相互联系以及有益于人机理解的语境信息.由于关联数据要求采用URI 命名数据实体,并可以通过HTTP协议获取,完全自治的“数据孤岛”可通过关联数据连接起来,实现数据互联和集成.

(5)本体与关联数据驱动的图书馆信息资源语义整合框架[18].欧石燕等将本体与关联数据结合提出了此方法,旨在实现不同层次和范围的资源整合.该整合框架有3层结构,第一层是基于本体的文献资源整合,采用混合本体法实现异构元数据的语义互操作,首先构建一个共享的核心元数据本体,然后针对特定资源构建专门元数据本体;第二层基于关联数据的图书馆信息资源整合,采用关联数据发布图书馆信息资源使得每个资源可通过HTTP协议直接访问,并可沿着RDF链接访问其他相关资源;第三层与外界资源的链接与集成,采用关联数据与其他图书馆的关联数据或外界的关联数据(如DBPedia)相关联.

除了以上几种典型的整合方法,还有诸如中国知网的跨库检索,谷歌、百度等搜索引擎运用自己的计算机程序从网上搜集信息,为用户提供网页连接组合等整合方法;通过提供应用程序接口方式(API)与其他系统整合也是一种常用的整合方式.基于GIS的应用,还可通过将不同数据资源与GIS整合.在实践中,根据自身需求采用不同的整合方法,有时也会组合多种方法实现整合的目的,例如美国数字公共图书馆DPLA项目采用了数据仓库法,基于本体、关联数据的整合.

2.3 整合案例——美国数字公共图书馆DPLADPLA是通过多种方法将异构资源整合,在此基础上提供开放服务,为数字人文提供支持的典型案例.DPLA项目于2010年底开始讨论、规划,2013 年开放运行,它把档案馆、图书馆、博物馆和文化遗产机构、私人*机构等分散的资源进行统一集合,最大限度地开放可共享的文化遗产.DPLA整合的过程,首先从它的内容和服务中心收割数据,然后对其数据进行丰富,经MAP(Metadata Application Profile)映射存储,最后通过API发布数据.

(1)DPLA主要通过OAI收割、以及内容中心或服务中心提供的API收割来自两个中心的元数据[19].OAI-PMH是一种独立于应用的、能够提高Web 上资源共享范围和能力的互操作协议标准.在OAI-PMH的互操作框架中有两种主要的角色:数据提供者和服务提供者.数据提供者是元数据的发布方,采用OAI 技术框架发布元数据,使得服务提供者可以根据需求对这些元数据进行收割加工;服务提供者是元数据的收割方,使用OAI协议向数据提供方发出请求,并接收返回的元数据作为构造附加服务的基础.OAI协议被应用于DSpace、WorldCat、NASA、LibGuides、Omeka 等一系列组织的分享、收集数据中.DPLA为了更加迅速、更大范围的收集数据开发了一款新的开源OAI 收割器Spark OAIHarvester.Spark是分布式处理引擎,可实现并行处理大量数据,使得处理数据的能力更快.Spark 的另一优点是它支持结构化的处理数据,它提供诸如SQL查询、机器学习算法、图形计算等一系列内建库,这使得收割来的数据更容易检查、分析和操作.在Spark OAI Harvester的帮助下,DPLA收割数据、处理数据更加的方便、简单.

(2)DPLA 收割后的元数据,经过MAP 映射,并以关联开放数据加以强化,呈现和共享元数据.MAP基于Europeana数据模型EDM,并结合DPLA集成美国文化遗产机构元数据的经验与特定需求.EDM 主要使用来自其他命名空间的属性、加上少数独特的本地开发属性,为集成来自欧盟不同机构的多样化数字对象的元数据而开发,是一开放的、跨领域、基于语义网框架的数据模型[20].MAP起草于2012年,于2013年初发布为最初的版本v3.0.2014年7月略作更新为v3.1,2015年3月发布的v4.0,2017年12月发布最新版v5.MAP(v5)[21]根据实施过程中的需求及意见在原来的版本上修改而成,其具体情况如图1 所示( 引自: https://drive.google.com/open?id等于1fJEWhnYy 5Ch7_ef_- V48- FiA72OieG).MAP(v5)有9个核心类,其中使用了来自EDM 的Place、TimeSpan、Agent、WebResource,来自skos 的Concept,dcmitype的Colllection 和ore 的Aggregation.对象间的属性关系也是采用dc、dcterms 和edm 定义的层级关系.通过MAP 映射的DPLA 数据在Web上开放、共享,成为具有相互联系且可参引的数据,可与其他平台数据直接联系,形成一个开放的、可无限延伸与扩展的资源整合体系.

(3)DPLA提供统一检索界面,并提供API接口调用其函数,目前API使用的数据未更新到最新版,仍采用v3.1[22].其最基本的API调用格式为“https://api.dp.la/v2/items?q等于weasels&api_key等于”其中“https://api.dp.la/v2”是基本格式,“items”指的是请求的“资源类型”,除“items 单条记录”外还有“collections 集合”,“?q”后面跟的是具体参数,“&api_key”后面跟的是你从DPLA 取得的32 位字符串形式的key.其返回的格式为“JSON-LD”格式,如下所示:

{

count:8, start:0, limit:10,

docs:[ {

ingestDate:“2013- 03- 27T15: 56: 04.8414

13”,

_rev: “1- b9eb1deb8349347b8eea74a3c2bb

42”,

id:“ff13fd51e7f2d38ef3fab8888be38b ba”,

@context:{

edm: “http://www.europeana.eu/schemas/

edm/”,

isShownAt:“edm:isShownAt”,

dpla:“http://dp.la/terms/”,

dataProvider:“edm:dataProvider”,

aggregatedDigitalResource:“dpla: aggregatedDigitalResource”,

state:“dpla:state”,

hasView:“edm:hasView”,

provider:“edm:provider”,

collection:“dpla:aggregation”,

object:“edm:object”,

stateLocatedIn:“dpla:stateLocatedIn”,

begin:{

@type:“xsd:date”,

@id:“dpla:dateRangeStart”

},

@vocab:“http://purl.org/dc/terms/”,

LCSH: “http://id.loc.gov/authorities/subjects”,

sourceResource:“edm:sourceResource”,

name:“xsd:string”,

coordinates:“dpla:coordinates”,

end:{

@type:“xsd:date”,

@id:“dpla:dateRangeEnd”

},

originalRecord:“dpla:originalRecord”

},

……

}]

facets:[ ]

}

DPLA 通过API 与其他系统整合,程序开发者可通过API 访问DPLA 元数据,DPLA 原来的上有专门的“Apps”网页,列举了34款通过DPLA 提供的API 接口开发的应用.DPLA 整合的方法非常值得借鉴,通过OAI收割数据,并复用EDM、SKO 等成熟词表,发布关联数据与其他资源整合.DPLA 拥有大量经过加工处理的、较为完整规范的元数据信息,是重要的数据基础设施,可用于文本分析和挖掘,当前许多优秀的数字人文研究案例已开始受益于这些基础设施[23].

3 数字人文系统的设计——以师范联盟异构特藏资源为基础

3.1 师范联盟异构特藏资源现状调研

华东师范大学图书馆(以下简称“本馆”)早在2014 年就对师范联盟图书馆特藏资源的建设情况进行过问卷调查;2017 年又一次基于网络跟踪联盟图书馆网站特色馆藏平台的变化情况.据调研,师范联盟拥有的特藏资源数据库中,涉及人文学科(不含文库、教参及学位论文)的资源数量约占65%[24] (表2),图书馆特藏资源的有效开发可以支持为人文学者的研究提供支持.表中列举的特藏资源是经过师范联盟图书馆编目,使用商业或自建平台发布的.特藏数据库所使用的平台涉及TPI、TRS、Apabi-DESi、Apabi-TASi、IDL-ETD、DIPS、超星、麦达等商业平台,还有一些图书馆使用的是自行开发的平台.商业平台中TPI、TRS 的后台数据库是专有数据库,而其他系统的数据库使用的是SQL Server、MySQL 等关系型数据库.特藏资源使用不同的数据库、不同的发布平台,彼此异构,在为人文学者提供支持前首先需要选择合适的整合方法,整合异构的图书馆特藏资源.

3.2 基于师范联盟异构特藏资源的数字人文系统架构

由于整合异构特藏资源的目的是为人文研究提供支持,需要在数据的基础上提供知识发现作用,因此在综合考虑整合方法的基础上,拟采用物化的数据仓库式进行整合,即对元数据进行收割集中储存,其系统架构图如图2所示.对于已经编目且存储于类似于MySQL、MS SQL 及Oracle 的元数据,借鉴DPLA 整合模式,使用OAI协议.师范联盟各成员馆是OAI协议中的数据提供方,本馆是OAI协议中的服务提供方.首先要求数据提供方按照服务提供方要求的元数据格式进行编目.本馆利用OAI 收割器生成请求,通过HTTP协议的GET或POST方法向数据提供方发送OAI请求,数据提供方按照请求将数据返回给本馆,从而完成元数据的收割.对于未在集成系统内进行编目,以excel、xml文件存储的元数据,数据提供者可使用FTPS方式直接将元数据提交给本馆.本馆在获得元数据后,对数据进行去重、清洗、转换、合并和融合等加工处理存储于核心数据库中.在将采集来的元数据存于数据库之后,一方面识别元数据的实体,构建知识本体.在知识本体的构建过程中应遵循尽量复用已有的知识本体与术语词表.目前国际上通用流行的词表有DC/DCT、Schema.org、BIBFRAME、RDA、EDM 等.选定合适的词表后,从核心元数据出发,将元数据项与词表中的类相对应,并以属性来明确类与类之间的关系,从而形成立体网状模型.本体构建完成以后使用RDF 格式编码,存储于专用的RDF存储库中,发布为关联数据,实现与外部世界的自动关联、复用、共享的目的;另一方面在核心数据库基础上构建数字人文系统平台,借鉴CBDB、CHGIS和上海图书馆家谱知识服务平台等数字人文系统,该平台提供统一的检索功能,基于GIS技术动态显示资源信息;基于GIS的时空分析功能;提供编辑入口以众包平台方式让使用者参与资源的共建;提供开放数据下载功能;提供API 接口供其他程序调用;使用IP控制,供有权限的用户浏览全文等一系列功能,实现资源长期保存、共享及发展.

3.3 功能设计

以异构特藏资源为基础构建的数字人文系统,借鉴CBDB、THDL、上海家谱知识服务平台,应提供包括统一检索、分析工具、GIS 工具、众包平台、API接口、全文浏览等功能.(1)统一检索:数字人文系统聚集大量的数据,为帮助用户快速定位资源,检索是系统提供的最基本功能,包括简单检索、高级检索.CBDB除能提供基于人名、地名、官名和关键词的简单分面查询,还提供进阶查询功能,通过限定多种条件来构建自己的查询;THDL检索提供“相似文件”与相关文件功能,协助使用者查找资料,还提供“检索后分类”功能,每次检索后可根据年代、出处、作者、契书分类,并计算每个类别拥有的文件种类,且提供检索结果的“年代分布图”可视化显示;上海图书馆家谱知识服务平台提供基于字母的分面浏览功能.

(2)分析工具:CBDB可以进行群体传记学的统计分析,还可以进行时空分析,并提供社会关系分析工具进行社会关系网络分析.THDL 提供检索分析工具、关系探查工具.检索分析工具包括THDL 前后缀词分析工具、THDL 台湾总督府抄录契书地区分析及历史地理信息系统,前后缀词分析工具可进行词频分析;关系探查工具包括THDL 契约买卖角色分析,淡新档案诉讼关系图.

(3)GIS 工具:CHGIS、CCTS、THGIS、上海图书馆家谱知识服务平台、南京师范大学的华夏民族家谱地理信息系统、全唐诗电子检索系统等都是基于GIS 系统整合专题数据库,提供服务.厦门大学郑振满设计的莆田历史人文地理信息系统,则是以GIS为平台整合文献(民间文献、地方档案、书籍)与田野调查资料(实物、建筑、仪式、音色),构成一个跨越史料文类、主题、数据类型的数字人文系统,也可以说是一个时空史料综合体[26].基于GIS 的系统可提供GIS 有关点聚合、时间轴检索、古今地名对照服务、地图测距、开放检索POI和热力图等功能.

(4)众包平台:众包平台可以实现元数据、功能和全文的众包.上海图书馆家谱知识服务平台提供编辑、提交入口,用户可以编辑元数据字段,管理员通过审核后将被采用.数字人文项目“ 莱比锡开放碎片文本序列(LOFTS)” 采用Perseids平台,允许用户对引用文本及句法进行标注,实现基于协作众包的数字人文基础设施平台[27].TDHL 允许用户更正元数据、全文、人地名,管理小组不定期整理,采用后并更新于新版资料库中.CHGIS可帮助用户把自己的数据发布在复旦大学历史地理中心的"禹贡"网站或哈佛地学空间图书馆(HGL)、电子文化地图集行动计划(ECAI)和其他元数据信息交换站.

(5)API接口:提供面向程序的服务,即开发可被计算机应用程序调用的数据应用接口.通过API,每个资料库可以取用其他资料库的数据,而不必在自己资料库重新输入这些资料,实现不同数据库间的互联.DPLA 开放API,在此基础上程序员开发各自基于DPLA 资源的应用.

CBDB之空间分析就是建立在与CHGIS对接整合的基础上,同时麦吉尔大学的明清妇女著作、“研究院历史语言研究所”的人名权威人物传记资料使用CBDB的API.

(6)全文浏览:系统应尽可能提供全文浏览功能,实现开放共享,但是由于版权的限制有些资料只提供给部分用户浏览全文的权限,可采取IP控制,通过IP段授权,将部分功能提供给在IP段内的用户,从而实现权限控制.

(7)其他功能:CBDB提供邮件订阅,订阅后用户可以通过邮件得知平台更新情况,提供教学辅助文件下载,帮助使用者更好的利用CBDB资料集;CBDB提供罕用字输入工具、汉字转拼音工具,THDL提供苏州码转换器、度量衡单位换算系统等参考工具.

基于图书馆异构特藏资源的数字人文基础平台以师范联盟成员馆元数据为基础,应借鉴CBDB、CHGIS等成熟系统的功能提供一系列数字人文工具和软件供用户使用,并与用户和机器交互,按照由易到难的顺序逐渐完善其功能.

4 结语

数字人文的发展促使人文社科研究模式的改变,数字人文系统的建设需要图书馆的努力.本文是以特藏资源为例对支持人文研究的异构资源整合实践的初探,借鉴其他集成类系统的经验,打破信息孤岛,建立数字人文活动的系统平台,在系统基础上提供数字人文工具,为人文研究者提供支持.但是本文提出的系统对人文研究的支持作用有限,也存在一定的局限性.人文研究学者需要更深入地研究数据资料,如对特藏数据的全文进行识别,标注,抽取资源中的时间、地点、人物及事件等有价值的信息,在此基础上人文研究学者可以拥有更好的研究视角及体验,这将是我们下一步努力的方向.

言而总之,这是关于数字方面的大学硕士和本科毕业论文以及异构和人文和数字相关数字论文开题报告范文和职称论文写作参考文献资料.

参考文献:

1、 油田数字化的异构数据源整合和集成技术分析 油田数字化的异构数据源整合与集成技术分析解肖华1,张 彬2,赵 刚1(1 长庆油田分公司第五采油厂,西安 710000;2 长庆油田分公司油气工艺研究院,西安 710000)摘 要油田数字化是20世纪.

2、 将关联进行到底和特级教师同课异构学到的 摘 要与北京市特级教师张海滨老师同课异构草船借箭,课后进行对比分析,发现张老师的课注重一课一得 他将“关联”做足,做透,让学生关联着看,关联着想,关联着找,关联着读,引领学生通.

3、 彰显新诗教学的魅力简评三堂《乡愁》同课异构课 贾龙弟(浙江省平湖市黄姑中学,314203)摘要三位教师执教乡愁,教“新”不忘“旧”,教“诗”不忘“言”.

4、 民间历史文献数字人文图书馆构建----以徽州文书数字人文图书馆实践反思为例 摘 要 随着“向下看”的史学路径日渐成为主流思潮,民间历史文献资源的收藏、利用与数据库开发已成为学术型图书馆的工作重点,数字人文的兴起恰好为这一工作提供了重要的系统化思路 文章.

5、 高校数字图书馆移动虚拟学习空间构建 范建平(华北电力大学图书馆,北京102206)关键词高校数字图书馆;虚拟学习空间;移动环境摘要文章对高校数字图书馆构建移动虚拟学习空间的必要性进行了简要阐述,从资源、技术以及人才三个方面证明高校数字图.

6、 云计算技术驱动下构建数字图书馆虚拟化环境 关键词云计算技术;数字图书馆;云服务平台摘要图书馆经历了不同的发展时期,目前正朝着云计算方向发展 文章结合云计算技术及虚拟化技术,通过构建数字图书馆云服务平台,构建了基于云计算技术的数字图书馆虚拟化环.