时间:2015-12-25 15:43 文章来源:http://www.lunwenbuluo.com 作者:王芳,史海燕 点击次数:
(6)WebArchive的分析。对WebArchive自身的分析,主要包括资源分析和用户使用分析,有利于WA更好的发展。澳大利亚的PANDORA每月发布一组关于Archive数据规模和月增长量的统计数据,此外还有每月一次的用户使用报告、对相邻两月进行比较的新增资源报告。英国的WebArchive除提供每月一次的资源统计数据外,还利用数据挖掘技术提供三项可视化服务:为WebArchive中的短语或词生成N-gram、标签云和3D墙。
5、对我国的启发及未来的发展方向
WebArchive是一个实践性很强的领域,同时也包含众多待研究的问题。我国从2001年开始Web内容归档保存的实践,先后有北京大学网络实验室开发建设的“中国Web信息博物馆”、国家图书馆开展的网络信息资源采集与保存试验项目(WebInformationCollectionandPreservation,WICP)等。“中国Web信息博物馆”可通过其网站(http://www.infomall.cn/)访问,目前维护有约400亿的网页,提供URL查询和事件查询,并可通过API访问。但与国外相比,国内研究与实践的深度和广度都存在一定差距,而中文Web信息的独特价值和不断增长的数量又使国内WA研究和实践的重要性日益凸显,借鉴国外WA经验并探索适宜中文Web信息归档保存的理论、方法、技术成为迫切需求。国外WA实践有诸多成功之处,如多主体参与、广泛的交流与合作、注重标准和规范的建设、构建类型多样的WA、对访问与使用的优化等。同时,仍有许多问题和挑战,需要国内的研究和实践加以关注:
(1)法律与伦理问题。Web内容同其他出版物一样都受到知识产权的保护,WA对Web内容的归档保存面临的法律问题主要有三个环节:收集网络信息、提供存取以及长久保存。建立和完善数字呈缴制度并修改相应的知识产权法来解决这一问题是目前较为一致的看法,但其具体实施并不容易。而伦理问题则更为复杂。WA中有大量历史性数据,借助于更为先进的工具,使用者也许会发现内容创建者并不希望他人发现的信息,隐私权和数据保护的问题由此而生。
(2)新Web应用内容的归档保存。Web是异常活跃的领域,新的应用不断出现,如Web2.0。这些新应用形式同样是人类历史文化风貌的重要记录,但相较于传统Web内容,新的Web应用内容更难监测,隐私性更强,更新更为迅速。是否对其进行归档保存、保存哪些内容、如何保存等都是WA领域应深入研究的问题。
(3)存档内容的长期保存问题。Web信息的长期保存是数字信息资源保存领域一个较为特殊的课题,而WA的时间维度又增加了其长期保存的复杂性。此外,也有档案学者提出WA的采集机制有悖于档案学中的鉴定原则,是否WA中所有的内容均需要长期保存或如何将鉴定原则应用于Web内容的归档保存也是值得思考的问题。
(4)存档内容的多元化应用。虽然WA的使用问题受到越来越多的关注,但与功能和服务都日益强大和丰富的Web空间相比,WA的应用还有不小的差距。除伦理与法律问题外,技术的适用性问题是制约WA应用的主要因素之一。Web空间的技术和工具一般不能直接应用于WA,需要适当调整,对WA的构建带来不小的挑战。然而,WA的多元化应用特别是应用于学术研究是目前的趋势,如“利用WebArchive的数字研究”(DigitalResearchUsingWebArchives)工作组正致力于研究利用WebArchive开展科学研究的法律与伦理、可利用性和限制、以“大数据”方式利用WA的技术需求等问题。因此,积极向Web空间学习并探索各项技术在WA中的适用性,对于充分体现WA的价值是十分必要的。
参考文献:
[1]向菁,吴振新,司铁英,等.国际主要WebArchive项目介绍与评析[J].国家图书馆学刊,
[2]耿磊.起步阶段的网页信息资源长期保存[J].上海档案,
[3]闫晓创.国外WebArchive项目对我国的启示———以澳大利亚PANDORA为例[J].浙江档案,
[4]杨道玲.中文网络信息资源保存问题探讨[J].档案学研究,
[5]周毅.网络信息存档:档案部门的责任及其策略[J].档案学研究,
[6]刘兰,吴振新,张智雄,等.WebArchive的采集策略研究[J].现代图书情报技术,
[7]刘兰,吴振新.WebArchive信息采集流程及关键问题研究[J].情报理论与实践,
[8]刘兰,吴振新.网络存储信息采集方式研究[J].图书馆杂志,
[9]付光宇.国外网络信息资源采集研究及其启示[J].图书情报论坛,
[10]吕淑萍,朱兵.网络信息资源采集内容的甄选———国家图书馆“专题存档”的实践[J].国家图书馆学刊,
[11]徐健.英国网络信息保存联盟计划(UKWAC)及其启示[J].图书馆论坛,
[12]朱莲花,刘春燕.韩国的国家知识门户网站与WebArchive现状研究[J].情报理论与实践,
[13]李华,吴振新,郭家义,等.WebArchive发展历程与发展趋势研究[J].现代图书情报技术,
[14]周林兴.WebArchive保存研究:现状、意义与发展策略[J].档案管理,
[15]周毅.论网络信息存档权及其生成[J].中国图书馆学报,
[16]谢春枝.博客长期存取的现状和对策研究[J].图书情报知识,
联系方式
随机阅读
热门排行