xml地图|网站地图|网站标签 [设为首页] [加入收藏]

皇冠足球hga025手机版探讨古籍数字化的窘境与生机

皇冠足球hga025手机版,数字化是一场巨大的革命,正深刻影响着我们的生活,每个领域几乎都被卷入其中,即便是甘守寂寞的古籍,也概莫能外。20世纪70年代末古籍数字化最早开始于的美国;80年代,港台地区探路于前;90年代,中国继踵于后。进入21世纪,古籍数字化已呈星火燎原之势,发展之迅猛超乎意料。 然而近两年,古籍数字化的步伐却有所放缓,呈现瓶颈效应,又仿佛一只即将破茧的蝴蝶,在静静积蓄力量。 金秋时节,50余家学术及出版机构的60余名专家学者,从海内外各个角落齐聚北京,第三届中国古籍数字化国际学术研讨会如约举行。古籍数字化突破瓶颈,期待同业者的集思广益群策群力;会上,新观点、新思想的碰撞,新技术、新成果的涌现,无不呼应着古籍数字化前进的步伐。 窘 境 人人都羡慕阳光下蝴蝶的美丽,又有谁知道黑暗中蜕变的痛苦滋味。 标准之争标准缺乏,各自成理 会议伊始,原国家古籍整理出版规划小组办公室主任许逸民便把一个大家最关切的问题提了出来汉字简繁转换问题。如何处理转换过程中的异体字,是所有古籍整理者都望而生畏的难关,因为这不仅牵涉到全文检索,更会引发学术争议。繁体字正字表至今尚无国家标准,致使同一字在古籍出版物和数据库中出现不同字形,如為和爲,劍和劒,孰正孰异,莫衷一是,天下扰攘,乱相遂生。 当前最迫切需要的便是建立古籍数字化的国家标准,奈何主管部门碍于诸般顾虑,始终未能着手制定。首都师范大学中国诗歌研究中心主任赵敏俐感慨:古籍数字化的发展过程中,民间的积极性非常高,不断有学者呼吁建立国家标准;或退而求其次,先由民间建立通用标准,再得到国家认定也可。但如果这套民间标准真的推出,国家是否会予以认定,他对此深表怀疑。 首都师范大学周文业研究员形容当前中国大陆的古籍数字化现状为春秋战国,群雄割据。上世纪90年代古籍数字化在中国刚兴起之际,政府未能及时介入,徒然错失先机,如今争霸局面已成,再想统一,为时晚矣! 尽管如此,大多数学者还是希望古籍数字化能有一套起码的标准通行。会议主办方、首都师范大学电子文献研究所所长尹小林提出了建设古籍数据库的八条标准:其一,有确定的底本和书目提要;其二,文字差错率小于万分之一;其三,有简繁体两种文字,并实现相互对应;其四,应带有新式标点;其五,含高清版的底本图像;其六,提供智能化的全文检索;其七,具有智能数据分析统计工具;其八,可实现多种数据格式的转换和输出。这八条标准都是在古籍数字化工作过程中逐渐总结形成的,具有很强的专业性和实用性,因而获得了与会专家们的一致认可。 与建立标准息息相关的还有资源整合问题,河南新乡学院文学院副教授毛建军认为,资源整合是一项庞大而长期的工程,非朝夕之间能够完成,建立古籍数字化资源导航库将不失为一种方便快捷、切实可行的整合方式,并建议从数据库类型、建置单位和数据库主题三种途径进行导航设计。 标准如纲,导航如网,纲振网举,方可尽揽群籍。 版权之争天下公器,安能独私 由于古籍真正的作者皆已作古,无法穿越时空来捍卫自己的原创地位,因此古籍早已作为文化遗产被纳入了公共知识的范畴。所谓古籍的版权,实际是针对整理者而言的。 如今常见的古籍绝大多数都已被点校出版,版权握于传统出版社之手。为了避免纠纷,数字出版者们只好舍近求远,返择古本为底本,重起整理之炉灶,可还是难免抄袭嫌疑。 古籍整理犹如积薪,后来居上,一代又一代学者无不是站在前人的肩上,向着理想中的最佳版本一步又一步迈近。前人遇到的坎,后人学会跨过。前人走错的路,后人不必再走。如果因为整理在先,传统出版便将大批古籍资源垄断在手;如果因为点校相似,数字出版便被想当然地认定有侵权之嫌;那么古籍的命运就当真堪忧了。 中华书局编审刘尚慈不无遗憾地说:真正的最佳版本存在于当下,就是那些经过专家标点校勘过的本子。我们的古籍最应该数字化这些本子,可惜却受到版权限制,没有办法进行。而真正拥有版权的出版社,却又没有能力进行。 高校古委会秘书处副秘书长卢伟希望在互联网上建立一个开放的资源平台,怎么能够在共享和利益之间找到平衡,让大多数的学者都愿意把自己的成果投入进来,是这个平台建立的关键。 生 机 一只蝴蝶扇动翅膀,不久的将来会在遥远的彼岸掀起一场飓风。 古籍数字化发展至今,坐拥海量古籍资源,除了全文检索、联机字典、图文对照、繁简转换之外,数字化究竟还能做些什么? 本届会议为这个问题带来了几种可能的答案。 版本比对与辅助标点人力有尽,天道无穷 人类智慧无敌,机器效率无敌,人机合一,所向披靡。这正是古籍数字化孜孜以求的理想境界,虽然目前尚无法达到,却依然不乏希望。会上首都师范大学电子文献研究所演示的古籍智能版本比对和辅助标点系统,便让人眼前一亮。 所谓智能版本比对,指能自动进行多种版本的逐字比对,完成后即可标示出文字和符号的任何差异。所谓智能辅助标点,则使用了前沿的人工智能算法和多种资源库,理想状态下自动标点准确率在99.5%以上,机器无法完全识别的情形下会自动提示专家进行人工干预。单凭肉眼,很难分辨文字上的一些细微差异。尹小林说,如礻和衤、曰和日等,即使底本就在眼前,只怕也会误认,但对于电脑而言,却是完全不同的两个编码,识别起来绝无含糊。其实,比对的目的还是为了查错,在这方面,电脑的优势远非人眼所能比拟。 新闻出版总署规定图书出版质量标准为差错率不得超过万分之一。换作从前,这个标准很难得到彻底执行,但现在却是轻而易举。电子文献研究所曾用智能版本比对系统抽查了部分古籍图书,发现即便是权威出版社出版的权威版本,也有不合格者,更遑论其他普通版本。这一比对方法若能在今后的古籍校勘中加以效仿,相信定会从整体上提升古籍的出版质量。 除了自动校勘,自动标点同样是古籍整理工作者梦寐以求之事。而智能辅助标点系统的出现,让这个梦想变得唾手可得,尽管还不完美,却足以令人惊喜。借助该系统,不仅免除了许多无谓的重复劳动,还可以把节省下来的时间投入到更重要的研究中去,这无异于延长了学者的生命。为此,电子文献研究所于年初启动了文渊阁四库全书版《二十四史》的整理工程,权作试点,若然可行,便推而广之。他们的雄心壮志,是要最终完成文渊阁四库全书的标点出版。此愿如能实现,诚乃中华文明之莫大幸事!我们将拭目以待。 GIS技术与文学地图他山之石,可以攻玉 GIS即地理信息系统,如今广泛应用于交通导航、城市规划、资源调查、环境评估、灾害预测、国土管理等几乎各个领域。本质上,GIS也是一个数据库,只不过储存的是地理信息而已。因此,GIS对于古籍数字化必然有许多值得借鉴之处。 受此启发,武汉大学文学院教授王兆鹏在会上提出了一个大胆的构想利用GIS技术整合静态分散的文学史料,建立多功能的中国文学数字化地图平台。该平台将具有资料查询、数据统计、地图生成等功能,既可以查询中国古今文学家生平和作品中的重要信息,也可以进行分类统计,还可以用电子地图来呈现统计结果。地图可以显示每个时间点和时间段,中国各个地方有哪些作家在此地出生、在此地过世、在此地活动和创作;更可以显示一个作家生于何地、在哪些地方活动过,在哪些地方创作了哪些作品、跟哪些人一起交游互动并能按时间先后顺序自动生成作家行踪路线图。 这个构想是相当宏大和富有创意的,其核心框架还可以灵活套用在诸如历史、哲学、宗教等其他学科领域,就好像民间故事中的母题,拥有被无限复制的潜力。平台建成后,可以从时间和空间两个维度上提供多种观察文学的切口和视点,将很可能带来文学研究范式的革命性变化。虽然目前这个构想还只停留在理论阶段,并未付诸实施,但其远大前景是完全可以预期的。

日前,国学时代公司因不服中华书局诉国学时代公司点校本“二十四史”与《清史稿》等电子产品侵权案的二审判决,向北京市高级法院提出再审申请。2011年3月开始的这一诉讼,焦点在于,中华书局认为国学网使用了他们点校后的古籍,侵犯了中华书局的着作权。经点校后的古籍版本是否具有着作权?如何判断两件点校作品具有实质性相似?本报记者就此分别采访了传统出版业代表中华书局版权管理与法律事务部副主任任海涛,以及数字出版业代表首都师范大学电子文献研究所所长、国学时代公司负责人尹小林。将他们在古籍点校中的版权问题的针锋相对的观点辑录于此,以期对古籍的数字出版有所助益。

皇冠足球hga025手机版 1

焦点之一:点校作品是否享有着作权

任海涛:根据着作权法的规定,改编、翻译、注释、整理已有作品而产生的作品,这类作品称为演绎作品。演绎作品的着作权由改编、翻译、注释、整理人享有。着作权法规定,由法人主持,代表法人意志创作,并由法人承担责任的作品,法人视为作者。点校本“二十四史”和《清史稿》是在古籍作品的基础上经过创造性劳动而派生出来的作品,是演绎作品;同时,点校本“二十四史”和《清史稿》是由中华书局主持,代表中华书局意志并由中华书局承担责任的法人作品。因此点校本“二十四史”和《清史稿》自完成之日起便受到我国着作权法的保护。我国法律对演绎作品的传播采取“双重保护,层层授权”原则,既保护已有作品的着作权,又保护演绎作品的着作权。

尹小林:古籍整理工作内容丰富,包括古籍本身的点校以及二次文献、三次文献的处理。而点校属于一次文献的技术处理即仍是文献本身,还是一次文献,不存在着作权。如果有着作权也在校记中,校记如果带有考辨性质出观点的才有着作权,如果仅仅是列举,也不能享有着作权。

众所周知,古籍整理目标是求是求真,恢复古籍内容的原貌。古籍整理者不能“视古籍为己出”,妄自修改古籍内容,或随意增补字句,甚至将自己的创作风格、技巧融入古籍,改变古籍的内容及表达方式。“二十四史”及《清史稿》的古籍文字是前人原创留下来的,为了方便现代人阅读,通过分段、加注标点和字句修正等方式对古籍进行点校,根据中国语言文字的使用习惯和规则,经点校的各个版本的“二十四史”及《清史稿》都是极其近似的,存在着趋同性,点校作品之间不会有较大差异。不同的人对于古籍“二十四史”及《清史稿》原文加注标点的结果总是大同小异的,也就是说,对古籍“二十四史”及《清史稿》加注标点这种表达是非常有限的。而且,古籍“二十四史”及《清史稿》本身是已经进入公共领域的作品,古籍本身和加注过标点的文字,不形成独立的表达,它是依附于古籍本身而存在的,如果对加注了标点这种“标点”给予着作权保护,势必会形成一种不合理的垄断。

1991年着作权法实施条例第五条对“整理”的解释为“指对内容零散、层次不清的已有文字作品或者材料进行条理化、系统化的加工,如古籍的校点、补遗等”。但要注意的是,在2002年修改后的着作权法实施条例中该条被完整地删除,现在再主张古籍断句属于“整理”、能够产生新作品显然是不正确的。

焦点之二:“实质性相似”应如何判断

任海涛:在司法实践中,“接触十实质性相似”原则是认定电子软件抄袭的基本规则,即只要原告证明被告有机会接触原告的软件,被告后来完成的作品如果与原告的作品具有实质性相似,就可以推定被告的行为构成侵权。实质性相似通过比对的方式来确定,即看两个版本有没有表达的大致相同,因为着作权法保护的不是思想,而是表达。表达在古籍作品中的表现是分段、标点、校勘等。案件审理时,官以普通人的角度来看权利作品与侵权作品的相似程度是多少,在司法实践中,相似度超过50%以上,就基本可认定为实质性近似。

尹小林:我所存疑的是,多大比例的相似才能实质性相似?如果只是抽样,并不具备真实客观性。古籍的点校相似是古籍整理必然现象。在有国学基本知识的人看来,同一古籍的点校会有大量不相似的情况存在吗?我认为,在确认两个版本作品是否构成侵权时,采用的抽样比对方法和比对标准是外行做法,同一古籍标点的结果只能是差不多,包括对和错。

本文由皇冠足球hga025手机版发布于包装材料,转载请注明出处:皇冠足球hga025手机版探讨古籍数字化的窘境与生机

相关阅读