【摘要】 “中国神话母题W编目数据库” 包含从中国各民族12600篇神话中提取的33469个母题,并将这些母题分十大类型、三个母题层级系统呈现,可在互联网上开放取用。该数据库较系统地展现了中国各民族神话的共性与个性,可为中国神话研究提供重要的便利与助力。本文详细介绍了该数据库的设计原则、数据来源、数据库建设过程,展示了该数据库的界面、检索方式以及其在神话学及相关学科研究中的应用,并分享了经验教训。
【关键词】神话;母题;编目;数据库;中国各民族
一、项目背景及概述
1.项目背景
神话作为人类早期重要的艺术形式,承载着丰富的历史文化信息,是不可再生的非物质文化遗产。
“母题”是构成神话的基本元素,可以反复出现在不同时期、不同地区、不同文化的神话中。例如,全世界很多文化中都普遍存在洪水神话母题。母题可以在神话传承过程中独立存在,也可以在史诗、传说、故事、歌谣等其他民间叙事体裁中再现或重新组合。“母题”因具有典型性、流动性、普适性等特点而受到学者的青睐,成为神话学、文学等学科研究的便捷工具,甚至被视为神话研究的“最佳分析单位”。[1]
中国是一个多民族国家,各民族神话数量众多,内涵丰富,传承形态多样。从载体和传承方式上看,神话可分为口头神话、文献神话、文物神话、民俗中的神话等类型。历史上,汉族文献典籍受重视程度较高,少数民族神话资料的搜集和研究相对薄弱。而大多数少数民族在漫长的历史发展过程中没有形成文字,神话基本靠民间口耳相传。即使有文字民族的神话也往往靠口传形式流传下来,这一类口头神话也被称为“活态神话”,传承不稳定,十分珍贵。[2]
为全面梳理、立档和保存中国各民族神话,呈现这些神话传承和研究全貌,促进神话学学科建设和民族文化再认识,中国社会科学院民族文学研究所王宪昭研究员用二十余年的时间阅读梳理了中国各民族海量神话文献,深入少数民族地区搜集整理活态神话,并对这些资料进行细分和数据统计。他采用国际民间文学研究界主流的母题学方法,以中国各民族12600篇神话为基础,设计了中国各民族神话10大母题类型,每个类型设定3个母题层级,编排了33469个神话母题名称及编码,并通过图表形式全面展现了母题类型与层级的逻辑关系,著成《中国神话母题W编目》(以下简称《W编目》)一书[3],于2013年出版。该书是关于中国各民族包括一些中国古代民族的神话母题的工具书,也是中国第一部全面提取中国各民族神话母题名称并系统拟定母题代码的神话学著作。
图1 《中国神话母题W编目》封面
该书出版后,为进一步推进民俗学、民间文学、少数民族文学及相关平行学科和专业的学术讨论、对话交流和成果传播,中国社会科学院中国少数民族文化与语言文字研究中心成立了“中国神话母题W编目数字化建档课题组”,并于2014年3月启动“中国神话母题W编目数字化建档项目”。该课题组由王宪昭研究员领衔,郭翠潇助理研究员承担数据库及其网站需求调研、方案制定、元数据结构设计、数据整理录入等工作,巴莫曲布嫫研究员担任学术顾问。在技术公司[4]的支持下,课题组完成设计方案,并开始录入测试数据、改进功能、调整页面结构。2014年11月,“中国神话母题W编目”数据库(以下简称“W编目”数据库)开始分步骤上线。
2.数据库的意义
“W编目”数据库,以神话母题编目为纽带将海量神话文本系统地组织起来,可多维度检索,并可在互联网上开放取用,极大地方便了研究者。该数据库可以较系统地展现各民族神话的共性与个性,考察各民族神话的流传与变化情况,有利于对神话形态、本质与内涵的研究。[5]利用这套编目体系,可以对中国各民族神话进行定量和定性分析,有助于各民族神话间的横向或纵向比较分析,有助于中国各民族神话的宏观研究与比较分析,也可以促进中国神话与世界各民族神话对话与沟通。正如有研究者所提出的,根据这一编目体系“建立起的现代信息技术条件下神话资料数据库,……对中国神话母题研究方法而言,也可说是一次技术性革命”。[6]
该数据库不仅适用于神话研究者,也适用于神话爱好者;而由于神话自身具有的多学科兼具的特点,该数据库不仅可以应用于神话学研究,对其他学科的研究,如母题学、文学、民族学、民俗学、宗教学、传播学等,也具有学术支持作用,可以提供基础信息和线索,便于研究者寻找规律、做深度分析和研究。
二、设计原则
W母题编目体系和数据库遵循以下设计原则:
1.专业性
“W编目”数据库由神话学专家、研究人员和数据库专家组成的专业团队制作,数据来源可靠,既可以为专业研究人员的提供高质量数据,又可以成为专业的学术交流平台。
2.系统性
本神话母题编目本质是一个具有数据检索功能的母题(关键词)编码体系,以确定的10大类神话母题类型为基础,对各类型母题力求做出符合形式逻辑或内容逻辑的划分。
3.互通性
全部神话母题与目前国际通行的斯蒂•汤普森《民间文学母题索引》[7]中的民间文学母题索引做出一一对照,并在编目中将汤氏母题编码对应列出,以便研究者对照使用,也便于通过汤氏母题编码与其他神话母题数据库系统对接和共享。
4.易用性
从使用者角度出发设计数据库及网页,注重用户体验,提供多种浏览和检索方式,让使用者在尽量短的时间内找到自己需要的资料。
5.可扩展性
母题编码体系和数据库元数据体系都具有可扩展性,为今后母题的增加和细化元数据元素保留空间。同时,数据库具有与使用者之间开放互动的特点,使用者可以根据自己的经验或判断将新发现的母题增加到合适的位置,以丰富中国神话母题数量,使母题结构更加合理。
三、数据来源和数据库建设过程[8]
1.数据来源
任何一个数据库的建设必须保证其数据来源的真实与客观。数据库的数据来源直接关系到数据库的质量,而对于“W编目”数据库而言,采用什么样的神话资料,更是决定了使用者的研究可信度和深度。
《W编目》一书和“W编目”数据库中的母题来源主要是中国各民族神话文本,包括中国各民族神话、中国古代典籍神话和中国近现当代采集的民间口头流传的神话,主要涉及:(1)国内外公开出版发行的相关出版物;(2)未公开出版的但具有权威性的出版物;(3)学术期刊;(4)个人田野调研搜集的材料。
2.数据库建设过程
着手神话母题编目研究之初,王宪昭研究员就希望将来在计算机和网络上实现中国各民族海量神话母题及相关信息的便捷检索、交互对话和广泛应用。因此,神话母题编目研究过程与数据库建设过程是合二为一的。整个过程大致可以分为以下几个相互交织的阶段:
1) 采集神话或与神话相关的文本;
2) 将神话文本转化为电子文本;
3) 从大量神话文本中提取核心母题或基础性母题;
4) 统计学、微积分、拓扑学等知识对母题排列进行预测,拟定母题各层级类型,并不断调整母题类型间的均衡性;
5) 形成相当数量的母题资源之后,与汤普森《民间文学母题索引》全部母题逐一对照,查遗补缺,调整或修正母题类型与母题描述;
6) 使用“Microsoft Excel工作表”对各类型已有的母题进行自然排序,进一步修正与调整母题排序,并对母题各层级类型做好跨类调整,删减重复的母题编码;
7) 为出版《中国神话母题W编目》一书,将Excel工作表转化为便于排版的“Word文档”格式。在“Word文档”格式下,每一个大类下面的母题按照一定的逻辑关系进行三级划分,并进行类型间的跨类调整,对一些关联项做出必要的标记,以免某些母题在不同的类型中反复出现或重复编码;
8) 在不断充实母题和修正母题编码的基础上,通过设置计算机模块检索并改进母题类型编排与表述,增强母题类型的规范化和母题表述的科学性;
9) 定制“W编目”数据库元数据项,根据元数据项修订步骤7中的“Word 文档”,调整表格结构,并与《W编目》纸质书对照校对,制作成可以导入数据库系统的规范的Excel表格。
10) 开发数据库和网站,将Excel表格中的数据批量导入并在网站上呈现。
对于数据库建设来说,第三步尤为关键。从神话资料提取母题时,须注意保留母题的“语境”,即该母题来源神话的作品名称、讲述人、讲述人民族、采录者、翻译者、作品形成时间、流传地点、语境、作品析出的出版物名称、出版者、出版时间、母题在出版物中的页码等,有些信息不全的文本可空缺相应项。这些信息不仅是母题价值判断和真实性查证的重要依据,还使母题成为结构化数据,为数据库提供基础的元数据信息。
在《W编目》一书中,所有母题均以“母题编目图表”的形式呈现。如图2所示,该图表包括W编码、母题描述、参照项三部分,其中母题描述下分三个层级的母题,参照项包括汤普森母题编码、母题来源神话所属民族、所列母题的关联性母题以及引例等。
图2 《中国神话母题W编目》中“母题编目”图表举例
由于受纸质出版物版面限制,“民族”、“关联母题”和“引例”基本上采用注释方式呈现。在将此图表转为可以导入数据库系统的规范的Excel表格时,将这几项内容从注释中抽出,成为与其他项目并列的数据项。“W编目”数据库与Excel表格数据段保持一致。图3为“格编目”数据库中的编目信息呈现界面。
图3 “W编目”数据库中的数据段名称及部分编目内容示例
四、技术架构
本数据库及网站管理系统基于B/S(Browser / Server)结构;服务器操作系统:Debian Linux 6.0.10;Web服务器应用程序:Apache/2.2.16 (Debian) mod_fastcgi/2.4.6;编程语言:PHP 5.3.3;数据库: MySQL 5.1.73-1+deb6u1;用户界面结构:HTML + CSS + Javascript + PHP。
五、阶段性成果
1.数据库系统及呈现网站
“W编目”将母题划分为十大类型,每一个大类的自然数母题数量为1000个,共包含10000个自然数编码的母题(编排过程中个别自然数编码母题可能产生空缺)。十大类型采用了三级类目分层级划分的方式,各类型各层级母题数量统计如下:
表1 《中国神话母题W编目》十大类型层级母题数量统计表
母题类型 | 母题数量 | |||||
代码 | 名称 | 编码范围 | 一级母题 | 二级母题 | 三级母题 | 合计 |
W0 | 神与神性人物 | W00-W0999 | 566 | 1989 | 2142 | 4697 |
W1 | 世界与自然物 | W1000-W1999 | 398 | 1603 | 2606 | 4607 |
W2 | 人与人类 | W2000-W2999 | 421 | 1488 | 1448 | 3357 |
W3 | 动物与植物 | W3000-W3999 | 510 | 1880 | 2281 | 4671 |
W4 | 自然现象与自然秩序 | W4000-W4999 | 290 | 1010 | 1179 | 2479 |
W5 | 社会组织与社会秩序 | W5000-W5999 | 244 | 877 | 1111 | 2232 |
W6 | 有形文化与无形文化 | W6000-W6999 | 443 | 1484 | 1439 | 3366 |
W7 | 婚姻与性爱 | W7000-W7999 | 347 | 956 | 1008 | 2311 |
W8 | 灾难与争战 | W8000-W8999 | 376 | 1143 | 1136 | 2655 |
W9 | 其他母题 | W9000-W9999 | 403 | 1393 | 1298 | 3094 |
合计 | 10类 | W00-W9999 | 3998 | 13823 | 15648 | 33469 |
目前“W编目”数据库系统已开发完成,正在逐步录入数据。呈现该数据库的专题网站也制作完成,网址为:http://myth.ethnicliterature.org/
2. 实现多种方式检索母题
对于一个数据库来说,检索系统的设计与功能决定了该数据库的可用度。“W编目”数据库为使用者提供了多种浏览或检索神话母题的方式,主要包括以下几种:
1)按母题类型目录检索母题。在“W编目”数据库中,选择“母题分类”栏目,可显示十大类三个层级的母题目录,如图4所示。这种方式主要适用于主要层级的类型母题的查找,通过目录中提示的母题类型,读者可以从该类型包含的子项中查找所需要的母题。
图4. 按母题类型目录检索母题
2)直接按顺序浏览母题编码表。“W编目”数据库中神话编目的呈现方式基本与《W编目》一书中保持一致,在“W编目”数据库中选择“母题W编目”一栏,可直接看到三级母题编目的全部信息,如图5所示。这样既可适应传统的阅读习惯,又保留了母题编目的自然结构,能够展现编目之间的层次关系。
图5. 直接按顺序浏览母题编码表
3)通过关联项查找母题。母题编码表中设置关联母题一项,可以直接点击关联母题代码查看该母题,扩展对神话叙事元素或结构的多方位了解。
4)通过族称查找母题。使用者可在检索框中输入族称,搜索该民族所有的母题,也可直接点击母题编码表中“民族”一项所列族称进行搜索。
5)通过汤普森母题编码查找母题。在 “汤普森”检索框中输入汤普森编码,可查找出与该编码对应的所有W母题编码。
6)通过关键字查找母题。可在“关键词”检索框中输入包括母题编码在内的检索词查找相关母题。
7)限定母题层级多条件查找母题。可限定母题层级,并同时限定 “关键词”、“汤普森”、“民族”进行多条件检索,更精确地查找母题。如,要查找所有一级母题中包含“神”字的藏族神话母题,就可以如图6所示限定条件,填写关键词,迅速得到检索结果:
图6 限定条件、关键词检索母题
此外,在“母题W编目”页面上提示使用者目前数据库中记录总数、各级母题编目数量、拥有神话母题最多的十个民族及其拥有的母题数量,这些数字都可以直接点击,快捷显示相应结果。
六、数据库的应用[9]
神话母题编目的最终目的在于神话研究中的实际应用。该数据库除便于准确查找神话中具有关联性质的母题之外,还有许多其他应用方式。使用者可以通过神话母题的类型与具体语义,观察诸多神话叙事类型或规则,把握文学创作的某些特定经验或规律。特别是在情节分析、叙事结构分析、主题分析等方面,通过若干母题的组合,可以推导出相应的叙事类型与相应母题的文化意蕴。
1.神话母题编目在具体神话比较中的应用
“W编目”数据库在神话研究中的应用最直接的方式是用于不同民族或不同地区多个相同类型文本的量化测量与比较,通过对每个文本母题的提取与排列,全面分析母题数量与变化情况,从而发现其共性规律或个性差异。如对于中国各民族神话中“天神”的共性分析时,我们通过对各民族神话文本的母题编码标注与关联,会发现不同民族的一些不同名称的天神。研究中可以对不同天神的产生、特征、职能、生活习性、使用的工具、寿命等一系列事项进行针对性地对比分析研究,据此可以查找出不同民族关于神灵的选择、宗教信仰的发生、神与生产生活形态的对应关系等一系列异同点,从而发现民族文化产生发展的内在规则或规律。
2.神话母题编目在神话叙事结构分析中的应用
众多母题可以组合成不同的神话叙事类型,即具有普遍性分析意义的“神话叙事结构模型”,依据这些模型,理论上可以对任何一篇神话进行量化分析、定性分析或比较研究。该分析模型可以划分出不同的组合方式,主要有以下几种:(1)链条式叙事结构模型;(2)发散式叙事结构模型;(3)嵌入式叙事结构模型;(4)平行式叙事结构模型;(5)复合式叙事结构模型;(6)其他形式叙事结构模型等。
3)神话母题编目在神话类型的组合规律分析中的应用
母题的提取与表述表面上看带有随意性,但其本质却体现出神话包括叙事文学内在的类型结构。通过W编目的母题设定与排列,我们不仅能归纳出母题排列的规则,还可以发现各种神话类型的组合规律。
七、项目前景预测
项目组将于2015年内完成所有神话母题编目的整理与录入,且全部在互联网上开放取用。
接下来,项目组将把《中国神话母题W编目》的姊妹篇《中国神话母题W编目实例》丛书也做成数据库。该丛书共分10卷,约1000余万字,将陆续出版。书中所有母题实例的编排顺序与《中国神话母题W编目》中的母题顺序完全一致。每一个母题的一个或多个实例,以言简意赅的形式对该母题做出验证性或补充性叙述,包含了“民族”、“流传地区”、“文本出处”等信息,见图7。项目组将通过母题编码把“编目实例”数据库与“W编目”数据库连接起来。
图7《中国神话母题W编目实例》内容举例
此外,项目组还计划在“W编目”数据库和“编目实例”数据库的基础上,加入中国各民族神话文本、图片、影像、神话研究著作、研究论文等相关资料,构成更为充实的“中国神话专题数据库”。同时,利用计算机技术将母题代码批量嵌入到神话的文本、图片、音视频资料编目信息中,以“W编目”为检索引导,将所有数据相连,实现中国各民族神话资料音影图文之间的交互检索,并可自动生成海量的关联性研究信息,形成特色数据,最终形成数字化时代神话多方位比较研究的便捷通道。一些研究者还可以以神话母题编目为依据,搭建起具有个体特色的神话专题研究数据库。
八、总结及经验分享
在当今信息技术快速发展的时代,大数据对学术研究的影响日益增强,数据库建设将推动着一场新的学术研究方式的变革。因此,学术类工具书从起步阶段就应为建数据库做准备,将数据的检索与规范融入工具书的理念与信息定制之中;同样,数据库的同步建设也应将专题数据的处理与使用者的客观需求自觉结合起来,以有助于查重、查错,加快工作进度,减少应用中的失误,以及迅速而准确地做数据统计。理想的状况是这一类书直接做成在线数据库,并实现开放取用。
在人文资源的数据库开发中,也要强化跨学科合作。如一方面人文社科学研究者应掌握一定程度的计算机技术,或至少有这方面的意识;同时数据库开发的专业人员也应注重与人文科学研究者的信息沟通,在广泛合作的基础上不断改进与完善数字化资源的管理与应用。
实践证明,神话是民族传统文化的生命之树,具有强大生命力的神话母题,可以跨越时空反复出现在多种文类、文化产品以及当今民俗活动之中。因此,神话母题编目数据库也会在今后的不断丰富和发展,同时也相信,中国神话母题编目数据库项目组会在今后的工作中有所建树。
基金项目:本文系国家社会科学基金重大委托项目“中国少数民族语言与文化研究”(项目号:10@ZH014)阶段性成果。
作者简介:
郭翠潇,中国社会科学院民族文学研究所助理研究员
王宪昭,中国社会科学院民族文学研究所研究员
巴莫曲布嫫,中国社会科学院民族文学研究所研究员
李刚,北京中研世纪科技有限公司总工程师
本文发表于《民间文化论坛》2015年第6期
[1] 陈建宪:《神话解读——母题分析方法探索》,湖北教育出版社1997年版,第34-35页
[2] 王宪昭:《论母题编码在神话研究中的实现与应用──以中国神话母题W编目为例》,贵州民族大学学报, 2015年第1期,第66-72页
[3] 王宪昭:《中国神话母题W编目》,北京:中国社会科学出版社,2013
[4] 北京中研世纪科技有限公司
[5] 王宪昭:《应加快建设中国各民族神话资料数据库》,《中国文化报》2011-08-23.
[6] 侯姝慧:《王宪昭的神话母题研究与人文情怀》, 《中国社会科学报》2014-11-24(B01)
[7] Stith Thompson: Motif-index of Folk-literature: A Classification of Narrative Elements in Folktales, Ballads, Myths, Fables, Mediaeval Romances, Exempla, Fabliaux, Jest-books, and Local Legends(V1-6),Bloomington, Indiana University Press, 1989.
[8] 由于“W编目”数据库的数据来源于《W编目》一书,因此数据库的数据来源和数据库建设过程与该书中神话母题的来源和提取过程大部分是一致的,这里仅作简要介绍,详细情况参见《W编目》一书中“编目说明”部分。
[9] 关于数据库应用的详细说明和举例参见王宪昭:《论母题编码在神话研究中的实现与应用──以中国神话母题W编目为例》,《贵州民族大学学报》, 2015年第1期,第66-72页
凡因学术公益活动转载本网文章,请自觉注明
“转引自中国民族文学网(http://iel.cass.cn)”。