南京!南京!
——基于《日本士兵在南京安全区的暴行》的文本挖掘
@作者:蓝星宇、梁银妍

1937年12月13日,六朝古都南京经历了一场腥风血雨,史称“南京大屠杀”。日本侵略者扫荡了南京城,并对南京的人民犯下了累累暴行。

尽管这道伤痕如此真实而深刻,日本政府却从未正式承认过这段历史。在那个缺乏科技、炮火连天的年代,留存证据成为一种奢侈。当代的研究者不得不面临史料缺乏的难题。

《拉贝日记》,由德国西门子公司驻南京办事处负责人约翰·拉贝撰写。其中的《日本士兵在南京安全区的暴行》,更是详细记录了拉贝当时所见、所闻的具体事件,为相关研究提供了丰富的数据。

南京安全区又称南京难民区,是1937年12月日本军队即将攻占中华民国首都南京时,南京城内的欧美侨民出于人道主义,为保护平民免遭战火而成立的难民区。安全区由南京安全区国际委员会进行管理,共设25个难民收容所。拉贝则是安全区国际委员会主席。

我们在南京地图上画出了安全区的位置(左图)。相比于现在庞大的市区范围,曾经的安全区只是其中的一小块,如一颗小小的宝石,镶嵌在南京核心城区——鼓楼区附近。

在拉贝的笔下,这块小小的地界,曾见证过怎样的历史伤痛呢?以下,是我们对《日本士兵在南京安全区的暴行》进行文本挖掘的结果。

(一)文本概况

“我这不是想说这里的形势不严峻,形势的确严峻。不仅很严峻,而且会变得更加严峻。那么怎样才能对付这种严峻的形势呢?我认为,应当拿出自己的最后一份幽默,正视自己愚蠢的命运。” ——《拉贝日记》

一位历史学家曾估算,如果所有南京大屠杀的罹难者手牵手站在一起,这一队伍可以从南京绵延到杭州,总距离长达200英里左右。他们身上的血液总重量可达1200吨,他们的尸体则可以装满2500节火车车厢。

而杀戮仅仅只是开端,强奸、抢劫、放火、掠夺,无时无刻在当时的南京发生。哪怕是由外国人建立的安全区,亦不安全。从拉贝提交给法庭的《日本士兵在南京安全区的暴行》,可见一斑。

其全文约4.2万字,共计426条数据,从西方人的视角记录了发生在安全区中日本人的种种行为。这些冰冷数据背后,所代表的则是无恶不作的残暴,以及血流成河的悲痛。通过对上述文本分词,我们共得到11573个词语(包括重复词语),以及3610个不重复的词语。其中,出现频次最高的词语是“日本士兵”,共出现468次,在整个文本中的频率大约为4%。其他高频词汇还包括强奸(176次)、妇女(163次)、姑娘(118次)等。

记录从1937年12月15日开始,结束于次年2月6日,历经50余天。拉贝于1938年2月被召回,离开南京,故《拉贝日记》关于南京大屠杀的时间截点至2月26日。

肢解后的文本,所呈现的景象远比冷峻的数字更加触目惊心。一个个妇女被强奸,一条条生命被漠视,一个个家庭被掠夺,成为日常发生的琐碎。具体来看,暴行多发生在下午和晚上,有时甚至持续一整夜。比如根据12月17日的记录,“许多妇女被从五台山小学强行带走,遭到了通宵的强奸,第二天早晨才被释放”。12月18日,“日本士兵从安置有100多名难民的金陵大学农科作物系将4名妇女抢走了一整夜,并强奸了她们,第二天早晨她们才被放回。”

在算法排序下,“日本士兵”、“妇女”、“姑娘”等仍然是最关键的名词。它们密集地分布在拉贝的文字中。“强奸”、“抢劫”、“闯入”等是最关键的动词,“年轻”等是最关键的形容词。

(二)发生何事?

“我们原先期望随着最高指挥官的到达能恢复秩序,但是遗憾的是,我们的愿望并没有实现。正相反,今天的情况比昨天还要糟糕。” ——《拉贝日记》

南京在经历大屠杀之前,正逢新旧之变。旧时代的南京是挑担沿街叫卖的小食贩,是锡匠叮叮当当敲着锡器,是孩童手抓圆形方孔铜钱着急换糖葫芦。新气象的南京是阳光晒干后发烫的沥青马路,是电灯霓虹灯辉映下的车水马龙,是高低丛生错落有致的现代洋楼。新旧辉映的南京是彩色的,也还有朽朽的气息,但它需要的是阳光,却未曾想到迎来惨绝人寰的暴行,直至一片血色,满目荒凉。

根据文本,日军攻占南京之后,暴行急剧上升。在日军占领南京的前十天(12.13-12.23),拉贝每天都记录下了较多的恶性事件——居民向安全区委员会诉说被日军侵犯的情况,有时安全区国际委员会,包括外籍人士的住所也未能幸免,比如日军闯入美国女传教士格雷斯·鲍尔小姐的住所,“抢走皮手套、喝掉桌子上的牛奶,还把糖罐全部掏空”;他们还试图开走美国医生 R.F.布雷迪的福特汽车;斯迈思博士的家也被非法入侵;“强奸”、“抢劫”都时有发生。

后来,文本中显示越来越多安全区国际委员会的成员阻止相关暴行发生,且日军行为也逐渐有所收敛,这点从《拉贝日记》也可以佐证。据12月26日,《拉贝日记》中写道,“昨天在我这儿没有发生入室行窃,这是两个星期以来的第一次,看上去情况真的有了好转。我这里的难民登记工作今天下午结束了,日本人甚至慷慨地又给另外20个后来偷偷摸摸塞进来的人发了身份证。”

但是,到1月底2月初,拉贝的记录数量又开始激增。其中,1938年1月29日与1月30日的日记,记录的数量达到了峰值,分别为48条、44条。这一时期,日本对安全区的打击加强,大量难民遭受日军蹂躏。

我们也可以按照事件类型,分别画出每一种事件发生的次数,随时间的变化趋势。在所有的事件中,最高频发生的是“强奸”,并且强奸事件的趋势与所有事件的总趋势十分相似,这是因为强奸事件一直在持续发生,并且贯穿了拉贝的整个记录。具有类似趋势还包括“抢劫”和“伤人”,这两类事件也是高频、持续发生。

相比之下,趋势有所增减的事件类型则是“强奸未遂”、“强迫劳动”、“杀人”和“逮捕”。其中,“强奸未遂”和“强迫劳动”在后期有所抬升。这主要是因为许多女性被保护了起来,或者成功逃脱了日军的侵犯,从而导致强奸未遂的记录增多。正因为这样,日军开始四处强迫中国人帮他们“找姑娘”,这构成了后期“强迫劳动”事件的主要来源。“杀人”和“逮捕”的趋势则有所下降,说明日军在严重的人身伤害、人身控制的行为上有所收敛。“强奸”和“抢劫”在后期再次攀升,成为诸多居民在离开安全区,回到自己住所时,再次遭遇到的伤害。

各类型事件发生频次及趋势

接着,我们用堆叠可视化,来展示这些事件累加的结果。可以看到,拉贝文本中记述的事件,在前期和后期确实呈现出两个波峰,且这两个波峰对应的事件类型也是最丰富的。总体而言,强奸和抢劫占据着绝对的主导。

不过,结合《拉贝日记》来看,日军暴行在中途的趋势有所减缓,或也与拉贝中后期的主要精力转移有关,其记录内容从日军暴行变为事关安全区运转的各类事宜。一开始,安全区建立后,尚有食物和相关物资支撑。后续,随着难民营收纳难民的数量显著增加,拉贝将更多精力放在跟相关各方交涉干预、获取相关物资方面,以维持难民营的运转。此外,还包括圣诞节如何度过、如何建设难民营、难民营运转情况,以及中日关系的最新消息等。比如12月29日,《拉贝日记》中提到,“我为那个准备恢复电厂供电的日本工程师招到了50名工人,并另外派了30名工人供维修水厂使用。我们欧洲人同日本人一样关心尽快得到照明和水。中午我同斯迈思博士一起拜会了日本大使馆的福井先生。我们请求允许我们运输燃煤和大米。”1938年1月初的记录显示,拉贝先后汇总记录了在南京的外国人名单、各个难民营情况等,制作暴行汇编材料交予日本大使馆,并借此向各方寻求物资支援。

由于强奸事件尤其多发,我们进一步分析了被强奸者的身份信息。其中,最多的描述是“妇女”,这一般指的是成年或已婚女性。其次高频的描述是“姑娘”,一般指的是年轻、未婚女性。如果文字中记录的是“某某太太”,则被标记为“已婚妇女”,因为这些女性都是随夫姓,因而是明确的、已经结婚的女性。

在一些记录中。拉贝也记录下了被强奸女性的具体年龄。其中,最小的仅有11岁,最年长的有60多岁。还有一些妇女,还在妊娠前后,就被强奸,如“19岁(分娩4天)”、“怀孕9个月的17岁少妇”、“半个月前生孩子”。

为何强奸如此多发呢?综合史料和研究来看,一种可能是军队的“羞辱文化”。有人指出,在等级制度中,那些权力最小的人,一旦掌握了更低阶层的生杀大权,往往极具虐待狂倾向,而日本士兵到达海外后,他们在严酷的等级制度中积聚的愤怒突然找到了发泄口。二是,强奸在日本的军事文化和迷信中有着根深蒂固的影响,许多人相信强奸处女能够让他们在战争中表现更神勇,有些士兵甚至随时佩戴着用受害者的阴毛做成的护身符,他们相信这些护身符具有使他们免于受伤的魔力。

针对频次最高的几个女性描述词汇,我们进行了趋势分析。结果显示,在记录的一开始,“大学生”被提及很多。这主要是因为日军在攻占南京之初,就大肆在大学里抓女学生,进行侮辱。而后,“大学生”的提及次数减少,“妇女”、“姑娘”等较笼统的词汇被提及最多。这一时期,日军在南京城里四处凌辱女性,无论老幼。而在日记后期,针对少女的暴行减少,这很可能与当时的人们开始着重保护年轻女性有关。但是,受害人中,“某某太太”这样的表述变多。这些已婚妇女,或则在家被强奸,或则在出门的路上被强奸。

此外,针对抢劫事件,我们从文本中提取出了被抢、被盗的物品细节。

结果显示,被日军抢劫的物品主要以钱财为主,并且现金最多。很多受害人是遭受到了入室的搜刮,或者走在路上被搜身截取了钞票和硬币。其中,最多的达到180元,最少的仅5角钱。尤其到后期,日军的搜刮几乎是“来者不拒”,无论价值几何一律抢走。

与此同时,日军还经常抢劫衣服、被褥等必需品,以及手电筒、手套、自来水笔、手套、书、香烟等各种各样的小日用品。在比较少数的例子里,日军抢走的是大件物品及贵价物品,如自行车、汽车、钢琴、相机等。

(三)与谁相关?

“仁慈的上帝,请您保佑所有的人免遭灾难,也请您保佑所有像我们这样已经身陷灾难中的人!我丝毫不后悔留了下来,因为我的存在拯救了许多人的性命。但尽管如此,我仍然感到极端的难受!” ——《拉贝日记》

在《日本士兵在南京安全区的暴行》中,总共出现了65位不同的叙述人。其中,叙述记录最多的分别是菲奇(23条)、贝茨(21条)和威尔逊(17条)。他们分别是美国基督教南京青年会牧师(又名费吴生)、金陵大学历史系教授(美国博士、原南京安全区国际委员会委员)和南京鼓楼医院的一名外科医生(出生于南京,父亲曾为金陵中学校长,哈佛大学求学后回到南京)。

从左侧的文字云中可以看到,拉贝的记录中,绝大部分信源都来自于留在南京的外国人。事实上,在南京大屠杀中,除拉贝外,还有23名外国人死守南京,例如美国长老会牧师米尔斯、金陵大学社会学教授斯迈思、农艺学教授里格斯、美国圣公会南京德胜教堂牧师约翰·马吉、金陵大学鼓楼医院美籍代院长特里默、德国礼和洋行工程师克勒格尔、金陵女子文理学院教导处主任明妮·魏特琳等。

当然,还有少量来自于中国人,比如难民收容所的所长、基督教青年会行政秘书处工作人员、门房等等。

由于这些人是暴行的见证者和口述者,我们将其与暴行的受害者进行了区分。排除“叙述人”后,基于所有“亲历者”的共现关系,我们首先对高频的共现关系进行了可视化。

这些共现关系都在我们的数据集里出现了2次及以上。 如下图所示,圆点的大小表示该人物出现的频次。连线的粗细表示这对关系出现的次数。比如,“妇女”和“日本士兵”的共现次数非常多,因此连线很粗。此外,节点的颜色表示该人物的国籍,红色代表中国人,黄色代表日本人,黑色代表西方人。

高频人物共现关系

中国人 日本人 西方人

*注:你可以点击下方的按钮,切换可视化的布局方式

此外,针对所有的人物,我们也制作了一个更加详细的人物共现图谱,效果如下图所示。所有的人物被组织到了一个网络上,如果两个人物曾经在一条记录中同时出现(即,共现),则在它们之间生成连线。同样,连线的宽度代表共现的次数,节点的大小表示出现频次,节点的颜色代表国籍。

整个网络几乎完全围绕“日本士兵”这一节点组织起来。巨大部分关系都是“一对一”的(距离“日本士兵”较近的、如蒲公英形状的众多节点),即事件发生在日本士兵与某一个人之间。还有一些关系相对复杂,可能发生在“日本士兵”与多个人之间,也可能发生在日本人、中国人、西方人之间。

你也可以拖动这个网络,或者高亮其中的一些节点、连线,查看具体的信息。比如,我们可以看到“日本士兵”和“妇女”之间总共有90条共现记录,且主导的事件类型是“强奸”。

所有人物在文本中的共现关系

中国人 日本人 西方人

*注:你可以将鼠标移动到节点/边上,查看详细信息

(四)位于何处?

“我们委员会总共管理有25个难民收容所,约7万名难民,其中的5万人必须要靠我们的救济过日子,因为他们已经一无所有了。您可能很难想象出这里的情形。攻占南京前,日本人对南京进行了数月之久的狂轰滥炸,但是,这同占领城市后日军造成的苦难是无法相提并论的。我们自己也感到不可理解,我们怎么能安稳地活到今天。” ——《拉贝日记》

据考证,早在1937年10月,南京安全区由金陵大学的外籍教授策划建立,后来拉贝借鉴上海做法于11月22日成立南京国际安全区委员会,在市中心划定3.86平方公里的国际安全区,建立20多个难民收容所,保护因战争而流离失所的南京市民。12月8日,安全区委员会发布《告南京市民书》,呼吁市民进入安全区躲避战祸,南京国际安全区向难民开放。据统计,先后共有20多万难民进入安全区避难,其中大约5万难民在收容所被安置。

从位置来看,南京安全区位于南京市区西部,总面积为8.6平方公里。据《论南京国际安全区的成立》中分析,南京安全区选取位置其实经过了慎重的考虑。其一,安全区位于市区的西部,距交战区域较远。其二,安全区中居住了许多政府高官以及有显赫人士。这些人大多随政府西迁而撤离。空置住宅较多便于安置难民。其三,安全区内外国使馆林立,包括日本大使馆在内的许多国家使馆都设于此。且安全区内外国财产也较为集中,比如金陵大学、金陵女子文理学院、金陵神学院、鼓楼医院、中英文化协会等。这些外国财产的存在,不仅使日军在轰炸和炮击时有所收敛,而且国际委员会也能有效保护这些财产安全。其四,在安全区内,中国军事设施较少,以保证安全区的“非军事化”。

但即便在拉贝等国际友人经过重重考虑,克服各种困难,得以建立南京安全区,但这并不意味着安全区就与安全挂钩,难民营也并不能完全庇护难民。

其一,安全区里的难民营存在,既保护了大批难民避免被屠杀的命运,但也成为日军暴行时的“靶子”,即存在“二律背反”现象。

从下方的统计地图上看,多个难民营经历暴行数量更多,比如圣经师资培训学校难民收容所有11条记录,金陵女子文理学院难民收容所有8条记录,小桃园难民收容所、鼓楼西难民收容所有7条记录,均显著高于其他地点的记录。究其原因,一是难民所里一般有负责人,且经常被管理者视察,故目睹暴行后即被记录;二是难民所的成立,也为日军提供了实施暴行的“靶子”。

比如设置在金陵女子文理学院的难民收容所,里面的难民几乎全是妇女和儿童,成为日军找寻强奸对象的主要处所,记录的暴行中6起均与“强奸”有关。这一点在金陵文理学院美籍教授魏特琳的日记中也得到印证,在1937年12月16日的日记中也记录到这样的暴行:“今天世上所有的罪行都可以在这座城市(南京)里找到。昨晚30名女学生被从语言学校抓走,今天我听到了数十起有关昨夜被抓走女子的悲惨遭遇——其中一位女孩仅12岁。” 再比如圣经师资训练学校难民收容所,据委员会检查得知,有难民3400人,属于较大的难民营之一,常常受到日本士兵的抢劫和骚扰,70%妇女被强奸过。从记录的暴行来看,有9起事件与“强奸”、“找姑娘”有关。而司法部难民收容所、最高法院难民所里,大部分难民被捆绑拖走枪杀,剩余的人也被驱赶出,成为安全区内的集体屠杀事件代表,两个难民营亦被认为是“失败的难民营”。



事件的地理分布

事件发生在难民营 事件发生在其他地点
点击地图上的地点查看拉贝日记:

其二,即便同为“难民营”,其生存条件也显著不同,死神面前并不平等。

因受到欧美人士庇护、救助程度不同,难民的居住环境、食物结构、个人际遇也有很大差别。 比如,小桃园难民所,也就是拉贝的家,收容所难民602人,每天收到3袋大米,无偿地分配给全体难民,难民所得大米的份额明显比别的收容所多,唯一的问题是居住空间狭小。从记录的暴行来看,6条记录都显示日军行为遭到有效阻止,并未发生较大伤害。只有1条显示有妇女遭到强奸,且生命垂危,但这条记录的地点并未发生在小桃园内部,而是小后院后面。 再来看金陵大学蚕厂(蚕桑系)难民收容所,有难民3304人,每天收到4-8袋大米,每2人每天可以得到1升米,大部分米是由难民购买的,且难民们普遍抱怨大米的分配不够公平。从暴行记录来看,全部记录都显示日军暴行得以完成,有妇女遭到强奸,有男性难民被抓走。 再比如司法学校难民收容所,有难民528人,每天收到3袋大米,绝大多数人可免费得到大米。每天约有30人去为日本人干活,因此收容所享受到日本军事司令部的特别庇护。我们的文本中也未从发现有关该难民收容所的记录。

其三,相关暴力事件随时间变化呈一定规律。首先在安全区内部,后来事件逐渐减少,再后来蔓延在安全区外部。

据资料显示,日军方面自始至终并未真正承认安全区的存在。1937年11月22日,国际委员会借助三方力量,希望将设立南京安全区的电报转送日本方面。但直到12月2日,日方方有表态,“否决建立安全区的申请”,但表示,“只要与日本必要的军事措施不相冲突,日本政府将努力尊重此区域。”此后数封电报都显示,日军对安全区的态度较为模棱两可。其忌惮外国人士背后的政府力量,又认为安全区可能成为中国军队的据点,并以此作为部分借口,为安全区里的暴行找到依据。



地理分布随时间的变化

事件发生在难民营 事件发生在其他地点

*注:你可以点击右侧的“播放动画”按钮,查看事件随事件的变化,或“停止动画”,以探索某日的具体事件

0

通过这一可视化我们可以发现,在前期,拉贝记录的暴行主要发生在安全区内部。同时我们可以注意到,即便是专门为保护难民而建立的难民营(图上的白色点)也不能幸免。到1月之后,暴行的记载逐渐减少。1月末,随着日军不断逼迫解散安全区,拉贝记录的暴行又开始大量增加,并且明显地蔓延到了安全区以外——大量难民在回家途中或原本自己的居所中,再次经历日军的暴行。这一点从后期记录的事件来源也可以看出,很大部分暴行记录来自于再次回到安全区平民的口述。不少居民在回家路上或到家后,遭受到日军蹂躏,不得以又回到安全区,而尚未离开的居民则请求“不要让他们离开”,一些妇女表示,“与其我们回家被人杀死,还不如留在这里,等到2月4日日本人来驱赶我们,被他们杀死在难民收容所好了。”可见,尽管算不上绝对安全,南京安全区却是战时平民心中值得托付和依赖的容身之所。在那个山河破碎的时代,难民们的命运如雨打浮萍,所求不过苟全性命,一张草席,一碗米粥。

1938年2月18日,在日本当局的干涉下,安全区委员会更名国际救济委员会,并宣告解散。5月,安全区里的难民营完全关闭。安全区解除后,不少有关南京大屠杀的资料或照片,也纷纷传回国际社会,在巨大的社会舆论谴责下,日军的残暴行为逐渐收敛至结束。

让人叹息的是,以拉贝为代表的南京安全区国际委员会成员,既是难民的保护者,也是暴行的受害人。一方面,他们鼓励着一批又一批难民:“中国没有亡,中国不会亡,日本一定会失败”、“你不用佩戴太阳旗,你是中国人,你们的国家没有亡!你要记住是哪年哪月戴过这个东西的,你永远不要忘记!”但另一方面,这当中大部分的人结局却并不美满。

拉贝,既因为提交南京大屠杀相关资料被盖世太保审问,又因为纳粹身份在战后被诉讼,最终在饥寒和贫穷中因中风去世。

威尔逊,付出了健康的代价。在安全区时,手术消耗了他白天的大部分精力,晚上日兵又会打扰他休息,他不时被从家里叫出来,去阻止正在发生的强暴事件。1940年,威尔逊突然发作癫痫且精神崩溃,此后长期遭受癫痫和噩梦折磨,还出现早上视力模糊的麻烦。

魏特琳, 付出了生命的代价。1940年魏特琳因精神失常而被送往美国接受电击治疗。在离开南京一年后,魏特琳在家中用胶带封住门窗的缝隙,打开煤气自杀。

费奇,遭受极大的精神创伤,以致当他就这一主题进行演讲时,常常会突然完全失忆。

不同于和平年代人口的自然流动,战时人类命运更加身不由己。安全区虽然并不绝对安全,但已然能减缓日军杀戮机器的运转。以拉贝先生为代表的国际人道主义精神,值得被历史永远铭记。

参考文献:

约翰·拉贝,《拉贝日记》,刘海宁等译,江苏人民出版社.

张纯如,《南京浩劫》,杨夏鸣译,东方出版社.

朱天乐,朱成山.南京安全区难民生存的真相——兼论南京难民经历“法益侵害”和“人道救援”的双重际遇[J].民国档案,2020(04):119-128.

张生.死神面前的“不平等”——南京大屠杀期间国际安全区中国难民内部分层[J].西南大学学报(社会科学版),2016,42(06):169-174.

张连红.南京大屠杀时期的日军当局与南京安全区[J].近代史研究,2001(03):227-248.

王卫星.论南京国际安全区的成立[J].民国档案,2005(04):103-110.

朱成山,考证南京难民收容所,http://neverforget.sina.com.cn/pl/2005-08-02/22161028.html

孙宅巍,南京大屠杀期间的难民收容所研究,http://www.js-skl.org.cn/uploads/Files/2017-09/14/1-1505358201-135.pdf

维基百科,南京安全区,https://zh.wikipedia.org/wiki/南京安全区

维基百科,南京大屠杀期间难民收容所列表,https://zh.wikipedia.org/wiki/南京大屠杀期间难民收容所列表

维基百科,拉贝日记,https://zh.wikipedia.org/wiki/拉贝日记

中新网,拉贝的1937年:家中最多挤入602个中国难民,http://www.chinanews.com/cul/2012/12-14/4409016.shtml

电影《拉贝日记》,https://movie.douban.com/subject/2294565/