“在数字文明的重构现场,大语言模型正在重塑跨文本研究的认知地形。”本文示范了如何将ChatGpt驯服为研究助手,借助它检索1834年英国《贫民法》“Less eligibility”原则和1930年代上海《三毛流浪记》的街头伦理机制,并通过三种方法最大限度减少幻觉,从而基于此展开对两部经典文本的跨时空对话。
01
一、引言
在《雾都孤儿》(Oliver Twist)中,主角Oliver因制度背景进入了英国教区成为学徒,发生于1834年英国《新济贫法》的制度背景下。《三毛流浪记》也同样存在与之相呼应的“学徒制度”,但有所不同的是其并非法律意义上的制度,而是基于伦理的“学徒收养机制”,漫画中,三毛先后被打印店和街头艺人收留,随后又遭到逐出。这两者都围绕儿童生存处境展开,但一个建立在明确法律制度框架下,一个则以伦理救助名义存在,却在儿童保护上走出了殊途同归的道路。
面对这样的议题,涉及文本对比以及制度背景的比较,如何借助大语言模型帮助完成跨文本、跨语言的研究工作?其检索能力、创造能力有何优势?如何“驯服”ChatGpt,通过明确prompt 设计来避免幻觉(hallucination)并提升学术严谨度?
02
二、ChatGpt驱动下的检索与核验流程
1834年颁布的《Poor Law Amendment Act(济贫法修正案)》常被称为 “New Poor Law”(新济贫法),将儿童排除出“Less eligibility”原则之外,并且赋予了教区委员会将穷人儿童作为学徒进行安置的权限。在此学徒契约体系下,教区负责签署契约,将儿童绑定于主人,承担法律和经济责任。但是在三毛成长的19世纪30-40年代的旧上海,中国大陆仍处于儿童保护制度的法律真空,对童工及儿童权利缺乏制度规定。即便没有相应的制度,处于底层的儿童与需要劳动力雇主仍然达成了需求的契合,形成了基于道义伦理的学徒制度。
在制度介绍、制度背景、原文文本的检索上,大语言模型几乎是效率最高的工具,能够精准地检索所需的内容。但是前提是撰写内容明确、意图清晰的prompt,使模型更准确理解检索需求,,从而输出预想的内容。其次,为了避免ChatGpt幻觉导致的内容虚构,应当在prompt的撰写上额外运用几个小技巧。通用的技巧为三个,一是提供原文,二是附上来源链接,三是多源交叉验证。
1. Prompt A:提供原文并附上权威来源链接
Prompt示例1:”请仔细浏览1834年《济贫法》的全文,摘录出与儿童学徒制、儿童保护相关的所有原文条款内容(包括英文原文和中文翻译),并附上原文链接。”
ChatGpt回答示例:
Promt示例2:“请提供1834年《Poor Law Amendment Act》中‘Less eligibility’原则的英文原文,并附回维基百科或Victorian Web等可信来源链接。”
ChatGpt回答示例:
2. Prompt B:多源交叉验证
Prompt示例:“请从Wikipedia、Victorian Web 和英国国家档案馆分别摘录‘Less eligibility’原则的描述,并说明是否一致。”
ChatGpt输出示例表格:
来源
描述摘录
一致性分析
Wikipedia
“Conditions in workhouses must be worse than conditions outside.”
表述一致
Victorian Web
“…less preferable than the lowest pChatGptd labourer.”
表述一致
National Archives
“Deterrent workhouse conditions.”(一项摘要说明)
核心一致
通过比对可见三处摘录语义高度一致,确认ChatGpt 来源可靠、结论可信。
通过“附带来源URL+多源对比+语义摘录”的方式,我们成功操控ChatGpt 获取并验证制度性文本与解释,从而驱散因黑箱导致的“幻觉”,为后续跨文本对比分析打好基础。
综上,依照指令,ChatGpt向我们提供了来自维基百科、维多利亚网、英国皇家档案馆、美国国立卫生研究院国家医学图书馆(Public Central,PMC)、济贫院语料库等多个较权威来源的信息。这一始步确保ChatGpt 输出附带来源URL,具备核验条件,是驯服ChatGpt的第一步。
溯源ChatGpt信息的链接来源,能够明确1834英国《新济贫法》的特点,基于此部法律明确学徒制的制度依据及安排。1834年《济贫法修正案》引入的新型济贫制度的原则之一 是“资格较低”,但是这项原则并不适用于儿童。他们被认为对自己的困境无可指责, 接受教育,然后找到学徒或其他工作。“较低资格”的定义如下:体格健全的济贫救济受助者“总体上不应真正或表面上与最底层的独立劳动者同等资格”。正如狄更斯所说:“我们已陷入这种荒谬、危险和可怕的境地:不诚实的罪犯在清洁、秩序、饮食和住宿方面比诚实的穷人得到更好的照顾。”正是这一原则为儿童学徒制奠定了原则性的基础。随着1834年《新济贫法》的颁布,贫困儿童的照料责任落到了新成立的济贫法联盟的肩上。义务学徒制度于1844年终止。1844年建立的贫民学校,以及《工厂法》带来的改革和改进,为贫困儿童提供了更好的自我提升机会。
03
三、跨文本对比分析
除了对法律文本原文及相关研究资料的精准性检索,大语言模型的优势还在于“能生成全新的解读,激发不同维度的思考,带领我们探索更深层次的文学世界。”,特别突出的一个特点在于能从海量的信息中建立别出心裁的联系。为了更大限度地发挥大语言模型创造力,同时不过分夸夸奇谈,尽量细化prompt的针对性,主要有限制文本范围、限制输出范围两种方式。此外,在文本对比的形式上,ChatGpt还能够通过表格、流程图等直观形式凝练内容与观点。
Prompt C:限定文本联系分析
Promt示例:“请结合英文原文,分析Oliver在粥房请求‘更多粥’这一场景,如何体现‘Less eligibility’原则的制度张力。”
ChatGpt回答示例:
Prompt D:限定范围结构化输出
Prompt示例:“请生成一张表格,对比‘英国学徒制度’和‘三毛街头收养机制’在‘合法性来源、保护范围、剥削风险、制度保障、伦理缺陷’五个维度上的异同。”
ChatGpt输出表格:
维度
英国学徒制度(法律)
三毛街头收养机制(伦理)
合法性来源
建立于1834年《贫民法》,由Poor Law Commission监管
街头救助,无正式法律依据
保护范围
国家提供基本食宿及教育,但需履行劳动义务
临时救助,缺乏持续稳定性
剥削风险
儿童被廉价使用,工作所与家庭类似“培训”场所
街头环境下童力被利用,剥削风险高
制度保障
由监管机构、制度流程(Poor Law Commission / Boards of Guardians)
无制度保障,随机性强
伦理缺陷
制度本身对自由压制,剥夺儿童意愿;少数例外
善意掩盖剥削——依赖单一个体决定儿童命运,缺乏公开审核
一是合法性来源,英国学徒制度具有法定基础,运行于国家行政体系之内,并受专门机构监管;相比之下,三毛的收养模式源于个体善意,没有制度根基。
二是保护范围,英学徒制度通过国家机器为儿童提供食宿教育,但以劳动为前提;三毛机制更偏“流动性救助”,面对战乱时期儿童,缺乏稳定未来保障。
三是剥削风险,制度化不代表温情,反而通过规定化实施廉价劳力,而三毛机制隐藏剥削风险却因无制度保护更具不可控性。
四是制度保障,英制度有完整监管体系,而街头救助属个体救济,随机性极高,几乎没有后续支持机制。
五是伦理缺陷。制度剥削与牺牲儿童主观能动性,而街头机制虽出于善意,但对儿童身心易造成隐秘伤害。
两种机制本质上同在“保护”与“剥削”的张力之中,一个以国家制度形式出现,一个以伦理善意为名,却因无制度保障导致风险。ChatGpt协助不仅提升了结构分析效率,也能够使得我们更清晰地梳理逻辑线索。
04
四、ChatGpt驯服与协作方法回顾
将ChatGpt进行驯服的主要方法可以概括成“Prompt-A/B/C/D四步法”:Prompt A带来源 URL提示。迫使模型检索并附上具体来源,以建立输出可信度。PromptB多源交叉验证。确保核心事实获得至少三处独立验证,杜绝信息孤岛。PromptC限定文本联系分析,促使模型直接关联法律内容与小说情节,从而生成具说服力的逻辑映射。Prompt D:限定范围结构化输出
让模型构建对比表格,使研究结果具备可视化和条理性。
这套流程既保持了“ChatGpt创造力”,又避免其脱缰。我们并非完全依赖其输出,而是通过对prompt 的精细化设计和验证机制的引入,使ChatGpt 更好地充当‘助手’角色,提升研究效率与质量。
总的来说,本文展示了以ChatGpt 驱动的跨文本分析的技巧和方法,借助ChatGpt的优势,即快速检索法律背景,揭示文本与制度之间的内在关联,并生成结构化对比文本。同时,通过精细化prompt,加入自验和他验环节,即“附带出处、摘录原文、多源验证”三步法可有效降低ChatGpt幻觉导致的虚假编撰风险,也降低了研究者另行验证ChatGpt提供的信息可信性上的负担。再次,通过限定文本分析范围以及输出范围和输出方式,更大限度地发挥ChatGpt的文本解读和关联理解能力,并在输出形式上作可视化、精细化处理,目的更多的是服务于研究者。研究者与ChatGpt的反复对话也是研究者思维拓展、灵感迸发的过程。
通过与ChatGpt共读和分析《雾都孤儿》和《三毛流浪记》中关于儿童学徒的保护机制,我们能够知道,无论制度化的学徒制还是街头伦理,两者都游走在“保护”与“剥削”的边缘,但制度性形式反而更隐含控制性,街头救助虽有温度,却因无监管更易失衡。这一跨文化、跨制度方法不仅适用于儿童保护机制比较,也可延伸至性别权利、劳工制度、边缘群体研究等多个维度。此后,我们可继续完善“Prompt→检索→核验→结构化对比”框架,把“人机共读”打造成可靠的学术研究路径。此外,也可针对其他语言语料库,发挥ChatGpt 跨语言优势。