ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI助力古籍重生:数万志愿者与科技共续千年学术传承

时间:2025-12-29 15:58:06来源:互联网编辑:快讯

哈佛燕京图书馆的珍贵古籍近日通过“识典古籍”平台向公众开放,这一举措不仅实现了中西文献资源的深度融合,更让这些沉寂已久的文化瑰宝以数字化形式重回大众视野。平台上线了宋刻《十诵律》、元刻《隋书》、明抄《永乐大典》等稀世典籍的高清影像,同时呈现了齐思和、顾颉刚等学者留下的校勘痕迹与研究路径,为学术研究提供了珍贵的一手资料。

该图书馆以藏量丰富、孤本众多闻名,现藏古籍逾15万册,涵盖宋元明清各代刻本及稿抄本,其中善本数量达4000部,学术价值极高。地方志与丛书是馆藏两大特色:3000余部方志约占中国大陆现存总量的39%,1400余部丛书覆盖了半部《中国丛书综录》。馆内还珍藏有《永乐大典》两卷、毛氏汲古阁抄本及大量明清禁书,均为难得一见的文献珍品。

这场跨越百年的学术对话始于上世纪二十年代的“文献双生”制度。1928年,燕京大学与哈佛燕京图书馆建立特殊藏书机制:凡由学社经费购置的中文文献均一式两份,分别留存燕京与哈佛,双方在藏书建设上形成鲜明分工——燕京侧重西文参考书与西方汉学著作,哈佛则专注宋元善本与地方志收藏。这一制度因战火中断数十年,直到近年通过数字化方式得以延续。

2024年,全国高等院校古籍整理研究工作委员会、字节跳动公益与北大数字人文中心联合发起“我用AI校古籍”行动,将哈佛燕京图书馆7000部珍贵古籍转化为可检索的数字资源。该项目依托AI技术与众包模式,发动三万四千名高校师生与社会志愿者参与OCR识别与校勘,累计整理古籍一万九千余部,修订文本超十三亿字。这种“智能+众包”的模式大幅降低了古籍整理门槛,使传统需数月完成的工作缩短至数周。

平台技术负责人介绍,当前文字识别准确率已超96%,自动标点准确率达94%,命名实体识别接近98%。AI会标记疑难字供志愿者核对,形成“机器初校-大众复核-专家审定”的三级流程。北京大学数字人文中心副主任杨浩比喻道:“传统手工作坊变成了流水线工厂,学术资源整理效率呈指数级提升。”

这场数字化工程背后,是洪业先生上世纪三十年代开创的学术传统。1928年,洪业在北平创立“引得编纂处”,参照哈佛图书馆工作流程制定严苛编纂制度,强调“编纂非抄录,而是整理学的训练”。他创立的“中国字庋撷法”将西方信息科学理念与中国古典文献学结合,主持编纂的《引得丛刊》涵盖经史子集64种81册,成为20世纪上半叶最重要的学术工具书系列。

洪业提出的“索引是古籍之钥”理念,在当代数字平台得到完美诠释。现年58岁的机场调度员九衛白天从事安全调度工作,夜晚则化身“校书官”,在古籍世界中寻找错漏。他发现某些古籍错误经代代传抄已成定式,能纠正这些积弊让他倍感成就。像九衛这样的普通参与者,在完成多项任务后可加入“进阶组”与专家探讨学术问题,真正实现了“学术平民化”。

平台设计的激励机制进一步激发公众参与热情:志愿者可根据贡献度领取不同等级奖励,最高荣誉“金典典”奖杯需投入1000小时以上校勘工作,目前已有50人达成此成就。每位参与者的名字都会永久留存于平台,这种将学术贡献可视化的设计,使严谨的古籍整理工作转化为可参与的文化活动。

从洪业时代十余人伏案抄录,到如今数万志愿者与AI协同工作,学术传承的形式虽变,内核始终如一。那些泛黄的卡片化作数据库里的索引,残缺的典籍在众人手中重焕生机。当华东师范大学博士生刘帅用一个月整理出五千万字古籍时,他感受到的不仅是效率飞跃,更是学术血脉的延续——这种延续不依赖仪式与喧哗,而是通过系统可证与众人协作,在人与古籍的对话中静静流淌。

更多热门内容
央视总台《直通未来年度盛典》:智能装备成果亮相 勾勒产业新蓝图
作为聚焦未来产业的权威盛会,盛典以“未来的产业 产业的未来”为主题,将镜头对准智能装备领域的创新突破,一批国内领军企业携人形机器人、智能灵巧手等核心成果集中亮相,通过技术展演与落地案例分享,生动勾勒出中国智能…

2025-12-29

俄罗斯2025年度热词出炉:“胜利”领衔 “拉布布”成可爱文化新象征
新华社莫斯科12月28日电(记者栾海)2025年即将结束,俄罗斯多个机构和团体分别推出本国年度热词榜单,上榜热词有“胜利”“神经网络”“人工智能”“焦虑”“Z世代”……中国潮玩公司泡泡玛特的热门IP“拉布布”…

2025-12-29

联想数字化研发案例新洞察:智能体导航,开启高效决策新征程
在联想内部,数字化研发平台的核心是一个名为 “联想乐享”的企业超级智能体。您可以提供自身企业的粗略信息(如规模、行业、核心痛点),乐享能据此对筛选出的案例进行初步的匹配度分析,帮助您判断哪些案例的经验最值得优…

2025-12-29

中国科大微波纠错新突破:量子计算规模化发展再进一步挑战谷歌
2022年,潘建伟团队通过实现距离为3的表面码逻辑量子比特验证了原理可行性;2023年谷歌将距离提升至5;今年初谷歌"柳树"处理器更实现距离为7的表面码逻辑量子比特,证明增加量子比特可指数级降低错误率。在最新…

2025-12-29

融和科技发布L4级RonAgent,助力中小企业管理智能化“触手可及”
融和科技董事长廖继全表示,公司的愿景是将以往仅存于大型企业总部、依赖庞大专家团队的业务分析、风险管控和战略决策能力,无损地下沉给每一家中小企业,使其能够平等拥有与世界500强同等级别的智能管理“外脑”。 行…

2025-12-29

小米母系小迭代旗舰新机来袭:6.8-6.9寸极窄直屏 骁龙8E5配潜望镜
IT之家 12 月 29 日消息,博主 @数码闲聊站 今日爆料了一款母系小迭代旗舰新机: 主打 6.8-6.9 极窄四等边大直屏,骁龙 8E5平台,有潜望镜,暂定 H1~ 该博主还称这款新机不算 Air,…

2025-12-29

小米三喜临门,荣耀一加新机将至,vivo年末低调蓄力待发
可以给iPhone充两次电了,这手机拿在手里绝对没有续航焦虑,关键是它的出现会让充电宝行业……因为后续发布的类似定位的机型清一色的超大电池,这还需要充电宝吗?其实也可以理解,vivo现在的重点在iQOO Z1…

2025-12-29