中国文物信息网
中国文物报社 主办
  • 综合新闻
  • 图片新闻
  • 行业动态
  • 展览资讯
  • 公告
  • 工作研究
  • 文物考古
  • 博物馆
  • 遗产保护
  • 收藏鉴赏
  • 文博副刊
  • 文博出版传媒
  • 文博技术产品
  • 法律法规
  • 中国世界遗产
  • 历史文化名城
  • 历史文化名镇(村)
  • 全国重点文物保护单位
  • 中国博物馆名录
  • 十大陈列展览
  • 十大考古新发现
  • 先进集体与先进工作者
  • 十佳图书
  • 十佳文博技术产品
  • 2017年专题
  • 2016年专题
  • 2015年专题
  • 您所在的位置:主页 > 专栏专刊 > 工作研究

    工作研究

    藏品系统相关推荐功能的实现思路探讨

    发布时间:2019-04-09陈 庆

    藏品是博物馆的物质核心,博物馆基本职能,从征集、保护,到研究、展示,进而到全方位的宣传、教育,都离不开藏品。可以说,藏品管理工作是博物馆一切工作的基石。传统的藏品管理系统是面向库房管理功能的,只有库房人员有权访问,对于研究、策展、宣传、教育等业务的支撑不够。

    单从藏品管理系统面向馆内研究、策展等部门开放部分权限这个思路,并无益于解决问题。因为藏品系统从建立之初,就是以文物普查为标准,以摸清博物馆家底为初衷,本身就不是为了方便使用者理解藏品的关系。博物馆内部使用馆藏资源,以展览策划功能为例,通常采用以下两种方式:一是藏品管理和展览策划分属不同部门,策划人员根据需要与藏品管理人员沟通;二是藏品管理人员本身就是策展人,除了做好库房藏品的保管、研究,还要负责所管藏品的宣传策划。第一种方式沟通效率通常不高,第二种方式看似更好,但是对藏品管理人员要求很高,且会分散藏品保管的精力,在展出藏品涉及多个库房时也会面临同样的沟通问题。

    要摆脱上述两种方式带来的障碍,除了培养工作人员的综合素质,在藏品管理系统的基础上,为保管部门以外其他人员增设一些辅助系统,能更好地满足他们的工作需要。

    除了面向馆内人员,这样的功能对于不了解博物馆的观众而言更加重要。通过关联推荐可以使游览更有目的性,不仅能加深观众对具体藏品的理解,还能通过藏品间的知识关联,使观众了解藏品背后的知识,形成知识框架。

    在推进安徽博物院新版网站建设服务项目的过程中,我们要求开发公司在藏品栏目增加相关推荐功能,并建议了一些推荐依据。后来限于项目时间和问题规模,功能没有全部实现,在此笔者把实现推荐功能的思路与面临困难分别加以探讨。

    自动与手动

    藏品栏目的基础数据来源于藏品管理系统,庞大的数据量决定了需要通过设定的规则自动生成推荐,而不能手动关联推荐;但是取自藏品管理系统的数据只是进一步加工的原料,数据间的联系很多就蕴藏在表名、字段,甚至字段中的某些关键字中,是需要加以提炼的,这就是我们设定推荐规则要遵循的依据。

    多标签聚类

    数据库在基础字段的基础上,可增加一个多标签字段。这样能保持数据库表的一致性。前端的藏品内容页显示相关的标签,通过点击各个标签,打开从属于该标签的藏品列表页。

    使用标签容易,但不同藏品需要生成的标签的方式差异很大。比如青铜器,基础字段有年代、质地等,通常也更容易靠这些基础字段聚类,但蕴含最大信息量的字段,如名称,反而容易被忽略。名称不能直接作为标签,但可以从名称提取标签。比如说器型,如鼎、鬲、爵等,都是名称的最后一个字,可以直接读取出器型标签。再比如纹饰,如兽面纹、夔纹、蟠虺纹等,虽不能直接读取,但可以先建一个纹饰的集合,再逐条记录在集合中依次比对,生成纹饰标签。需要注意的是,有些时候不同的文字表述实际指向的是同一个属性,比如说凤鸟纹在有的藏品上叫鸟纹,回纹有的也叫云雷纹。还有些属性可以细分,如果子属性本身很有代表性,也可以作为标签,比如龙纹就有爬行龙纹、卷体龙纹、交体龙纹等。

    再比如瓷器,名称中一样能提取器型标签,有碗、瓶、壶等,还可能包含釉质信息如:青釉、粉彩、珐琅彩等,此外还有窑口信息,窑口除了定、汝、官、哥、钧外,可以根据馆藏情况按需增加到集合,不用把全国的窑口全部包括在内,以提高生成标签的效率。

    书画藏品的相关推荐跟前述的青铜器、瓷器不同,名称字段后缀中的堂幅、卷轴并无意义,提取出如油画、水墨、工笔意义也不大。可以做文章的可以是艺术家姓名,用来根据流派、师承、人物关系等生成多个标签,如新安画派、吴门四家等,还能借助可视化技术生成关系图谱,让前端表现更加生动。

    以上只是博物馆馆藏的一个子集,要想涵盖所有藏品分类,就需要深入考虑每个子类的情况。佛像、碑刻、文房四宝,不同的藏品类型,适合采用的标签也就不同,笔者总结的选取标准有三条:一是有普遍性,标签对应的不是单个藏品,而是一组性状;二是有意义:哪些标签能承载更多用于减少不确定的信息,即有利于信息减熵;三是可获得性,标签再有意义,如果不能从现有的数据中获得,标签和藏品就无法建立联系。

    相关性度量

    根据前面的标签生成规则,通常一个藏品会形成一组对应标签,在单个藏品的相关文物列表中,需要把相关性最高的展示出来,最简单的做法是按照这一组标签检索出的交集。也可以显示部分标签的对应藏品,设标签数为n,理论上需要检索2n-1次。比如说两个标签l1、l2,就要分别对应非空集合(l1,l2)(l1)(l2)检索3次,以此类推,但频繁查询会给数据库带来很大压力,通常也不必要。

    进而考虑,可以先选一个最重要的标签缩小查询范围,再把余下的不同标签设定一组权重,将查询记录的标签依次与之匹配再计算加权,按照该数值降序排列即可。考虑到藏品信息数量较大,而修改不频繁,为了提高响应速度,可以提前做静态化处理。

    持续改进

    前面介绍了藏品栏目相关推荐功能的实现思路和基本框架。在此基础上,还有很多可改进的空间。

    技术上如相关性度量,目前只是标签的简单匹配,但是不匹配不意味着没有关系。比如说年代,宋与元不同,但是差异度并不如宋和汉的差异大。不同的出土地点可能属于相近的文化圈,不同的技法、不同的画派也可能存在传承关系。这就不能简单匹配,如果要增强相关的精度,标签内就要考虑到赋值,而赋值的依据是需要仔细考量的。

    同样的标签也可能有不同的含义,比如说青铜器器型,同样是鼎,可能有方鼎、圆鼎之别。未来可以借助图形识别,从技术上批量进行区分。

    功能上也有改进空间,比如说前面建立的标签,点击打开列表页可能仍然包含很多藏品。进一步的筛选,则可以利用其他标签进行。通过用户有意识地操作,增减标签,看到有意义的互动效果,可以加深用户对藏品知识的了解。

    在常规的实物展览中一些不容易呈现的藏品,如信笺,也能与前面书画藏品中建立的人物关系相关联,使观众不止看到艺术作品,还能进而了解到艺术家的社会关系和精神世界,拉近观众与藏品的距离。

    再比如,有的藏品,在学术界有研究论文,馆内也可能做过相关讲座,都可以在藏品展示页中给出相关链接。这样有兴趣的观众或研究者就能够获得更专业的藏品知识。

    使用基于标签的推荐功能来厘清藏品关系,是一项基础性的工作,既要了解藏品,也要熟悉应用,需在实践中不断摸索尝试,不是一两次信息化建设就可以完成的。这项工作很有必要,对馆方而言,相关推荐功能可以辅助各部门人员驾驭馆藏文物资源,从而有利于研究、策展、宣传教育等工作的开展。对观众而言,也能帮助其了解藏品知识,亲近优秀传统文化。

    《中国文物报》2019年4月9日第8版

    编辑蔡苧