English
当前您的位置: 当前位置: 首页 > 新闻动态 > 正文

我院蒋智威老师课题组在序列标注技术研究上取得新进展

发布日期:2024-04-11 浏览量:

我院蒋智威老师课题组在序列标注技术研究方面取得新进展:提出一种面向少样本场景的序列标注技术,该技术可以被广泛地应用于命名实体识别和槽位填充等序列标注任务中。

传统的序列标注方法通常是监督方法,需要大量带标签的数据进行训练。然而,在一些真实场景中,获取带标签数据是费时费力且昂贵的,这限制了传统序列标注方法在一些真实场景中的应用。少样本场景下的序列标注可以缓解对带标签数据的需求问题,旨在仅基于少量带标签样本来识别新类别。现有方法主要通过设计基于度量学习的词元级或跨度级标注模型来解决数据稀缺问题。然而,这些方法仅在单一粒度(即词元级或跨度级)上进行训练,并具有相应粒度的一些缺点。针对这些问题,蒋智威老师课题组在研究工作中考虑统一词元级或跨度级监督信息,并提出一种用于少样本序列标记的一致对偶自适应原型(CDAP)网络。CDAP包含词元级网络和跨度级网络,共同在不同粒度上进行训练。为了调整两个网络的输出,该工作进一步提出一种一致损失,使两个网络能够相互学习。此外,在推断阶段,该工作还设计了一种一致贪婪推断算法,首先调整预测概率,然后贪婪地选择具有最大概率的非重叠跨度。大量实验表明,该工作所提出的模型在三个基准数据集上取得了新的最先进结果。

该研究工作相关成果《Unifying Token- and Span-level Supervisions for Few-shot Sequence Labeling》已在信息检索领域顶级国际期刊 ACM Transactions on Information Systems(TOIS2024, CCF-A类期刊)上发表。欢迎对该研究感兴趣的同学和学术同行来信交流:jzw@nju.edu.cn

苏州校区

地址:苏州市太湖大道 1520 号

邮编:215163    邮箱:ise@nju.edu.cn

版权所有:南京大学智能软件与工程学院Copyright © All Rights Reserverd

网站制作:南京大学智能软件与工程学院