您当前的位置: 首页 > >  新闻动态 > >  正文

我中心6篇论文被权威会议录用

发布时间:2024-12-22   点击数:

近日,计算机国际声学、语音与信号处理会议ICASSP 2025公布录用结果,我中心6篇论文被录用。ICASSP会议全称为International Conference on Acoustics, Speech and Signal Processing,在CCF学术推荐列表中被认定为B类会议。

录用论文的相关信息如下:


论文标题: PD-SDF: Dynamic Surface Reconstruction Based on Plane  Decomposition for Single View RGB-D Videos

录用类别: ICASSP2025

作者:李金文,谢卫星,姚俊峰,吴少琪,彭友鸿,葛梦园,董潇

完成单位:厦门大学,北师港浸大

   由于高度不适定和欠约束的性质,从单视图视频动态场景的表面重建是一项具有挑战性的任务。现有的单视图重建方法存在严重的质量问题,例如表面变形和网格粘附。在本文中,我们提出了一种高效的动态表示网络 PD-SDF,它由 4D 运动场和 3D 几何场组成。基于平面分解的运动和几何的明确分离保证了跨帧的网格一致性。具体来说,为了解决网格粘附问题,我们设计了一种深度引导采样策略,重点优化物体表面附近的 SDF 场。由于几何线索不足,我们设计了各种正则化策略来约束场景几何的平滑度和拓扑正确性。大量的实验表明,我们的方法在外观和几何重建方面都优于现有方法。


论文标题: LDG: Lightweight Deformable 3D Gaussians for Single-View Dynamic Scene Reconstruction

录用类别: ICASSP2025

作者: 彭友鸿,谢卫星,李金文,吴少琪,汪泽丰,胡兵兵,姚俊峰

完成单位:厦门大学

   最近的可变形三维高斯方法实现了高质量的重建和实时渲染。然而,它们需要多视角信息,并且不适用于从手机捕获的单视角动态场景。此外,变形MLP的高维隐藏层以及过多的高斯基元和属性带来了显著的存储压力,极大地限制了它们的实际应用。为了解决这些问题,我们提出了一种新颖的轻量级可变形三维高斯师生框架。具体来说,我们采用针对单视角场景设计的初始化策略来初始化高斯基元,然后利用颜色和深度信息优化教师模型。对于训练好的教师模型,我们进行变形MLP的蒸馏、高斯基元和高斯属性的剪枝,最终获得一个存储需求低且高效的学生模型。公开基准实验证明了我们框架的有效性,显示了超过4倍的压缩率,同时保持了令人满意的渲染质量。


论文标题: LP-Gaussians: Learnable Parametric Gaussian Splatting for Efficient Dynamic Reconstruction of Single-View Scenes

录用类别: ICASSP2025

作者: 吴少琪,谢卫星,彭友鸿,李金文,姚嘉伟,姚俊峰

完成单位:厦门大学

随着短视频平台的普及,单视角视频的数量显著增加。现有的基于NeRF(神经辐射场)的方法能够在单视角设置下重建动态场景,但渲染速度慢和渲染质量低限制了其实际应用。为了解决这些问题,我们提出了一种基于三维高斯散点(3D Gaussian Splatting)的快速单视角场景重建框架。我们的方法使用具有深度先验的点云作为高斯初始化,并引入可学习的参数化函数来建模高斯的时间依赖性形变。通过对高斯形变的显式建模,显著减少了训练和渲染时间。此外,为了提高复杂区域的渲染质量,我们采用了一种自适应采样策略来增加高斯的密度。针对单视角视频中的遮挡问题,我们设计了一种平滑损失函数以恢复遮挡区域的颜色。实验结果表明,我们的方法显著减少了训练时间,提高了渲染质量,并加快了渲染速度。


论文题目:Emotional Knowledge Self-Distillation in Dialogue

录用类别:ICASSP 2025

作者:简忠权, 汪彦丞, 吴卫超, 姚俊峰, 王美红*, 吴清强*

完成单位:厦门大学, 厦门大学马来西亚分校, 中国矿业大学

在对话中识别情绪对于有效的人机交互至关重要,但在自然语言处理(NLP)中仍然是一项具有挑战性的任务。之前关于对话中情绪识别(ERC)的研究主要集中在语境特征上,而忽略了情绪特征在情绪识别中的重要性。为了弥补这一差距,本文专注于情感特征在ERC中的作用,并提出了一种新的方法,称为情感知识自蒸馏(EmoKSD),以提高模型的情感敏感性。在EmoKSD中,话语用隐式的 mask 标记来表示传达的情绪,允许将情感知识从显式情感词提炼到隐式 mask 标记上,从而增强模型在对话中感知微妙情绪的能力。通过使用提出的粗粒度话语级蒸馏和细粒度单词级蒸馏技术对两个公共ERC数据集(即IEMOCAP和MELD)进行彻底评估,EmoKSD表现出与现有方法相比更好的性能,突出了ERC中情感特征的重要性。


论文题目:Curriculum Contrastive Learning for Aspect-based Sentiment Analysis

录用类别:ICASSP 2025

作者:简忠权+, 吴岱航+, 曾祥健, 姚俊峰, 王美红*, 吴清强*

完成单位:厦门大学, 玛希隆大学

预训练语言模型(PLM)在各种自然语言处理(NLP)任务中取得了显著的性能,包括基于属性的情绪分析(ABSA)。因此,提出了许多基于PLM的ABSA模型,主要侧重于模型模块设计,以利用属性和上下文之间的固有联系。然而,这些模型推动性能改进的核心因素--PLM强大的语义理解能力--尚未得到充分释放,这引发了如何进一步释放其下游任务潜力的问题。为此,我们提出了一种名为CCL的新颖训练策略,该策略整合了课程学习(CurL)和对比学习(ConL)的优势,以促进对强特征表示的学习。对于ABSA任务,我们使用属性相似性来开发CurL策略,将具有相似属性的样本分组为批次。这允许ConL通过在每个批次中提供相关样本来学习更强大的表示。CCL的优越性通过对两个公共ABSA数据集的广泛实验得到证明,消融研究验证了结合CurL和ConL在增强属性理解的有效性。


论文题目:Enhancing Information Extraction with METORIE: A Metaphor and Trap-Based Dataset for Cross-Domain Fine-Tuning

录用类别:ICASSP 2025

作者:潘正源, 彭怡莲, 简忠权, 陈颜皓, 邱文涛, 马浩男, 姚俊峰, 王美红*, 吴清强*

完成单位:厦门大学, 中国科学院大学

在信息提取任务中,提升大语言模型(LLMs)的推理能力对跨领域应用至关重要。然而,相比于目前的模型,现有LLMs在处理复杂语境、隐喻表达及逻辑陷阱时仍存在明显局限。为弥补这一不足,本文提出了一种新型数据集--METORIE,旨在通过设计隐喻和逻辑陷阱优化LLMs的推理路径和表达解读能力。METORIE数据集灵感来源于“脑筋急转弯”,采用多维分析方法对题目进行解构,涵盖答案解析、逻辑陷阱识别、隐含关系及推理路径等多个层面。细致的标注与分析表明,适度复杂的隐喻能够显著增强模型的推理能力,而过于复杂则可能导致推理能力过载。实验结果显示,与传统IE数据集相比,经过METORIE微调的LLMs在信息提取任务中表现出显著提升。此外,METORIE数据集仅需结合少量垂直领域微调数据,即可在目前相同参数量的LLMs下达到甚至超越大规模训练数据集的效果,进一步凸显了隐喻理解和逻辑推理在提升LLMs跨领域适应性和性能方面的重要性。


厦门大学 厦门大学信息科学学院 厦门大学软件工程系 厦门大学信息科学系