1. EMNLP 2024 中国团队获两篇最佳论文,北大校友斩获三篇杰出论文奖!
EMNLP 2024 中国团队获两篇最佳论文,北大校友斩获三篇杰出论文奖
在今年的EMNLP 2024会议上,中国团队及华人学者表现出色,共获得了两篇最佳论文奖,同时北大校友Nanyun Peng更是斩获了三篇杰出论文奖,彰显了中国在自然语言处理领域的强劲实力。
一、最佳论文奖
本次EMNLP 2024共评选出5篇最佳论文,其中两篇由中国团队完成,分别是:
《Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method》
完成团队:由中国科学院大学和中科院计算所团队完成,郭嘉丰带领。
研究内容:文章提出了一种基于散度的校准方法,用于预训练数据检测。该方法通过计算token概率分布与token频率分布之间的交叉熵(散度)来获得检测得分,并开发了中文基准PatentMIA,用于评估方法在中文文本上的性能。实验结果表明,新方法在英文基准和PatentMIA上均优于现有方法。
图片展示:
论文链接:点击此处查看
二、杰出论文奖
本次杰出论文奖共有20篇论文上榜,其中有超过半数的华人参与,北大校友Nanyun Peng更是斩获了三篇杰出论文奖,分别是:
《Learning to Retrieve Iteratively for In-Context Learning》
研究内容:提出了一种创造性的方法,将in-context learning示例的选择建模为马尔可夫决策过程。
论文链接:点击此处查看
《Measuring Psychological Depth in Language Models》
研究内容:提供了一套以叙事理论为基础的有用指标,用于评估LLM的叙事写作。
论文链接:点击此处查看
《Words Worth a Thousand Pictures: Measuring and Understanding Perceptual Variability in Text-to-Image Generation》
研究内容:为文本到图像的生成提出了一种经人工校准的可变性测量方法,并对实际影响进行了全面的学科间分析和讨论。
论文链接:点击此处查看
三、Nanyun Peng简介
Nanyun Peng在自然语言处理领域有着卓越的成就,其学术背景如下:
四、会议概况
EMNLP会议作为计算语言学领域的顶级会议,于今年11月12日至11月16日在美国迈阿密盛大开幕。会议汇集了世界领先的研究人员、学者和从业者,分享了自然语言处理和计算语言学领域的最新研究和进步技术。2024年EMNLP大会共收录了2455篇主会议论文和523篇研讨会论文,总论文数量较2023年增加了5%,是EMNLP迄今为止收录论文数量最多的会议之一。
中国团队及华人学者在EMNLP 2024上的出色表现,不仅展示了他们在自然语言处理领域的深厚底蕴和创新能力,也为中国在国际学术舞台上赢得了更多的荣誉和尊重。