1. EMNLP 2024 中國團隊獲兩篇最佳論文,北大校友斬獲三篇傑出論文獎!
EMNLP 2024 中國團隊獲兩篇最佳論文,北大校友斬獲三篇傑出論文獎
在今年的EMNLP 2024會議上,中國團隊及華人學者表現出色,共獲得了兩篇最佳論文獎,同時北大校友Nanyun Peng更是斬獲了三篇傑出論文獎,彰顯了中國在自然語言處理領域的強勁實力。
一、最佳論文獎
本次EMNLP 2024共評選出5篇最佳論文,其中兩篇由中國團隊完成,分別是:
《Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method》
完成團隊:由中國科學院大學和中科院計算所團隊完成,郭嘉豐帶領。
研究內容:文章提出了一種基於散度的校準方法,用於預訓練數據檢測。該方法通過計算token概率分布與token頻率分布之間的交叉熵(散度)來獲得檢測得分,並開發了中文基準PatentMIA,用於評估方法在中文文本上的性能。實驗結果表明,新方法在英文基準和PatentMIA上均優於現有方法。
圖片展示:
論文鏈接:點擊此處查看
二、傑出論文獎
本次傑出論文獎共有20篇論文上榜,其中有超過半數的華人參與,北大校友Nanyun Peng更是斬獲了三篇傑出論文獎,分別是:
《Learning to Retrieve Iteratively for In-Context Learning》
研究內容:提出了一種創造性的方法,將in-context learning示例的選擇建模為馬爾可夫決策過程。
論文鏈接:點擊此處查看
《Measuring Psychological Depth in Language Models》
研究內容:提供了一套以敘事理論為基礎的有用指標,用於評估LLM的敘事寫作。
論文鏈接:點擊此處查看
《Words Worth a Thousand Pictures: Measuring and Understanding Perceptual Variability in Text-to-Image Generation》
研究內容:為文本到圖像的生成提出了一種經人工校準的可變性測量方法,並對實際影響進行了全面的學科間分析和討論。
論文鏈接:點擊此處查看
三、Nanyun Peng簡介
Nanyun Peng在自然語言處理領域有著卓越的成就,其學術背景如下:
四、會議概況
EMNLP會議作為計算語言學領域的頂級會議,於今年11月12日至11月16日在美國邁阿密盛大開幕。會議匯集了世界領先的研究人員、學者和從業者,分享了自然語言處理和計算語言學領域的最新研究和進步技術。2024年EMNLP大會共收錄了2455篇主會議論文和523篇研討會論文,總論文數量較2023年增加了5%,是EMNLP迄今為止收錄論文數量最多的會議之一。
中國團隊及華人學者在EMNLP 2024上的出色表現,不僅展示了他們在自然語言處理領域的深厚底蘊和創新能力,也為中國在國際學術舞台上贏得了更多的榮譽和尊重。