NEU-ModelBest数据智能联合实验室

实验室简介

NEU-ModelBest数据智能联合实验室隶属东北大学计算机科学与工程学院计算机科学系，由刘正皓副教授、于戈教授和谷峪教授共同指导。实验室致力于信息检索与大语言模型相关研究，承担多项国家级、省部级项目，已在 NeurIPS、ICLR、ACL、EMNLP、NAACL、SIGIR、KDD、WebConf、ICASSP 等国内外顶级会议及期刊发表 70 余篇论文。

实验室曾在由美国国家标准与技术研究院（NIST）等机构联合组织的 TREC-COVID 文档级检索比赛第二轮无人工干预组中排名第一（共 25 支参赛队伍），相关技术成果被微软应用于其线上商业检索系统；联合清华大学和面壁智能研发端侧大语言模型 MiniCPM 的检索增强生成组件，发布时在 MTEB 榜单中文检索效果排名第一，相关模型在 Hugging Face 平台累计下载超过 32 万次；2025 年 1 月开源的 UltraRAG 工具已获超过 5,000 个 GitHub 星标；与阿里巴巴合作构建的用户视图流建模方法已应用于 ATA 在线平台。实验室长期与清华大学孙茂松、刘洋、刘知远三位教授的课题组，以及启元实验室、面壁智能和阿里巴巴保持紧密合作，形成产学研深度融合的科研团队；面向国家战略需求，持续推动信息检索与大语言模型知识工程领域的创新成果产出与工程化落地。

亮点工作

UNIKIE-BENCH: Benchmarking Large Multimodal Models for Key Information Extraction in Visual Documents

Yifan Ji, Zhipeng Xu, Zhenghao Liu, Zulong Chen, Qian Zhang, Zhibo Yang, Junyang Lin, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL · 2026CCF-A

Long-Chain Reasoning Distillation via Adaptive Prefix Alignment

Zhenghao Liu, Zhuoyang Wu, Xinze Li, Yukun Yan, Shuo Wang, Zulong Chen, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL · 2026CCF-A

Chunks as Arms: Multi-Armed Bandit-Guided Sampling for Long-Context LLM Preference Optimization

Shaohua Duan, Pengcheng Huang, Xinze Li, Zhenghao Liu, Xiaoyuan Yi, Yukun Yan, Shuo Wang, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL · 2026CCF-A

Empirical Analysis of Decoding Biases in Masked Diffusion Models

Pengcheng Huang, Tianming Liu, Zhenghao Liu, Yukun Yan, Shuo Wang, Tong Xiao, Zulong Chen, Maosong Sun

Proceedings of ACL · 2026CCF-A

实验室简介

最新动态

亮点工作