Research

ALL

Conference

LegalΔ: Enhancing Legal Reasoning in LLMs via Reinforcement Learning with Chain-of-Thought Guided Information Gain

Xin Dai, Buqiang Xu, Zhenghao Liu, Yukun Yan, Huiyuan Xie, Xiaoyuan Yi, Shuo Wang, Ge Yu

Proceedings of ICASSP · 2026CCF-B

EditMem: Enhancing Multi-Hop Fact Verification via Editable Memory

Yuqing Lan, Zhenghao Liu, Yu Gu, Ge Yu

Proceedings of ICASSP · 2026CCF-B

LISRec: Modeling User Preferences with Learned Item Shortcuts for Sequential Recommendation

Haidong Xin, Zhenghao Liu, Sen Mei, Yukun Yan, Shi Yu, Shuo Wang, Zulong Chen, Yu Gu, Ge Yu, Chenyan Xiong

Proceedings of KDD · 2026CCF-A

Mixture-of-Retrieval Experts for Reasoning-Guided Multimodal Knowledge Exploitation

Chunyi Peng, Zhipeng Xu, Zhenghao Liu, Yishan Li, Yukun Yan, Shuo Wang, Yu Gu, Minghe Yu, Ge Yu, Maosong Sun

Proceedings of SIGIR · 2026CCF-A

ReAlign: Optimizing the Visual Document Retriever with Reasoning-Guided Fine-Grained Alignment

Hao Yang, Yifan Ji, Zhipeng Xu, Zhenghao Liu, Yukun Yan, Zulong Chen, Shuo Wang, Yu Gu, Ge Yu

Proceedings of SIGIR · 2026CCF-A

LexRel: Benchmarking Legal Relation Extraction for Chinese Civil Cases

Yida Cai, Ranjuexiao Hu, Huiyuan Xie, Chenyang Li, Yun Liu, Yuxiao Ye, Zhenghao Liu, Weixing Shen, Zhiyuan Liu

Proceedings of ACL · 2026CCF-A

Long-Chain Reasoning Distillation via Adaptive Prefix Alignment

Zhenghao Liu, Zhuoyang Wu, Xinze Li, Yukun Yan, Shuo Wang, Zulong Chen, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL · 2026CCF-A

Towards Efficient and Effective Diffusion Language Model Inference via Semantic-Aware Adaptive Denoising

Fan Li, Yu Gu, Zhigang Wang, Fangling Leng, Zhenghao Liu, Ge Yu

Proceedings of ACL · 2026CCF-A

Lang2Act: Fine-Grained Visual Reasoning through Self-Emergent Linguistic Toolchains

Yuqi Xiong, Chunyi Peng, Zhipeng Xu, Zhenghao Liu, Zulong Chen, Yukun Yan, Shuo Wang, Yu Gu, Ge Yu

Proceedings of ACL (Findings) · 2026CCF-A

Revealing the Attention Floating Mechanism in Masked Diffusion Models

Xin Dai, Pengcheng Huang, Zhenghao Liu, Shuo Wang, Yukun Yan, Chaojun Xiao, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL (Findings) · 2026CCF-A

MetaMem: Evolving Meta-Memory for Knowledge Utilization through Self-Reflective Symbolic Optimization

Haidong Xin, Xinze Li, Zhenghao Liu, Yukun Yan, Shuo Wang, Cheng Yang, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL (Findings) · 2026CCF-A

HqeKV: Towards Hybrid Quantization and Eviction for KV Cache in Long-Context LLM Inference

He Wang, Yu Gu, Fangfang Li, Zhigang Wang, Zhenghao Liu, Ning Wang, Xiaohua Li, Ge Yu

Proceedings of ACL (Findings) · 2026CCF-A

Empirical Analysis of Decoding Biases in Masked Diffusion Models

Pengcheng Huang, Tianming Liu, Zhenghao Liu, Yukun Yan, Shuo Wang, Tong Xiao, Zulong Chen, Maosong Sun

Proceedings of ACL · 2026CCF-A

UNIKIE-BENCH: Benchmarking Large Multimodal Models for Key Information Extraction in Visual Documents

Yifan Ji, Zhipeng Xu, Zhenghao Liu, Zulong Chen, Qian Zhang, Zhibo Yang, Junyang Lin, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL · 2026CCF-A

Enhancing Long-Chain Reasoning Distillation through Error-Aware Self-Reflection

Zhuoyang Wu, Xinze Li, Zhenghao Liu, Yukun Yan, Zhiyuan Liu, Minghe Yu, Cheng Yang, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL (Findings) · 2026CCF-A

Chunks as Arms: Multi-Armed Bandit-Guided Sampling for Long-Context LLM Preference Optimization

Shaohua Duan, Pengcheng Huang, Xinze Li, Zhenghao Liu, Xiaoyuan Yi, Yukun Yan, Shuo Wang, Yu Gu, Ge Yu, Maosong Sun

Proceedings of ACL · 2026CCF-A

Mitigating Judgment Preference Bias in Large Language Models through Group-Based Polling

Shuliang Liu, Zhipeng Xu, Zhenghao Liu, Yukun Yan, Minghe Yu, Yu Gu, Chong Chen, Huiyuan Xie, Ge Yu

Proceedings of ACL (Findings) · 2026CCF-A

CheckRLM: Effective Knowledge-Thought Coherence Checking in Retrieval-Augmented Reasoning

Dingling Xu, Ruobing Wang, Qingfei Zhao, Yukun Yan, Zhichun Wang, Daren Zha, Shi Yu, Zhenghao Liu, Shuo Wang, Xu Han, Maosong Sun

Proceedings of ACL · 2026CCF-A

A*-Thought: Efficient Reasoning via Bidirectional Compression for Low-Resource Settings

Xiaoang Xu, Shuo Wang, Xu Han, Zhenghao Liu, Huijia Wu, Peipei Li, Zhiyuan Liu, Maosong Sun, Zhaofeng He

Proceedings of NeurIPS · 2025CCF-A

ParamMute: Suppressing Knowledge-Critical FFNs for Faithful Retrieval-Augmented Generation

Pengcheng Huang, Zhenghao Liu, Yukun Yan, Haiyan Zhao, Xiaoyuan Yi, Hao Chen, Zhiyuan Liu, Maosong Sun, Tong Xiao, Ge Yu, Chenyan Xiong

Proceedings of NeurIPS · 2025CCF-A

Advancing llm reasoning generalists with preference trees

Lifan Yuan, Ganqu Cui, Hanbin Wang, Ning Ding, Xingyao Wang, Jia Deng, Boji Shan, Huimin Chen, Ruobing Xie, Yankai Lin, Zhenghao Liu, Bowen Zhou, Hao Peng, Zhiyuan Liu, Maosong Sun

Proceedings of ICLR · 2025CCF-A

VisRAG: Vision-based retrieval-augmented generation on multi-modality documents

Shi Yu, Chaoyue Tang, Bokai Xu, Junbo Cui, Junhao Ran, Yukun Yan, Zhenghao Liu, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of ICLR · 2025CCF-A

RAG-DDR: Optimizing Retrieval-Augmented Generation Using Differentiable Data Rewards

Xinze Li, Sen Mei, Zhenghao Liu, Yukun Yan, Shuo Wang, Shi Yu, Zheni Zeng, Hao Chen, Ge Yu, Zhiyuan Liu, Maosong Sun, Chenyan Xiong

Proceedings of ICLR · 2025CCF-A

COAST: Enhancing the Code Debugging Ability of LLMs through Communicative Agent Based Data Synthesis

Weiqing Yang, Hanbin Wang, Zhenghao Liu, Xinze Li, Yukun Yan, Shuo Wang, Yu Gu, Minghe Yu, Zhiyuan Liu, Ge Yu

Proceedings of NAACL (Findings) · 2025CCF-B

Enhancing the Patent Matching Capability of Large Language Models via the Memory Graph

Qiushi Xiong, Zhipeng Xu, Zhenghao Liu, Mengjia Wang, Zulong Chen, Yue Sun, Yu Gu, Xiaohua Li, Ge Yu

Proceedings of SIGIR · 2025CCF-A

DeepNote: Note-Centric Deep Retrieval-Augmented Generation

Ruobing Wang, Qingfei Zhao, Yukun Yan, Daren Zha, Yuxuan Chen, Shi Yu, Zhenghao Liu, Yixuan Wang, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP (Findings) · 2025CCF-B

KBAlign: Efficient Self Adaptation on Specific Knowledge Bases

Zheni Zeng, Yuxuan Chen, Shi Yu, Ruobing Wang, Yukun Yan, Zhenghao Liu, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP (Findings) · 2025CCF-B

PersLLM: A Personified Training Approach for Large Language Models

Zheni Zeng, Jiayi Chen, Huimin Chen, Yukun Yan, Yuxuan Chen, Zhenghao Liu, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP (Findings) · 2025CCF-B

ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation

Hao Chen, Yukun Yan, Sen Mei, Wanxiang Che, Zhenghao Liu, Qi Shi, Xinze Li, Yuchun Fan, Pengcheng Huang, Qiushi Xiong, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP (Findings) · 2025CCF-B

ReCUT: Balancing Reasoning Length and Accuracy in LLMs via Stepwise Trails and Preference Optimization

Zhensheng Jin, Xinze Li, Yifan Ji, Chunyi Peng, Zhenghao Liu, Qi Shi, Yukun Yan, Shuo Wang, Furong Peng, Ge Yu

Proceedings of EMNLP (Findings) · 2025CCF-B

ExpandR: Teaching Dense Retrievers Beyond Queries with LLM Guidance

Sijia Yao, Pengcheng Huang, Zhenghao Liu, Yu Gu, Yukun Yan, Shi Yu, Ge Yu

Proceedings of EMNLP · 2025CCF-B

RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework

Kunlun Zhu, Yifan Luo, Dingling Xu, Yukun Yan, Zhenghao Liu, Shi Yu, Ruobing Wang, , Shuo Wang, Yishan Li, Nan Zhang, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of ACL · 2025CCF-A

Judge as A Judge: Improving the Evaluation of Retrieval-Augmented Generation through the Judge-Consistency of Large Language Models

Shuliang Liu, Xinze Li, Zhenghao Liu, Yukun Yan, Cheng Yang, Zheni Zeng, Zhiyuan Liu, Maosong Sun, Ge Yu

Proceedings of ACL (Findings) · 2025CCF-A

Rankcot: Refining knowledge for retrieval-augmented generation through ranking chain-of-thoughts

Mingyan Wu, Zhenghao Liu, Yukun Yan, Xinze Li, Shi Yu, Zheni Zeng, Yu Gu, Ge Yu

Proceedings of ACL · 2025CCF-A

Exploring the Potential of Dimension Reduction in Building Efficient Dense Retrieval Systems

Zhipeng Xu, Zhenghao Liu, Yu Gu, Ge Yu

Proceedings of CCIR · 2024

Chameleon: Towards Update-Efficient Learned Indexing for Locally Skewed Data

Na Guo, Yaqi Wang, Wenli Sun, Yu Gu, Jianzhong Qi, Zhenghao Liu, Xiufeng Xia, Ge Yu

Proceedings of ICDE · 2024CCF-A

MCTS: A Multi-Reference Chinese Text Simplification Dataset

Ruining Chong, Luming Lu, Liner Yang, Jinran Nie, Zhenghao Liu, Shuo Wangl, Shuhan Zhou, Yaoxin Li, Erhong Yang

Proceedings of COLING · 2024CCF-B

Fusion-in-T5: Unifying Document Ranking Signals for Improved Information Retrieval

Shi Yu, Chenghao Fan, Chenyan Xiong, David Jin, Zhiyuan Liu, Zhenghao Liu

Proceedings of COLING · 2024CCF-B

Toolink: Linking toolkit creation and using through chain-of-solving on open-source model

Cheng Qian, Chenyan Xiong, Zhenghao Liu, Zhiyuan Liu

Proceedings of NAACL · 2024CCF-B

Modeling User Viewing Flow Using Large Language Models for Article Recommendation

Zhenghao Liu, Zulong Chen, Moufeng Zhang, Shaoyang Duan, Hong Wen, Liangyue Li, Nan Li, Yu Gu, Ge Yu

Proceedings of WWW · 2024CCF-A

Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs

Cheng Gao, Chaojun Xiao, Zhenghao Liu, Huimin Chen, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP · 2024CCF-B

MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization

Zhiyu Yang, Zihan Zhou, Shuo Wang, Xin Cong, Xu Han, Yukun Yan, Zhenghao Liu, Zhixing Tan, Pengyuan Liu, Dong Yu, Zhiyuan Liu, Xiaodong Shi, Maosong Sun

Proceedings of ACL (Findings) · 2024CCF-A

INTERVENOR: Prompting the Coding Ability of Large Language Models with the Interactive Chain of Repair

Hanbin Wang, Zhenghao Liu, Shuo Wang, Ganqu Cui, Ning Ding, Zhiyuan Liu, Ge Yu

Proceedings of ACL (Findings) · 2024CCF-A

MARVEL: Unlocking the Multi-Modal Capability of Dense Retrieval via Visual Module Plugin

Tianshuo Zhou, Sen Mei, Xinze Li, Zhenghao Liu, Chenyan Xiong, Zhiyuan Liu, Yu Gu, Ge Yu

Proceedings of ACL · 2024CCF-A

UltraLink: An Open-Source Knowledge-Enhanced Multilingual Supervised Fine-tuning Dataset

Haoyu Wang, Shuo Wang, Yukun Yan, Xujia Wang, Zhiyu Yang, Yuzhuang Xu, Zhenghao Liu, Ning Ding, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of ACL · 2024CCF-A

Cleaner Pretraining Corpus Curation with Neural Web Scraping

Zhipeng Xu, Zhenghao Liu, Yukun Yan, Zhiyuan Liu, Chenyan Xiong, Ge Yu

Proceedings of ACL · 2024CCF-A

Text Matching Improves Sequential Recommendation by Reducing Popularity Biases

Zhenghao Liu, Sen Mei, Chenyan Xiong, Xiaohua Li, Shi Yu, Zhiyuan Liu, Yu Gu, Ge Yu

Proceedings of CIKM · 2023CCF-B

Universal Vision-Language Dense Retrieval: Learning A Unified Representation Space for Multi-Modal Retrieval

Zhenghao Liu, Chenyan Xiong, Yuanhuiyi Lv, Zhiyuan Liu, Ge Yu

Proceedings of ICLR · 2023CCF-A

Openmatch-v2: An all-in-one multi-modality plm-based information retrieval toolkit

Shi Yu, Zhenghao Liu, Chenyan Xiong, Zhiyuan Liu

Proceedings of SIGIR · 2023CCF-A

Structure-Aware Language Model Pretraining Improves Dense Retrieval on Structured Data

Xinze Li, Zhenghao Liu, Chenyan Xiong, Shi Yu, Yu Gu, Zhiyuan Liu, Ge Yu

Proceedings of ACL (Findings) · 2023CCF-A

Leveraging Prefix Transfer for Multi-Intent Text Revision

Ruining Chong, Cunliang Kong, Liu Wu, Zhenghao Liu, Ziye Jin, Liner Yang, Yange Fan, Hanghang Fan, Erhong Yang

Proceedings of ACL · 2023CCF-A

P3 Ranker: Mitigating the Gaps between Pre-training and Ranking Fine-tuning with Prompt-based Learning and Pre-finetuning

Xiaomeng Hu, Shi Yu, Chenyan Xiong, Zhenghao Liu, Zhiyuan Liu, Ge Yu

Proceedings of SIGIR · 2022CCF-A

Dimension Reduction for Efficient Dense Retrieval via Conditional Autoencoder

Zhenghao Liu, Han Zhang, Chenyan Xiong, Zhiyuan Liu, Yu Gu, Xiaohua Li

Proceedings of EMNLP · 2022CCF-B

Neural Quality Estimation with Multiple Hypotheses for Grammatical Error Correction

Zhenghao Liu, Xiaoyuan Yi, Maosong Sun, Liner Yang, Tat-Seng Chua

Proceedings of NAACL · 2021CCF-B

More robust dense retrieval with contrastive dual learning

Yizhi Li, Zhenghao Liu, Chenyan Xiong, Zhiyuan Liu

Proceedings of ICTIR · 2021

OpenMatch: An Open Source Library for Neu-IR Research

Zhenghao Liu, Kaitao Zhang, Chenyan Xiong, Zhiyuan Liu, Maosong Sun

Proceedings of SIGIR · 2021CCF-A

Few-Shot Conversational Dense Retrieval

Shi Yu, Zhenghao Liu, Chenyan Xiong, Tao Feng, Zhiyuan Liu

Proceedings of SIGIR · 2021CCF-A

Capturing Global Informativeness in Open Domain Keyphrase Extraction

Si Sun, Zhenghao Liu, Chenyan Xiong, Zhiyuan Liu, Jie Bao

Proceedings of NLPCC · 2021CCF-C

TIAGE: A Benchmark for Topic-Shift Aware Dialog Modeling

Huiyuan Xie, Zhenghao Liu, Chenyan Xiong, Zhiyuan Liu, Ann Copestake

Proceedings of EMNLP (Findings) · 2021CCF-B

Few-Shot Text Ranking with Meta Adapted Synthetic Weak Supervision

Si Sun, Yingzhuo Qian, Zhenghao Liu, Chenyan Xiong, Kaitao Zhang, Jie Bao, Zhiyuan Liu, Paul Bennett

Proceedings of ACL-IJCNLP · 2021CCF-A

Text Style Transfer via Learning Style Instance Supported Latent Space

Kaitao Zhang, Chenyan Xiong, Zhenghao Liu, Zhiyuan Liu

Proceedings of IJCAI · 2020CCF-A

Selective Weak Supervision for Neural Information Retrieval

Kaitao Zhang, Chenyan Xiong, Zhenghao Liu, Zhiyuan Liu

Proceedings of WWW · 2020CCF-A

Adapting Open Domain Fact Extraction and Verification to COVID-FACT through In-Domain Language Modeling

Zhenghao Liu, Chenyan Xiong, Zhuyun Dai, Si Sun, Maosong Sun, Zhiyuan Liu

Proceedings of EMNLP (Findings) · 2020CCF-B

Coreferential Reasoning Learning for Language Representation

Deming Ye, Yankai Lin, Jiaju Du, Zhenghao Liu, Peng Li, Maosong Sun, Zhiyuan Liu

Proceedings of EMNLP · 2020CCF-B

Fine-grained Fact Verification with Kernel Graph Attention Network

Zhenghao Liu, Chenyan Xiong, Maosong Sun, Zhiyuan Liu

Proceedings of ACL · 2020CCF-A

Grounded Conversation Generation as Guided Traverses in Commonsense Knowledge Graphs

Houyu Zhang, Zhenghao Liu, Chenyan Xiong, Zhiyuan Liu

Proceedings of ACL · 2020CCF-A

Explore Entity Embedding Effectiveness in Entity Retrieval

Zhenghao Liu, Chenyan Xiong, Maosong Sun, Zhiyuan Liu

Proceedings of CCL · 2019

DocRED: A Large-Scale Document-Level Relation Extraction Dataset

Yuan Yao, Deming Ye, Peng Li, Xu Han, Yankai Lin, Zhenghao Liu, Zhiyuan Liu, Lixin Huang, Jie Zhou, Maosong Sun

Proceedings of ACL · 2019CCF-A

Entity-Duet Neural Ranking: Understanding the Role of Knowledge Graph Semantics in Neural Information Retrieval

Zhenghao Liu, Chenyan Xiong, Maosong Sun, Zhiyuan Liu

Proceedings of ACL · 2018CCF-A

Journal

Knowledge Intensive Agents

Zhenghao Liu, Pengcheng Huang, Zhipeng Xu, Xinze Li, Shuliang Liu, Chunyi Peng, Haidong Xin, Yukun Yan, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun, Yu Gu, Ge Yu

Journal of AI Open · 2026

Building A Coding Assistant via the Retrieval-Augmented Language Model

Xinze Li, Hanbin Wang, Zhenghao Liu, Shi Yu, Shuo Wang, Yukun Yan, Yukai Fu, Yu Gu, Ge Yu

Journal of ACM Transactions on Information Systems (TOIS) · 2024CCF-A

CHGNN: A Semi-Supervised Contrastive Hypergraph Learning Network

Yumeng Song, Yu Gu, Tianyi Li, Jianzhong Qi, Zhenghao Liu, Christian S Jensen, Ge Yu

Journal of IEEE Transactions on Knowledge and Data Engineering (TKDE) · 2024CCF-A

Tailored Definitions With Easy Reach: Complexity-Controllable Definition Generation

Liner Yang, Jiaxin Yuan, Cunliang Kong, Jingsi Yu, Ruining Chong, Zhenghao Liu, Erhong Yang

Journal of IEEE Transactions on Big Data (TBD) · 2024CCF-C

Multi-Evidence based Fact Verification via A Confidential Graph Neural Network

Yuqing Lan, Zhenghao Liu, Yu Gu, Xiaoyuan Yi, Xiaohua Li, Liner Yang, Ge Yu

Journal of IEEE Transactions on Big Data (TBD) · 2024CCF-C

Neural Parse Combination

Liner Yang, Maosong Sun, Jiacheng Zhang, Zhenghao Liu, Huanbo Luan, Yang Liu

Journal of Computer Science and Technology (JCST) · 2017CCF-B