Yixuan Su (苏熠暄)

I am a research scientist working in the Agents Team at Cohere, contributing to the development for Retrieval-Augmentation (RAG), Tool Use, Multistep Reasoning, and Agents. Previously PhD and MPhil from University of Cambridge, and Bachelor from Beijing Institute of Technology.

Email: ys484 AT outlook.com

Experience

May 2023 - Present
Cohere, Agents Team, London, UK
Research Scientist

2022 Summer
Google DeepMind, London, UK
Student Collaborator with Dani Yogatama
2021 Summer
Amazon AWS AI, Seattle, US
Research intern with Lei Shu and Yi Zhang
2020 Summer
Apple Siri, Cambridge, UK
Research intern with ‪David Vandyke
2018-2019
Tencent AI Lab, Shenzhen, China
Research intern with Yan Wang and Xiaojiang Liu
2017 Summer
Microsoft Research Asia, Beijing, China
Research intern with ‪Lei Ji

Education

Oct. 2019 - May. 2023
Ph.D. in Computation, Cognition and Language, University of Cambridge
Advisor: Prof. Nigel Collier
Thesis Committee: Prof. Andreas Vlachos and Prof. Mirella Lapata.
Oct. 2017 - Sep. 2018
M.Phil in Machine Learning, Speech and Language Technology, University of Cambridge
Advisor: Prof. Anna Korhonen and Dr. Simon Baker
Sep. 2013 - Jun. 2017
B.S. in Department. of Engineering, Beijing Institute of Technology

Interns and Student Collaborator

Huayang Li, PhD student at Nara Institute of Science and Technology.

Zongqian Li, PhD student at University of Cambridge.

Yinhong Liu, PhD student at University of Cambridge.

Meiru Zhang, PhD student at University of Cambridge.

Publications (Most up-to-date list on Google Scholar)

(*: equal contribution)

Replacing Judges with Juries: Evaluating LLM Generations with a Panel of Diverse Models
Pat Verga, Sebastian Hofstatter, Sophia Althammer, Yixuan Su, Aleksandra Piktus, Arkady Arkhangorodsky, Minjie Xu, Naomi White, and Patrick Lewis
arXiv:2404.18796
StarCoder 2 and The Stack v2: The Next Generation
StarCoder Team
arXiv:2402.19173
Unlocking Structure Measuring: Introducing PDD, an Automatic Metric for Positional Discourse Coherence
Yinhong Liu, Yixuan Su, Ehsan Shareghi, and Nigel Collier
In Proceedings of the North American Chapter of Association for Computational Linguistics (NAACL 2024).
Instruct-SCTG: Guiding Sequential Controlled Text Generation through Instructions
Yinhong Liu, Yixuan Su, Ehsan Shareghi, and Nigel Collier
arXiv:2312.12299
Specialist or Generalist? Instruction Tuning for Specific NLP Tasks
Chufan Shi, Yixuan Su, Cheng Yang, Yujiu Yang, and Deng Cai
In Proceedings of the Empirical Methods in Natural Language Processing (EMNLP 2023).
Biomedical Named Entity Recognition via Dictionary-based Synonym Generalization
Zihao Fu, Yixuan Su, Zaiqiao Meng, and Nigel Collier
In Proceedings of the Empirical Methods in Natural Language Processing (EMNLP 2023).
Repetition In Repetition Out: Towards Understanding Neural Text Degeneration from the Data Perspective
Huayang Li, Tian Lan, Zihao Fu, Deng Cai, Lemao Liu, Nigel Collier, Taro Watanabe, and Yixuan Su
In Advances in Neural Information Processing Systems (NeurIPS 2023).
PandaGPT: One Model To Instruction-Follow Them All
Yixuan Su*, Tian Lan*, Huayang Li*, Jialu Xu, Yan Wang, and Deng Cai*
In Proceedings of the 1st Workshop on Taming Large Language Models (TLLM 2023)
OpenAlpaca: A Fully Open-Source Instruction-Following Model Based On OpenLLaMA
Yixuan Su*, Tian Lan*, and Deng Cai
Contrastive Search Is What You Need For Neural Text Generation
Yixuan Su and Nigel Collier
In Transactions on Machine Learning Research (TMLR 2023)
Plug-and-Play Recipe Generation with Content Planning
Yinhong Liu, Yixuan Su, Ehsan Shareghi, and Nigel Collier
In Proceedings of the 2nd Workshop on Natural Language Generation, Evaluation, and Metrics (GEM 2022)
Momentum Decoding: Open-ended Text Generation As Graph Exploration
Tian Lan*, Yixuan Su*, Shuhang Liu, Heyan Huang, and Xian-Ling Mao
arXiv:2212.02175
An Empirical Study On Contrastive Search And Contrastive Decoding For Open-ended Text Generation
Yixuan Su and Jialu Xu
arXiv:2211.10797
Language Models Can See: Plugging Visual Controls in Text Generation
Yixuan Su, Tian Lan, Yahui Liu, Fangyu Liu, Dani Yogatama, Yan Wang, Lingpeng Kong, and Nigel Collier
arXiv:2205.02655
A Contrastive Framework for Neural Text Generation
Yixuan Su, Tian Lan, Yan Wang, Dani Yogatama, Lingpeng Kong, and Nigel Collier
In Advances in Neural Information Processing Systems (NeurIPS 2022 Spotlight).
Measuring and Reducing Model Update Regression in Structured Prediction for NLP
Deng Cai, Elman Mansimov, Yi-An Lai, Yixuan Su, Lei Shu, and Yi Zhang
In Advances in Neural Information Processing Systems (NeurIPS 2022).
From Easy to Hard: A Dual Curriculum Learning Framework for Context-Aware Document Ranking
Yutao Zhu, Jian-Yun Nie, Yixuan Su, Haonan Chen, Xinyu Zhang, and Zhicheng Dou
In Proceedings of the 31st ACM International Conference on Information and Knowledge Management (CIKM 2022).
TaCL: Improving BERT Pre-training with Token-aware Contrastive Learning
Yixuan Su, Fangyu Liu, Zaiqiao Meng, Tian Lan, Lei Shu, Ehsan Shareghi, and Nigel Collier
In Findings of the North American Chapter of Association for Computational Linguistics (NAACL 2022).
Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System
Yixuan Su, Lei Shu, Elman Mansimov, Arshit Gupta, Deng Cai, Yi-An Lai, and Yi Zhang
In Proceedings of the Annual Meeting of the Association for Computational Linguistics (ACL 2022).
Rewire-then-Probe: A Contrastive Recipe for Probing Biomedical Knowledge of Pre-trained Language Models
Zaiqiao Meng, Fangyu Liu, Ehsan Shareghi, Yixuan Su, Charlotte Collins, and Nigel Collier
In Proceedings of the Annual Meeting of the Association for Computational Linguistics (ACL 2022).
A Survey on Retrieval-Augmented Text Generation
Huayang Li*, Yixuan Su*, Deng Cai*, Yan Wang*, and Lemao Liu*
arXiv:2202.01110
Exploring Dense Retrieval for Dialogue Response Selection
Tian Lan, Deng Cai, Yan Wang, Yixuan Su, Xian-Ling Mao, and Heyan Huang
arXiv:2110.06612
Plan-then-Generate: Controlled Data-to-Text Generation via Planning
Yixuan Su, David Vandyke, Sihui Wang, Yimai Fang, and Nigel Collier
In Findings of the Empirical Methods in Natural Language Processing (EMNLP 2021).
Few-Shot Table-to-Text Generation with Prototype Memory
Yixuan Su, Zaiqiao Meng, Simon Baker, and Nigel Collier
In Findings of the Empirical Methods in Natural Language Processing (EMNLP 2021).
Dialogue Response Selection with Hierarchical Curriculum Learning
Yixuan Su*, Deng Cai*, Qingyu Zhou, Zibo Lin, Simon Baker, Yunbo Cao, Shuming Shi, Nigel Collier, and Yan Wang
In Proceedings of the Annual Meeting of the Association for Computational Linguistics (ACL 2021).
Keep the Primary, Rewrite the Secondary: A Two-Stage Approach for Paraphrase Generation
Yixuan Su, David Vandyke, Simon Baker, Yan Wang, and Nigel Collier
In Findings of the Annual Meeting of the Association for Computational Linguistics (ACL 2021).
Prototype-to-Style: Dialogue Generation With Style-Aware Editing on Retrieval Memory
Yixuan Su, Yan Wang, Deng Cai, Simon Baker, Anna Korhonen, and Nigel Collier
In IEEE Transactions on Audio, Speech and Language Processing (TASLP 2021).
Non-Autoregressive Text Generation with Pre-trained Language Models
Yixuan Su, Deng Cai, Yan Wang, David Vandyke, Simon Baker, Piji Li, and Nigel Collier
In Proceedings of the European Chapter of the Association for Computational Linguistics (EACL 2021).
Stylistic dialogue generation via information-guided reinforcement learning strategy
Yixuan Su, Deng Cai, Yan Wang, Simon Baker, Anna Korhonen, Nigel Collier, and Xiaojiang Liu
arXiv:2004.02202

Invited Talks

January 2023, IR Group, University of Glasgow

October 2022, NLG Student Webinar, Chinese Information Processing Society of China

August 2022, MLNLP Webinar

August 2022, NLP Group, Princeton University

June 2022, Language Technology Lab, University of Cambridge

April 2022, NLP Group, University of Washington

April 2022, Language Team, DeepMind, London, UK

March 2022, NLP Group, University of Oxford

March 2022, NLP Group, Nara Institute of Science and Technology

February 2022, NLP Group, Tencent AI Lab, Shenzhen, China

Experience

Education

Interns and Student Collaborator

Publications (Most up-to-date list on Google Scholar)

Invited Talks

Professional Service