杨植麟本科毕业于清华大学计算机系 ,博士毕业于卡内基梅隆大学计算机学院。曾效力于全球顶级人工智能机构Facebook AI Research, Google Brain;于ICLR、NIPS、ICML、KDD、ACL等顶级AI会议发表论文二十余篇;在所有六个主流语言建模数据集保持世界第一名 (State-of-the-art) [16] [23]。杨植麟还曾参与过Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,其中主导开发盘古NLP大模型,获世界人工智能大会“2021SAIL 之星”称号 [23]。2022年4月28日,杨植麟入选AI华人青年学者榜单 [12-13]。
杨植麟是Transformer-XL与XLNet两篇重要论文的第一作者,两者均涉及大语言模型领域的核心技术。他也是中国35岁以下,NLP(自然语言处理)领域引用量最高的研究者 [26]。
- 中文名
- 杨植麟
- 外文名
- Zhilin Yang
kimi [22] - 国 籍
- 中国
- 民 族
- 汉族
- 出生日期
- 1993年
- 毕业院校
- 清华大学、卡内基梅隆大学 [1]
- 主要成就
- 2019年世界人工智能大会“A班计划” [3]
2019年度北京智源青年科学家 [27]
2019年西贝尔学者(Siebel Scholars) [4]
2018年英伟达学者 [5]
2017年Facebook ParlAI研究奖 [6] - 性 别
- 男
- 学 位
- 博士 [1]
- 高中经历
高中时,杨植麟就读于汕头金山中学。他进入计算机领域颇有传奇色彩,高中期间,没有任何编程基础的杨植麟被选拔进信息学奥林匹克竞赛培训班,之后在全国青少年信息学奥林匹克联赛中夺得广东赛区一等奖,因此获得清华大学保送生资格,并于2011年毕业,高考成绩为667分,远超清华大学在广东的录取线 [21-22]。
高中时期曾经作为鼓手组建摇滚乐队 [22]。
- 本科经历
2011年,杨植麟最初被清华大学热能工程系录取,在大二转专业进入计算机系。杨植麟清华求学时期,师从清华大学计算机系知识工程实验室(KEG)带头人,智源研究院学术副院长、悟道项目负责人唐杰教授。最终,他以满分成绩通过所有程序设计课程,并在2015年以年级第一的成绩毕业 [7] [18] [22] [26]。
杨植麟儿时曾一度梦想成为摇滚明星或是流浪诗人,本科在清华期间也组建了校园摇滚乐队Splay,当起鼓手和词曲作者,在学术研究和摇滚音乐间自如切换。曾晋级清华大学校园歌手大赛原创决赛。而他选择计算机专业,成为码农,还受到村上春树一篇小说的影响,对深夜写代码让科技落地的角色印象深刻 [20-21]。
- 研究生经历
2015年,杨植麟进入美国卡内基梅隆大学(CMU)语言技术研究所(LTI),跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士位 [18]。
2020年2月,杨植麟参加“智源论坛 Live | 青年科学家线上报告会”,做了题为《Latest Advances of Neural Language Models》的主题演讲 [15]。
2023年4月17日,北京月之暗面科技有限公司(Moonshot AI)成立,杨植麟是法定代表人,持股78.968%,拥有绝对控制权 [16]。
2023年6月,在硅谷极具影响力的科技媒体The Information中,杨植麟成为“中国OpenAI”的五个候选之一。 [27]
2024年4月,据界面新闻报道,杨植麟通过售出个人持股已套现数千万美金。4月23日,针对创始人杨植麟通过售出个人持股“套现数千万美元”的消息,月之暗面方面回应新京报贝壳财经记者称,上述消息不实,月之暗面此前已公布员工激励计划 [16-17]。
杨植麟的研究方向包括大规模预训练,自然语言处理,自然语言理解与生成,少样本学习,零样本学习,多模态学习 [14] [19]。
在深度学习和自然语言处理领域有深入研究且取得了显著成果。作为第一作者与卡内基梅隆大学、Google Brain 团队联合推出NLP 领域热门的国际前沿预训练 XLNet 模型,在 20 个标准任务上超过了曾经保持最优性能记录的 Google BERT 模型,并在18个标准任务上取得历史最好结果,入选NeurIPS 2019 Oral。作为共同第一作者提出 Transformer-XL 模型并在多项主流序列建模数据集上取得历史最好结果。Google 学术引用超 2400 次 [15]。
在中国人工智能学会CAAI和清华大学联合发布的《2019人工智能发展报告》中,杨植麟为第一作者的 XLNet 被称为“BERT 之后的重要进展”。2019年,XLNet 论文被多家 AI 媒体机构评选为年度深度学习论文 TOP10,包括 TopBots、Heartbeat和Rubik's Code等。2017年和2018年,杨植麟连续入选机器学习和NLP领域一流会议和期刊的第一作者全球排行榜,全球仅有三名学者两年皆入选 [15]。
杨植麟及其团队的研究曾经在半监督学习、自然语言理解的十余个标准数据集上取得世界第一,并同时在所有六个主流语言建模数据集上保持世界纪录。杨植麟还曾参与过Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,其中主导开发盘古NLP大模型,获世界人工智能大会“2021SAIL 之星”称号 [23]。
序号 | 论文标题 |
---|---|
1 | Zhilin Yang, Jake Zhao, Bhuwan Dhingra, Kaiming He, William W. Cohen, Ruslan Salakhutdinov, Yann LeCun,GLoMo: Unsupervised Learning of Transferable Relational Graphs |
2 | Zhilin Yang, Peng Qi, Saizheng Zhang, Yoshua Bengio, William W. Cohen, Ruslan Salakhutdinov, Christopher D. Manning,HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering |
3 | Jing Zhou, Yanan Zheng, Jie Tang, Jian Li, Zhilin Yang, Flipda: Effective and Robust Data Augmentation for Few-Shot Learning, 2022 Annual Meeting of the Association for Computational Linguistics(ACL), 2022 |
4 | Yanan Zheng, Jing Zhou, Yujie Qian, Ming Ding, Chonghua Liao, Jian Li, Ruslan Salakhutdinov, Jie Tang, Sebastian Ruder, Zhilin Yang, FewNLU: Benchmarking State-of-the-Art Methods for Few-Shot Natural Language Understanding, 2022 Annual Meeting of the Association for Computational Linguistics(ACL), 2022 |
5 | Xiao Liu, Kaixuan Ji, Yicheng Fu, Weng Lam Tam, Zhengxiao Du, Zhilin Yang, Jie Tang, P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks, 2022 Annual Meeting of the Association for Computational Linguistics(ACL), 2022 |
6 | Zhengxiao Du, Yujie Qian, Xiao Liu, Ming Ding, Jiezhong Qiu, Zhilin Yang, Jie Tang, GLM: General Language Model Pretraining with Autoregressive Blank Infilling, 2022 Annual Meeting of the Association for Computational Linguistics(ACL), 2022 |
7 | Xingcheng Yao, Yanan Zheng, Xiaocong Yang, Zhilin Yang, NLP From Scratch Without Large-Scale Pretraining:A Simple and Efficient Framework, International Conference on Machine Learning (ICML), 2023 |
8 | Haike Xu, Zongyu Lin, Jing Zhou, Yanan Zheng, Zhilin Yang, A Universal Discriminator for Zero-Shot Generalization, Annual Meeting of the Association for Computational Linguistics(ACL), 2023 |
9 | Nan Shao, Zefan Cai, Chonghua Liao, Yanan Zheng, Zhilin Yang, Compositional task representations for large language models, International Conference on Learning Representation (ICLR), 2023 |
10 | Jing Zhou, Zongyu Lin, Yanan Zheng, Jian Li, Zhilin Yang, Not All Tasks Are Born Equal: Understanding Zero-Shot Generalization, International Conference on Learning Representation (ICLR), 2023 |
参考资料 | [9-10] [14] |
时间 | 所获荣誉 |
---|---|
- | 全国青少年信息学奥林匹克联赛中夺得广东赛区一等奖 [22]。 |
2017年 | Facebook ParlAI 研究奖 [15]。 |
2018年 | 英伟达学者(NVIDIA Fellow)。 |
2018年 | 西贝尔学者(Siebel Scholars)。 |
2019年 | 获得北京智源青年科学家称号 [20]。 |
2020年 | 入选AI顶级会议NeurIPS 2019口头报告 [22]。 |
2020年 | 入选2019年度“智源青年科学家” [15]。 |
2020年11月 | |
2022年4月28日 | 入选AI华人青年学者榜单 [20]。 |
- | 福布斯亚洲30位30岁以下精英 [14]。 |
他本可在海外企业拿着高薪享受生活,却为了成就一番事业白手起家、从头干起。在他的心中,一直坚信:只要是坚持去做对行业有价值的事情,商业回报一定会成功的。当下,有不少怀揣着梦想的年轻人,却在实现梦想的路上踌躇不前。杨植麟用行动告诉了我们,在实现梦想的路上要敢于去尝试,创业要大胆但不能盲目,但当我们认清了自己的路就要义务反顾的往前冲 [21]。(汕头日报评)