杨植麟_百度百科

杨植麟

大模型企业月之暗面创始人,清华大学助理教授
收藏
0有用+1
0
杨植麟,男,出生于1993年,广东汕头人,大模型企业月之暗面(Moonshot AI)创始人,清华大学助理教授,2019年度北京智源青年科学家,上海期智研究院PI [2] [13] [24-26]
杨植麟本科毕业于清华大学计算机系 ,博士毕业于卡内基梅隆大学计算机学院。曾效力于全球顶级人工智能机构Facebook AI Research, Google Brain;于ICLR、NIPS、ICML、KDD、ACL等顶级AI会议发表论文二十余篇;在所有六个主流语言建模数据集保持世界第一名 (State-of-the-art) [16] [23]。杨植麟还曾参与过Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,其中主导开发盘古NLP大模型,获世界人工智能大会“2021SAIL 之星”称号 [23]2022年4月28日,杨植麟入选AI华人青年学者榜单 [12-13]
杨植麟是Transformer-XL与XLNet两篇重要论文的第一作者,两者均涉及大语言模型领域的核心技术。他也是中国35岁以下,NLP(自然语言处理)领域引用量最高的研究者 [26]
中文名
杨植麟
外文名
Zhilin Yang
kimi [22]
国    籍
中国
民    族
汉族
出生日期
1993年
毕业院校
清华大学卡内基梅隆大学 [1]
主要成就
2019年世界人工智能大会“A班计划” [3]
2019年度北京智源青年科学家 [27]
2019年西贝尔学者(Siebel Scholars) [4]
2018年英伟达学者 [5]
2017年Facebook ParlAI研究奖 [6]
性    别
学    位
博士 [1]

人物经历

播报
编辑

早年经历

  • 高中经历
杨植麟
高中时,杨植麟就读于汕头金山中学。他进入计算机领域颇有传奇色彩,高中期间,没有任何编程基础的杨植麟被选拔进信息学奥林匹克竞赛培训班,之后在全国青少年信息学奥林匹克联赛中夺得广东赛区一等奖,因此获得清华大学保送生资格,并于2011年毕业,高考成绩为667分,远超清华大学在广东的录取线 [21-22]
高中时期曾经作为鼓手组建摇滚乐队 [22]
  • 本科经历
2011年,杨植麟最初被清华大学热能工程系录取,在大二转专业进入计算机系。杨植麟清华求学时期,师从清华大学计算机系知识工程实验室(KEG)带头人,智源研究院学术副院长、悟道项目负责人唐杰教授。最终,他以满分成绩通过所有程序设计课程,并在2015年以年级第一的成绩毕业 [7] [18] [22] [26]
杨植麟儿时曾一度梦想成为摇滚明星或是流浪诗人,本科在清华期间也组建了校园摇滚乐队Splay,当起鼓手和词曲作者,在学术研究和摇滚音乐间自如切换。曾晋级清华大学校园歌手大赛原创决赛。而他选择计算机专业,成为码农,还受到村上春树一篇小说的影响,对深夜写代码让科技落地的角色印象深刻 [20-21]
  • 研究生经历
2015年,杨植麟进入美国卡内基梅隆大学(CMU)语言技术研究所(LTI),跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士位 [18]
2019年,杨植麟获得卡耐基梅隆大学计算机专业博士学位 [1] [15]。同年,作为第一作者,与谷歌卡内基梅隆大学联合发表深度学习和自然语言处理模型XLNet [8]

工作经历

杨植麟
2019年10月,第五届潮创大会暨2019全球潮人人工智能大会在汕头举行,循环智能联合创始人杨植麟回汕参加活动并接受采访 [24]
2020年2月,杨植麟参加“智源论坛 Live | 青年科学家线上报告会”,做了题为《Latest Advances of Neural Language Models》的主题演讲 [15]
2023年4月17日,北京月之暗面科技有限公司(Moonshot AI)成立,杨植麟是法定代表人,持股78.968%,拥有绝对控制权 [16]
2023年6月,在硅谷极具影响力的科技媒体The Information中,杨植麟成为“中国OpenAI”的五个候选之一。 [27]
2024年4月,据界面新闻报道,杨植麟通过售出个人持股已套现数千万美金。4月23日,针对创始人杨植麟通过售出个人持股“套现数千万美元”的消息,月之暗面方面回应新京报贝壳财经记者称,上述消息不实,月之暗面此前已公布员工激励计划 [16-17]

研究方向

播报
编辑
杨植麟的研究方向包括大规模预训练,自然语言处理,自然语言理解与生成,少样本学习,零样本学习,多模态学习 [14] [19]

主要成就

播报
编辑

研究成果

在深度学习和自然语言处理领域有深入研究且取得了显著成果。作为第一作者与卡内基梅隆大学、Google Brain 团队联合推出NLP 领域热门的国际前沿预训练 XLNet 模型,在 20 个标准任务上超过了曾经保持最优性能记录的 Google BERT 模型,并在18个标准任务上取得历史最好结果,入选NeurIPS 2019 Oral。作为共同第一作者提出 Transformer-XL 模型并在多项主流序列建模数据集上取得历史最好结果。Google 学术引用超 2400 次 [15]
在中国人工智能学会CAAI和清华大学联合发布的《2019人工智能发展报告》中,杨植麟为第一作者的 XLNet 被称为“BERT 之后的重要进展”。2019年,XLNet 论文被多家 AI 媒体机构评选为年度深度学习论文 TOP10,包括 TopBots、Heartbeat和Rubik's Code等。2017年和2018年,杨植麟连续入选机器学习和NLP领域一流会议和期刊的第一作者全球排行榜,全球仅有三名学者两年皆入选 [15]
杨植麟及其团队的研究曾经在半监督学习、自然语言理解的十余个标准数据集上取得世界第一,并同时在所有六个主流语言建模数据集上保持世界纪录。杨植麟还曾参与过Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,其中主导开发盘古NLP大模型,获世界人工智能大会“2021SAIL 之星”称号 [23]

发表论文

序号
论文标题
1
Zhilin Yang, Jake Zhao, Bhuwan Dhingra, Kaiming He, William W. Cohen, Ruslan Salakhutdinov, Yann LeCun,GLoMo: Unsupervised Learning of Transferable Relational Graphs
2
Zhilin Yang, Peng Qi, Saizheng Zhang, Yoshua Bengio, William W. Cohen, Ruslan Salakhutdinov, Christopher D. Manning,HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering
3
Jing Zhou, Yanan Zheng, Jie Tang, Jian Li, Zhilin Yang, Flipda: Effective and Robust Data Augmentation for Few-Shot Learning, 2022 Annual Meeting of the Association for Computational Linguistics(ACL), 2022
4
Yanan Zheng, Jing Zhou, Yujie Qian, Ming Ding, Chonghua Liao, Jian Li, Ruslan Salakhutdinov, Jie Tang, Sebastian Ruder, Zhilin Yang, FewNLU: Benchmarking State-of-the-Art Methods for Few-Shot Natural Language Understanding, 2022 Annual Meeting of the Association for Computational Linguistics(ACL), 2022
5
Xiao Liu, Kaixuan Ji, Yicheng Fu, Weng Lam Tam, Zhengxiao Du, Zhilin Yang, Jie Tang, P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks, 2022 Annual Meeting of the Association for Computational Linguistics(ACL), 2022
6
Zhengxiao Du, Yujie Qian, Xiao Liu, Ming Ding, Jiezhong Qiu, Zhilin Yang, Jie Tang, GLM: General Language Model Pretraining with Autoregressive Blank Infilling, 2022 Annual Meeting of the Association for Computational Linguistics(ACL), 2022
7
Xingcheng Yao, Yanan Zheng, Xiaocong Yang, Zhilin Yang, NLP From Scratch Without Large-Scale Pretraining:A Simple and Efficient Framework, International Conference on Machine Learning (ICML), 2023
8
Haike Xu, Zongyu Lin, Jing Zhou, Yanan Zheng, Zhilin Yang, A Universal Discriminator for Zero-Shot Generalization, Annual Meeting of the Association for Computational Linguistics(ACL), 2023
9
Nan Shao, Zefan Cai, Chonghua Liao, Yanan Zheng, Zhilin Yang, Compositional task representations for large language models, International Conference on Learning Representation (ICLR), 2023
10
Jing Zhou, Zongyu Lin, Yanan Zheng, Jian Li, Zhilin Yang, Not All Tasks Are Born Equal: Understanding Zero-Shot Generalization, International Conference on Learning Representation (ICLR), 2023
参考资料
[9-10] [14]

所获荣誉

播报
编辑
时间
所获荣誉
-
全国青少年信息学奥林匹克联赛中夺得广东赛区一等奖 [22]
2017年
Facebook ParlAI 研究奖 [15]
2018年
英伟达学者(NVIDIA Fellow)。
2018年
西贝尔学者(Siebel Scholars)。
2019年
获得北京智源青年科学家称号 [20]
2020年
入选AI顶级会议NeurIPS 2019口头报告 [22]
2020年
入选2019年度“智源青年科学家” [15]
2020年11月
2022年4月28日
入选AI华人青年学者榜单 [20]
-
福布斯亚洲30位30岁以下精英 [14]

人物评价

播报
编辑
他本可在海外企业拿着高薪享受生活,却为了成就一番事业白手起家、从头干起。在他的心中,一直坚信:只要是坚持去做对行业有价值的事情,商业回报一定会成功的。当下,有不少怀揣着梦想的年轻人,却在实现梦想的路上踌躇不前。杨植麟用行动告诉了我们,在实现梦想的路上要敢于去尝试,创业要大胆但不能盲目,但当我们认清了自己的路就要义务反顾的往前冲 [21](汕头日报评)