IP 属地北京

Anitaa一个有趣的俗人

香港大学

她的动态

赞同了文章2023-11-11 23:46

大语言模型时代，强化学习的未来该何去何从？

孙元宝儿

阿姆斯特丹大学人工智能硕士，游戏AI，大模型

如何结合近期AIGC以及大模型正处于风口，带动相应的AI内容生成，大模型预训练等岗位需求如井喷式增长，与之相对应的是笔者从事的用强化学习做游戏中AIbot这一传统需求的大跌，真是“几家欢乐几家愁”。不过与此同时，笔者一直在思考在这个时代如何将LLM有机的与RL进行结合，近期一些纯用LLM在游戏内对智能体进行控制并取得SOTA结果的工作有不少，如斯坦福的这篇工作用大语言模型玩模拟人生并展现出了相对灵活不刻板的类人行为（…

赞同了文章2023-03-13 15:58

【自然语言处理】【ChatGPT系列】大模型的涌现能力

白强伟

北京大学软件工程硕士

《Emergent Abilities of Large Language Models》论文地址： https://http://arxiv.org/pdf/2206.07682.pdf一、简介语言模型已经彻底改变了自然语言处理(NLP)。总所周知，增加语言模型的规模能够为一系列下游的NLP任务带来更好的效果和样本效率。在某些场景中，模型规模对于模型的效果可以通过scaling laws预测。但是，某些下游任务的效果并没有随着规模的上升而改善。本文讨论了大规模语言模型的涌现能力(Emergent Ability)…

个人成就

获得 925 次赞同

获得 324 次喜欢，2,069 次收藏

参与 4 次公共编辑

关注了

关注者

2570

赞助的 Live ⚡️1 关注的话题0 关注的专栏0 关注的问题63 关注的收藏夹0