IP 属地北京
Anitaa一个有趣的俗人
她的动态
大语言模型时代,强化学习的未来该何去何从?
如何结合近期AIGC以及大模型正处于风口,带动相应的AI内容生成,大模型预训练等岗位需求如井喷式增长,与之相对应的是笔者从事的用强化学习做游戏中AIbot这一传统需求的大跌,真是“几家欢乐几家愁”。不过与此同时,笔者一直在思考在这个时代如何将LLM有机的与RL进行结合,近期一些纯用LLM在游戏内对智能体进行控制并取得SOTA结果的工作有不少,如 斯坦福的这篇工作用大语言模型玩模拟人生并展现出了相对灵活不刻板的类人行为(…
【自然语言处理】【ChatGPT系列】大模型的涌现能力
《Emergent Abilities of Large Language Models》 论文地址: https://http://arxiv.org/pdf/2206.07682.pdf一、简介 语言模型已经彻底改变了自然语言处理(NLP)。总所周知,增加语言模型的规模能够为一系列下游的NLP任务带来更好的效果和样本效率。在某些场景中,模型规模对于模型的效果可以通过scaling laws预测。但是,某些下游任务的效果并没有随着规模的上升而改善。 本文讨论了大规模语言模型的涌现能力(Emergent Ability)…