https://www.jiqizhixin.com/articles/2023-11-07-4
之前我也有这种llm代替rl来让agent玩游戏的想法 这么快有人做了
艸,本来以为这块应该是强化学习的天下。
nth233 我感觉llm agent就是真的可以替代强化学习的。一方面能增强可解释性,一方面只需要一个llm就能做到所有事这个真的听着很爽
aaa
真的是所有行为都能用线性的语言描述出来吗?
不过做这个研究应该确实很爽。
nth233 xs 我也想