架构

具体细节

怎么实现的Python Tool?

如何判断动作ai是否调用了某个工具

训练中屏蔽观测token

$$ τ = {a0, o0, . . . , an−1, on−1, an} $$