读到一段关于用好奇心作为奖励去训练自主体玩游戏的观察。突然就闪现到姜峯楠的科幻小说里了。
#读书笔记
#人机对齐
在《超级马里奥》的第一关有一条沟,自主体几乎不可能知道如何跨越,因为这要求自主体连续15帧按住跳按钮。长序列的精准动作比短动作难学得多。因此,自主体到达悬崖边上只会往回走。
“所以他没法过去”,帕塔克说,“就像死胡同,世界的尽头。”但是游戏的设计是不能往回走。自主体进退两难,学会了什么也不做。
帕塔克观察到,还有一种更普遍的厌倦。在他的自主体玩《超级马里奥》很多回后,“它干脆直接停留在起点……因为任何地方都没有收益——游戏里的一切都不再让它好奇——所以它学会了哪里都不去”。自主体只在游戏起点处闲逛,没有动力做任何事情。
这甚至有点让人伤感。人类厌倦了会停止游戏,而且通常可以停止。我们可以换新游戏,或者干脆关掉显示器,去玩其他的。而自主体则被残忍地困在一个它不再有任何动力去玩的游戏里。