返回所有测验引导式测验 级别6 问题

线性注意力和表演者内核测验

测试您对线性注意力以及 Performer 如何有效逼近 softmax 的理解。

问题 1 6正确: 0

为什么标准的 softmax 注意力随序列长度的变化很差?