>>141
そこはAttentionのトークン長の問題なので別手法が見つかればそれなりに整合性は取れるはず
まぁ論理的帰結がすぐひっくり返ったりするのは厄介なんだけど