実況AI作成したとして
動画を見て「画面内でこの動きと音声が発生したとき草と書き込む」って事やろうとしたらどんな精度になるんやろ