Study 今日こそ理解するKLダイバージェンス はじめに 機械学習や物理などの勉強していて、ことあるごとに出てくるのがKLダイバージェンス。 重要そうなのはわかるのですが、式の意味も複雑で直感的な意味もわかりにくくて非常に厄介です。 情報理論から考えると、ほんのちょっとだけわかった気にな... 2025.04.22 Study
Programming 【PyTorch】nn.Transformerのsrc_maskとsrc_key_padding_maskの違い PyTorchのnn.TransformerEncoderLayerにおける、src_maskとsrc_key_padding_maskの挙動の違いについての備忘録です。 2024.02.15 Programming