No último post eu mostrei como funciona o mecanismo de atenção de um Transformer, mas aquela não é a história completa. Na verdade, o mecanismo de atenção tem mais algumas nuances para capturar informações que quero discutir nesse post. Antes de continuar, recomendo que você leia o post anterior para