Генеративно змагальна мережа

ЕНКОДЕР — вхід (УКР)

ДЕКОДЕР — вихід (ENG)

На кроці «Токенізація» речення розбивається на токени з маркерами [BOS]/[EOS].
На кроці «Embedding» кожен токен стає вектором 512 вимірів + позиційне кодування (синусоїди).
«Енкодер» — натисніть на різні токени джерела й спостерігайте, як змінюється матриця self-attention. «Мій» найбільше дивиться сам на себе, але також на «котик» — адже присвійність прив'язана до іменника.
«Cross-attention» — найцікавіший крок: декодер (англійська сторона) «читає» енкодер. Натисніть на різні токени виходу і побачите, хто на кого дивиться: «cat» → «котик» (82%), «beautiful» → «красивий» (82%). Саме тут відбувається вирівнювання між мовами.
«Декодер» показує три підшари: masked self-attention (бачить лише попередні токени), cross-attention (читає енкодер), FFN (повнозв’язна мережа прямого поширення).
«Генерація» демонструє softmax розподіл — «My» отримує 94% при першому кроці.

Інтерактивна демонстрація Трансформера Encoder-Decoder