Table des matières

Optimiser les transferts de données

C = A * B

Sans shared

Par exemple, transformation 2D → 1D. Accès dans A non coalescent, accès dans B coalescent. Utilisation de sharde memory.

Conversion matrice 2D en mémoire 1D

Avec shared

Utilisation de tiles pour charger la mémoire globale dans la shared

Utiliser les tiles