Optimiser les transferts de données
Sans shared
Par exemple, transformation 2D → 1D. Accès dans A non coalescent, accès dans B coalescent. Utilisation de sharde memory.
Conversion matrice 2D en mémoire 1D
Avec shared
Utilisation de tiles pour charger la mémoire globale dans la shared
Utiliser les tiles
exemple_matrice_multiplication.txt · Dernière modification: 2014/09/19 20:37 par gbdivers