SoA (structure of array) et AoS (array of structure)
Impact sur l’occupation mémoire, sur les performances, sur la précision des résultats (stabilité algorithmique). Nombre cores disponibles selon la précision (utiliser deviceQuery) et l’architecture. Minimum capacité CUDA 1.3 ou supérieure.
Comment changer la précision sur CUDA ?
En utilisant les options de compilation de PTX (nvcc). Minimum pour la double précision : Compute Capabilities 1.3. Compiler le code CUDA avec « sm_13 ».
« map_f64_to_f32 » permet de forcer l’utilisation en 32 bits lorsque le GPU ne supporte pas la double précision.
Améliorer la ré-utilisabilité en utilisant les options de compilation
Error-correcting code (ECC) : correction du code pour éviter les erreurs. Pas sur tous les processeurs. Impact sur l’occupation mémoire, sur les performances, sur la précision des résultats (stabilité algorithmique). Teste par cudaDeviceProp.ECCEnabled