Ceci est une ancienne révision du document !
Chapitre précédent | Sommaire principal | Chapitre suivant |
---|
Un nombre aléatoire est un nombre dont la valeur est choisit au hasard. Ils sont utilisé dans de nombreux contextes, par exemple dans un jeu vidéo (pour avoir un comportement non prédictible), en cryptographie (pour encoder des informations), dans les tests automatisés du code (pour vérifier le comportement d'un programme avec des valeurs indéterminées). Vous verrez dans différents projets de ce cours des cas d'utilisation des nombres aléatoires.
Tirer des nombres aléatoires peut sembler être une tâche facile. On peut par exemple prendre un dé de jeux (non pipé) à six faces et le lancer plusieurs fois pour obtenir une série de nombres aléatoires compris entre un et six. On peut également lancer une pièce de monnaie pour obtenir des nombres aléatoires valant zéro (Pile) ou un (Face).
La difficulté vient du fait qu'il est facile d'obtenir des suites de nombres dont on n'arrive pas à prédire la prochaine valeur, mais qui présente quand même des propriétés mathématiques prédictibles. Si on additionne par exemple la valeur de deux dés, on aura un nombre aléatoire compris entre 2 et 12. Mais la probabilité d'obtenir un 12 est bien inférieure (1 chance sur 36) à la probabilité d'obtenir un 7 (12 chances sur 36).
Quand vous jouez à un jeu de société, ce n'est pas très important que les nombres obtenus ne soient pas parfaitement aléatoire (et c'est de toute façon intégré comme composante du jeu). Mais lorsque les nombres aléatoires permettent de crypter des données importantes ou sécuriser une numéro de carte bancaire, la moindre propriété mathématique prédictible sur une série de nombres aléatoires peut permettre de contourner ces sécurités.
Il ne faut donc pas simplement que les nombres semblent aléatoires. Il faut le prouver mathématiquement. (Et bien sûr, cela sort complètement du domaine de ce livre, ces sont des travaux de recherches très pointus).
Pour en revenir à la programmation, on peut se poser une question : comment générer des nombres parfaitement aléatoires sur un ordinateur ? Ce n'est pas si simple, puisqu'un ordinateur est prévu pour être parfaitement prédictible (la même suite d'instructions avec les mêmes données produira le même résultat).
Heureusement, il existe plusieurs approches possibles.
La bibliothèque standard fournit plusieurs fonctionnalités pour générer des nombres aléatoires, en utilisant différents algorithmes. L'ensemble de ces fonctionnalités sont accessibles en utilisant le fichier d'en-tête random
(“aléatoire” en anglais).
#include <random>
La documentation est accessible en ligne sur cppreference.comm: Pseudo-random number generation, n'hésitez pas à vous familiariser un peu avec elle avant de continuer ce chapitre.
Les fonctionnalités de génération de nombres aléatoires se décomposent en trois catégories :
Si vous travaillez sur du code qui a besoin d'un générateur le plus aléatoire possible, il faudra vérifier le fonctionnement du générateur ou utiliser une bibliothèque dédiée à la génération de nombres aléatoires pour la cryptographie (ces générateurs sont plus lents que les générateurs utilisés dans la bibliothèque standard, ce qui explique pourquoi ils ne sont pas utilisés par défaut).
L'utilisation d'un générateur aléatoire est relativement simple, même si cela utilise une syntaxe que vous n'avez pas encore vu. Il faut créer une variable utilisant le générateur comme type, puis appeler cette variable comme une fonction. On parle d'“objet appelable” (callable en anglais). En pratique, la syntaxe est la suivante :
CallableType myVariable{}; // créé une variable de type CallableType auto result = myVariable(arg1, arg2); // appel cette variable comme une fonction
Le type CallableType
représente n'importe quel type qui permet de créer un objet appelable. Comme n'importe quelle fonction, un objet appelable peut prendre des arguments en entrée et retourner une valeur.
Le générateur non déterministe est la classe std::random_device
. Cet objet sera appelé sans utiliser d'argument, et retourne un entier aléatoire à chaque fois qu'il est appelé.
#include <iostream> #include <random> int main() { std::random_device rd{}; // création du générateur std::cout << rd() << std::endl; // génération d'un nombre aléatoire std::cout << rd() << std::endl; // génération d'un nombre aléatoire std::cout << rd() << std::endl; // génération d'un nombre aléatoire }
Ce code permet de générer trois nombres aléatoires, qui seront différents à chaque fois que vous relancez le programme. Par exemple, cela peut donner la série suivante :
3555021123 4089866385 3885819577
Par exemple, sur Coliru, à chaque fois que le programme est relancé, il va générer la même suite de nombres aléatoires. Le même code sur Ideone va produire des nombres aléatoires différents à chaque fois que le programme est lancé.
Pour savoir si le générateur non déterministe est effectivement non déterministe ou pas, il faut afficher l'entropie en utilisant la fonction entropy
:
#include <iostream> #include <random> int main() { std::random_device rd; std::cout << "Entropy: " << rd.entropy() << std::endl; }
Si la valeur affichée est nulle, alors le générateur est déterministe.
Le problème de ce générateur est qu'il n'est pas possible de prouver qu'il a un comportement parfaitement aléatoire, qu'on ne peut prédire aucune caractéristique mathématique sur la série de nombres générés. On préférera donc généralement les générateurs de nombres aléatoires déterministes.
Un générateur déterministe produit des nombres aléatoires selon un algorithme complexe donné. Ce type de générateur prend en argument une graine (seed en anglais), qui définie la série de nombres aléatoires à générer. Utiliser deux fois la même graine produit la même série de nombres.
Dans de nombreux cas, on ne souhaite pas utiliser une graine en particulier, on voudra avoir une série différente de nombres aléatoires, à chaque fois qu'on lance une application. Par exemple :
Mais dans certains cas, il sera intéressant d'utiliser une graine connue. Un exemple classique est un programme de test de code, qui détecte une erreur en utilisant une série spécifique de nombres aléatoires. Pour reproduire l'erreur, on pourra générer la même série de nombres en utilisant la même graine.
Pour créer un générateur en utilisant une graine, il suffit de mettre cette graine comme argument lors de la création du générateur. (Note : il existe plusieurs générateurs déterministes, qui seront vu par la suite. Pour le début de ce cours, nous allons utiliser le générateur std::default_random_engine
).
std::default_random_engine engin { seed };
Ce code créé une variable nommée engin
, de type std::default_random_engine
et initialisé avec la valeur seed
.
Pour générer les nombres aléatoires, il faut ensuite appeler la variable engin
comme une fonction, comme vous avez fait pour random_device
:
#include <iostream> #include <random> int main() { std::default_random_engine engin { 123 }; // création du générateur std::cout << engin() << std::endl; // génération d'un nombre aléatoire std::cout << engin() << std::endl; // génération d'un nombre aléatoire std::cout << engin() << std::endl; // génération d'un nombre aléatoire }
affichera :
2067261 384717275 2017463455
Remarque : cette série de nombres est déterministe, ce qui veut dire que si vous utiliser le même générateur et la même graine que dans le code, vous devriez avoir exactement la même série de nombres aléatoires (contrairement au random_device
, pour lequel vous pouvez avoir un résultat différent que celui donné dans le cours).
Pour générer une série en utilisant une graine qui change a chaque fois que le programme est lancé, il est classique d'initialiser le générateur avec le temps (ce qui garantie que la graine change à chaque fois). Par exemple :
#include <iostream> #include <random> #include <chrono> int main() { const auto seed = std::time(nullptr); std::cout << seed << std::endl; std::default_random_engine engin { seed }; }
La fonction std::time
retourne le temps passé depuis une date fixée (généralement 1970), en secondes.
De même, si on sait à peut prêt quand un nombre aléatoire a été généré, on peut retrouver plus facilement la graine qui a été utilisée et la série de nombres aléatoires.
Dans un programme critique, par exemple en programme d'encodage de données importantes, cela constitue des failles de sécurité. On voit ici qu'il est finalement assez facile, si on ne fait pas attention, de rendre prédictible un générateur et donc de créer des failles de sécurité dans un programme.
L'utilisation d'un générateur aléatoire de qualité n'est pas suffisant, il faut aussi l'utiliser correctement.
Pour des applications qui nécessite un niveau de sécurité élevé, on utilisera à la place des générateurs dédiés à la cryptographie.
Plusieurs générateurs déterministes sont proposés dans la bibliothèque standard du C++. Ces générateurs sont définies par l’algorithme utilisé et par les valeurs utilisées pour le configurer. Pour comprendre cela, regardons un peu plus en détail la documentation : Pseudo-random number generation.
Trois algorithmes de génération sont utilisé. La documentation donne des liens vers les pages de Wikipédia décrivant ces algorithmes.
std::linear_congruential_engine
: algorithme congruentiel linéaire ;std::mersenne_twister_engine
: algorithme de Mersenne Twister ;std::subtract_with_carry_engine
: algorithme de soustraction avec retenue.
Il existe ensuite trois adaptateurs, qui permettent de modifier un autre algorithme. Les adaptateurs de la bibliothèques standard sont :
std::discard_block_engine
;std::independent_bits_engine
;std::shuffle_order_engine
.Et pour terminer, les différents générateurs proposés par défaut, à partir de ces algorithmes et adaptateurs :
std::minstd_rand0
;std::minstd_rand
;std::mt19937
;std::mt19937_64
;std::ranlux24_base
;std::ranlux48_base
;std::ranlux24
;std::ranlux48
;std::knuth_b
.
Ces générateurs s'utilisent de la même façon que le générateur std::default_random_engine
cité précédemment. Par exemple, pour std::ranlux48_base
, avec une graine fixe :
#include <iostream> #include <random> int main() { std::ranlux48_base engin { 123 }; // création du générateur std::cout << engin() << std::endl; // génération d'un nombre aléatoire std::cout << engin() << std::endl; // génération d'un nombre aléatoire std::cout << engin() << std::endl; // génération d'un nombre aléatoire }
affiche :
52617863149155 181669238551779 228994550894105
Comment générer un nombre aléatoire en pratique ?
Au final, cela fait beaucoup d'algorithmes à utiliser, vous ne savez probablement pas quel algorithme utiliser parmi tous les générateurs proposés. La réponse est simple :
std::default_random_engine
;Dans les générateurs précédents, chaque valeur possible à la même chance d'apparaître (équiprobable). Dans de nombreuses situations (probablement dans la majorité des situations), on a besoin de restreindre le domaine de définition des nombres générés (par exemple, générer des nombres entre 0 et 10) ou d'avoir des probabilités différentes pour chaque valeur (par exemple, pour des nombres compris entre 0 et 1, plus une valeur est proche de 0, plus elle aura de chance d'apparaître).
Par exemple, si vous avez un jeu de 32 cartes et que vous souhaitez en tirer une au hasard, il faudra générer un nombre compris en 1 et 32. Si vous avez un personnage dans un jeu vidéo contrôlé aléatoirement, qui ne peut se déplacer que dans quatre directions, vous devrez générer un nombre aléatoire qui ne peut prendre par exemple que les valeurs 0 (monter), 1 (descendre), 2 (aller à droite) ou 3 (aller à gauche). Ce type de distribution est uniforme, chaque valeur à la même probabilité d'apparaître.
D'autres exemples. Si vous créer un jeu de simulation de courses de voiture et que le joueur tourne de 10°, dans le monde réel, ça ne sera pas exactement 10°, mais 10° plus ou moins une erreur (due à l’imprécision du volant, des imperfections de la route, etc). Dans le jeu, pour avoir plus de réalisme, on peut modifier l'angle avec une erreur, pour obtenir par exemple 10.2° ou 9.9°. On pourra avoir des valeurs très différentes de 10°, par exemple 12° ou 8.5°, mais cela sera beaucoup plus rare. Pour simuler cela, on va utiliser une distribution normale.
La bibliothèque standard du C++ contient d'autres distributions que les distributions uniformes et normale. Vous pouvez avoir le détail dans la documentation pour les fonctions à utiliser et sur Wikipédia pour les explications sur les propriétés des distributions. Dans la majorité des cas, les deux distributions citées seront suffisantes, nous verrons que cela là dans la suite du cours.
Il existe deux distributions uniformes et une normale :
std::uniform_int_distribution
pour générer des nombres entiers selon une loi uniforme ;std::uniform_real_distribution
pour générer des nombres réels selon une loi uniforme ;std::normal_distribution
pour générer des nombres réels selon une loi normale.Ces générateurs ne sont pas à proprement parlé des générateurs de nombres aléatoires. Ils prennent en fait l'un générateur aléatoire vu précédemment pour générer un nombre respectant une loi donnée. Ce ne sont pas non plus des adaptateurs, comme ceux vu précédemment, puisqu'ils ne modifient pas le comportement des générateurs aléatoires. Ces générateurs de distribution prennent simplement un générateur en paramètre et l'utilise en interne pour générer des nombres.
La création d'un générateur de distribution se fait en deux étapes :
Pour initialiser une générateur de distribution, il faut créer une variable en utilisant le type de générateur que vous souhaitez, et en donnant les paramètres de la distribution. Ces paramètres varient selon le type de générateur :
ajouter une figure
Le code C++ correspond est relativement similaire à ce que vous avez déjà vu.
#include <random> #include <iostream> int main() { std::uniform_int_distribution<> uniform_int(0, 10); // loi uniforme sur des entiers std::uniform_real_distribution<> uniform_real(-1, 1); // loi uniforme sur des réels std::normal_distribution<> normal(5, 1); // loi normale }
Vous avez déjà rencontré la notation avec chevrons <
et >
dans ce cours. Dans les codes précédents, un paramètre été placé entre ces chevrons, mais ce n'est pas une obligation ici. Si les chevrons ne contiennent rien, cela signifie que le paramètre par défaut est utilisé (voir la documentation pour connaître les paramètres par défaut. Ici, les paramètres par défaut sont int
pour la loi uniforme sur les entiers et double
pour les deux autres lois). Vous pouvez utiliser un autre paramètre :
#include <random> #include <iostream> int main() { std::normal_distribution<> double_normal(5, 1); // loi normale utilisant des double std::normal_distribution<float> float_normal(5, 1); // loi normale utilisant des float }
Pour rappel, double
est un type de nombres réels double précision (généralement 64 bits) et float
est un type de nombres réels simple précision (généralement 32 bits).
Il faut bien faire la différence entre les différents types d'arguments utilisés pour initialiser une variable de type générateur de distribution.
std::normal_distribution<float> normal(5, 1);
Le type float
permet de préciser le type std::normal_distribution
. Les nombres générés seront de type float
, cette information est prise en compte lors de la compilation :
std::normal_distribution<float> normal(5, 1); const std::string value { normal(engin) }; // erreur, impossible de convertir un float en std::string
Le type passé en paramètre fait partie intégrante du type final. Le type de normal
n'est pas std::normal_distribution
, mais bien std::normal_distribution<float>
. Cela signifie par exemple que les types std::normal_distribution<float>
et std::normal_distribution<float>
ne sont pas compatibles entre eux :
std::normal_distribution<float> d1(5, 1); std::normal_distribution<float> d2 { d1 }; // ok, d1 et d2 sont de même type std::normal_distribution<double> d3 { d1 }; // erreur, d1 et d3 ne sont pas compatibles
Les valeurs 5 et 1 correspondent aux paramètres de la distribution. Elles ne sont pas utilisées lors de la compilation, mais uniquement lors de l'exécution.
La dernière étape est la génération d'un nombre aléatoire selon une distribution. Les générateurs de distribution sont des objets-fonctions, comme les générateurs aléatoires. Pour rappel, cela signifie que l'on peut appeler la variable comme une fonction :
std::normal_distribution<float> normal(0, 1); // initialisation const auto value = normal(engin); // génération
Contrairement aux générateurs aléatoires qui ne prennent pas d'argument, les générateurs de distribution prennent en argument le générateur aléatoire à utiliser. A chaque fois que le générateur de distribution est appelé, il appelle en interne le générateur aléatoire pour générer un nombre aléatoire, puis l'adapte en fonction de la distribution.
Pour résumer l'utilisation des générateurs de distributions, ceux-ci utilisent trois sources d'information pour générer un nombre :
value
avec auto
) ;Au final, vous devriez avoir un code similaire à cela pour générer un nombre aléatoire (adapter selon le type de distribution) :
#include <iostream> #include <random> #include <chrono> int main() { const auto seed = std::time(nullptr); // génération de la graine std::default_random_engine engin { seed }; // générateur aléatoire std::normal_distribution<float> normal(0, 1); // générateur de distribution std::cout << normal(engin) << std::endl; // génération }
1. Donner une série de nombres aléatoires, produit avec un algo (donné ou non), une graine comprise entre 0 et 100. Essayer de retrouver la graine/algo probablement à faire plus tard, après les boucles et tests
2. exos : proposer des exos avec fonctions de calculs et affiche déjà écrit
Chapitre précédent | Sommaire principal | Chapitre suivant |
---|