[AUDIO_VIDE] Bonjour. Je vous rappelle tout d'abord que dans le cours deux, nous avions étudié des couples de variables aléatoires à valeur discrète, et nous nous étions intéressé aux liens, aux corrélations, entre les deux coordonnées du couple de variables en introduisant ce que nous avions appelé des lois conditionnelles de l'une des variables aléatoires par rapport à l'autre. Ici, nous allons nous intéresser à ce même type de questions mais dans le cadre de variables aléatoires à valeur réelle quelconque, et nous avons dès le départ, supposé, enfin décidé de supposer que le vecteur aléatoire était un vecteur avec une loi à densité sur R, R au carré. Notre question ici est de définir une notion de loi conditionnelle pour chacune des coordonnées du vecteur aléatoire. Je vous précise le contexte dans lequel nous allons travailler, nous nous donnons donc un couple de variables aléatoires, dont la loi a une densité, donc le couple je l'appelle X, Y, et la densité s'appelle f(x, y) comme précédemment. Nous avons vu également précédemment, que dans ce cas, les deux coordonnées X et Y, du couple de variables aléatoires, avait une loi à densité et je vais noter f indice X et f indice Y les densités marginales de X et Y. Maintenant je voudrais définir une notion de loi conditionnelle. Alors, le problème est très facile à voir. Je vous rappelle que dans le cas discret on avait défini la loi d'une des coordonnées, par exemple de Y, sachant que la variable aléatoire X prenait une valeur xi, donnée, fixée. Mais nous savons que X est une loi qui admet une densité, et nous avons vu que pour une loi à densité, eh bien la probabilité d'avoir X égale une valeur x fixée, est égale à zéro. Donc en fait, on ne peut pas réaliser des événements aléatoire de la forme X égale une certaine valeur, précises. Donc que veut dire le conditionnement par rapport à une telle information? Donc c'est une question que l'on peut se poser et qu'on va résoudre par la proposition suivante, qui va nous donner un élément de réponse à une manière de modéliser le conditionnement. Alors, on ne peut pas suppose que x est tel que la probabilité d'avoir X égale x est positive, puisque cela n'est jamais vrai, mais on va considérer un x tel que la densité de X est strictement positive en x. Eh bien dans ce cas-là , on peut définir le quotien f(x, y), la densité du couple, sur la densité marginale de X, donc au point x. Ceci définit une fonction de y dès lors que j'ai fixé x. Je vais noter cette fonction sous la forme f indice Y sachant que X égale x, et je vais appeler cette quantité-là densité conditionnelle de grand Y sachant X égale x. Hein, même si vous voyez que la probabilité d'avoir X égale petit x est nulle, comme on vient de le rappeler précédemment. Donc c'est un peu un abus de langage, d'appeler cette fonction densité de conditionnelle de Y sachant X égale x, néanmoins, c'est cet objet-là qui va nous intéresser. Alors la proposition nous dit que cette quantité-là définit donc une fonction de Y, hein, sachant que x est fixé, qui est une densité de probabilité sur r. Ca veut dire que c'est une fonction positive et d'intégrale un. Donc je vais maintenant vous justifier pourquoi on s'intéresse à ce quotien, et aussi justifier le fait qu'on a bien ici, enfin prouver la proposition, justifier qu'on a bien ici une densité. Montrons tout d'abord que f indice Y sachant X égale x est bien une densité, je vous rappelle donc que déjà c'est une, ça doit être une fonction positive, ce qui est évident puisque c'est le quotien de deux nombres ici pour x et y fixés qui sont positifs, petit f est une densité et f indice x aussi, deuxièmement, il nous faut montrer que l'intégrale de cette fonction prise en y et intégrée donc en dy, hein, ceci de moins l'infini à plus l'infini, est égale à un. Alors, cette intégrale va s'écrire comme le quotien de f(x, y) sur en fait un nombre, hein, quand petit x est fixé, ça ne dépend pas de y, donc je peux bien sûr sortir ce nombre de l'intégrale, et ici vous avez l'intégrale de moins l'infini à plus l'infini de la densité du couple f(x, y), intégré par rapport à dy. Mais je vous rappelle, enfin je vous renvois à la séance un du cours quatre, nous avons montré que cette quantité-là était exactement la densité marginale de X au point x. Donc nous avons cette quantité-là divisée par la même quantité, donc le quotien vaut bien un. Je vais essayer de vous donner une idée heuristique de pourquoi on considère ce quotien de densité pour définir la densité conditionnelle de Y sachant X égale x. Pour ce faire, je vais d'abord vous rappeler ce que nous avions vu dans le cours trois, à savoir le lien entre probabilité et densité, et nous avons vu que si nous avions une variable aléatoire X, et un réel x, en fait, la probabilité que X soit compris entre la valeur x et la valeur x plus delta x, un petit élément d'intervalle plus, et bien c'est approximativement égale à delta x fois f(x). Nous avions, vous avez vu des, même on a fait des figures là -dessus pour comprendre ce que ça voulait dire cette notion de probabilité liée à une surface, sous la courbe définie par petit f, et ça c'est un élément de surface sous la courbe. Donc maintenant, on peut faire la même chose pour un couple de variables aléatoires et de la même façon on peut montrer que la probabilité que X soit compris entre x et x plus delta x et que Y soit compris entre y et y plus delta y, eh bien ça va être approximativement égal à f(x, y), la valeur de la densité couple x, y, fois delta x fois delta y, qui est la surface du rectangle engendré par les deux éléments de longueur, delta x et delta y. Maintenant moi ce qui m'intéresse, c'est le comportement conditionnel de y, sachant grand X égale petit x. Donc cette probabilité-là , là maintenant vous voyez vous avez une probabilité d'une intersection de deux événements, je vais l'écrire comme la probabilité conditionnelle de l'événement Y compris entre y et y plus delta y, sachant de X est compris entre x et x plus delta x, fois la probabilité d'avoir X compris entre x et x plus delta x. Donc là c'est juste la formule qui me dit que P de A inter B, est égale à P de B sachant A fois P de A. Donc, vous voyez que cette quantité-là , j'ai rappelé que c'était de l'ordre de delta x fois f(x), et vous voyez donc que cette probabilité conditionnelle ici va être en fait de l'ordre de, ben je vais diviser f(x, y), delta x, delta y, par f(x), delta x. Et donc, c'est de l'ordre de f(x, y), alors pardon j'avais noté, c'est f indice x ici, je vais le mettre en rouge ici comme ça on va bien le voir, c'est la densité de X, avec les notations que j'ai prises précédemment, fois delta y. Et vous voyez que ceci justifie complètement le fait qu'on ait pris comme définition de densité conditionnelle de Y sachant grand X égale x, on est défini par ce quotien, f(x, y), sur f X. Nous allons voir maintenant ce que peut nous permettre de calculer cette densité conditionnelle, en fait on a une formule très mnémotechnique qui va nous dire la chose suivante, si on considère une fonction donc qui est mesurable, positive ou bornée, hein, qui nous permet donc définie de R deux dans R, qui va nous permettre de définir l'espérance de h(X, Y), la formule mnémotechnique nous dit que cette espérance de h(X, Y) va s'écrire comme l'intégrale sur R croix R, sur R deux, de h(x, y) fois la densité conditionnelle de y sachant X égale x prise en y, fois la densité de X prise en x, dx dy. Alors bien sûr voyez qu'il y a une symétrie de jeu, j'ai oublié de le dire tout à l'heure, nous on a défini la densité conditionnelle de X, de Y sachant X égale x, on peut définir de même la densité conditionnelle de X sachant Y égale une valeur y fixée, et donc votre espérance de h(X, Y) peut aussi s'écrire comme un intégral de h(X, Y) densité conditionnelle de X sachant que Y = y prise en x fois densité de Y prise en y, là on a la densité marginale de Y, dydx. Alors biensûr suivant les cas, et suivant les formules explicites qu'on a sur chacune des densités, ça sera plus utilise d'utiliser la première ou la deuxième formule. Vous voyez que ce sont des formules mnémotechniques, sachant que vous avez densité de y sachant x fois densité de x, ou densité de x sachant y fois densité de y. Alors la preuve de ce résultat est immédiate parce que vous savez que l'espérance de h(X, Y) c'est l'intégral de h(x, y) fois la densité du couple f(x, y) fois dxdy, et il suffit de remarquer, c'est immédiat, à partir de la définition, que f(X, Y) c'est le produit de la densité conditionnelle Y sachant X = X fois la densité de X. Ou, en changeant les rôles de X et Y, le produit f(X) sachant Y = Y fois densité marginale de Y. Donc cette preuve est immédiate. Nous, on a défini une densité, si on revient à la densité conditionnelle de Y sachant X = X. c'est une densité de probabilité, donc c'est lié à une loi. Donc vous pouvez vous intéresser à connaître l'espérance de Y mais sous cette loi. Nous l'avons vu depuis dès le départ quand nous avons parlé de ces idées de conditionnement, si vous conditionnez au fait que X = x bon on a vu que ça ne voulait rien dire mais que ça veut approximativement dire que X se trouve entre x et x + delta x, eh bien vous allez donner une information sur le couple de variables aléatoires, ou v.a., qui va vous changer la loi de Y si X et Y sont liés dans ce couple. Donc on va pouvoir définir l'espérance conditionnelle de Y sachant X = X comme étant l'espérance par rapport à cette nouvelle loi définie par la densité conditionnelle. Et donc, de manière immédiate, cette espérance de Y sachant X = x, va être l'intégrale de y fois cette densité conditionnelle, prise en (y)dy. Vous voyez que j'ai fixé x, et qu'ici j'ai défini une quantité à un nombre mais qui dépend de x. Donc ce nombre-là , je l'appelle psi de x. Donc en fait vous voyez que si maintenant, je fais varier x, ça me définit une fonction de x. Et pour chaque x, psi de x c'est l'espérance conditionnelle de Y sachant X = x. Alors maintenant, on va pouvoir définir la v.a. psi de X comme étant la v.a. qui, dès que X de oméga vaut x, vaut psi de x. Et c'est ce qu'on appelle l'espérance conditionnelle de Y sachant X qu'on note psi de X, qui est une fonction de X. Donc ça c'est une notion qui est déjà compliquée, là je flirte avec un cours de second niveau en probabilités, mais ça vous donne une idée d'objets un peu plus délicats qu'on peut construire, et qui vont modéliser la formation qu'on a, quand on regarde la loi d'un couple de v.a. Ici, on essaye de comprendre comment va évoluer la loi de la v.a. Y, si on a des informations sur la première coordonnée du couple de v.a., à savoir, X. Alors nous allons maintenant voir ça sur un exemple, essayer de comprendre comment on fait ces calculs d'espérance conditionnelle. On va considérer le couple de v.a. xy, dont la densité est définie ainsi : f de (x, y) est égal à (1 / x) indicatrice de 0 strictement plus petit que Y, strictement plus petit que X, strictement plus petit que 1. On va faire un dessin pour voir ce que représente cet ensemble. et donc, je vous demande de trouver les densités marginales des coordonnées X et Y, on va calculer l'espérance de Y et on va chercher la densité conditionnelle de Y sachant X = x, et en déduire l'espérance conditionnelle de Y, sachant X = x. Comparée, éventuellement, à l'espérance de Y. La densité du couple vaut 1/x indicatrice du domaine où y est strictement compris entre 0 et X, et X est lui-même strictement plus petit que 1. Donc, vous voyez que ce domaine, si vous dessinez le plan ici, il est bien il est défini par le fait alors X et Y sont positifs et Y est plus petit que X, donc ici vous avez le carré on va dire que c'est de même taille, 1, 1, et en fait, ce qu'on considère, c'est ce domaine que je hachure ici. Comment trouver les densités marginales du couple? Alors on intègre pour avoir, on sait hein, puisque le couple admet une densité et que chaque coordonnée admet une densité, et la densité de X est obtenue en intégrant f (x, y) par rapport à dy. Donc, si j'intègre en Y, eh bien 1/x c'est une constante pour Y et ce qu'on peut remarquer dans ce domaine, c'est que j'intègre Y, qui varie entre 0 et X. Et ceci ça va être vrai, donc cette densité va être non nulle pour X compris entre 0 et 1. Donc ce calcul-là , il est vrai, biensûr de toutes façons on divise par X, il faut que X soit non nul, mais on va l'avoir pour X compris entre 0 et 1. J'intègre Y entre 0 et X, et donc finalement vous voyez que F la densité de X va valoir 1 quand X est dans [0, 1]. Donc ce qu'on vient de voir, c'est que X admet une loi uniforme sur [0, 1]. Alors maintenant, je vais regarder la loi marginale de Y, donc je sais là encore par le théorème que nous avons vu, que Y admet une densité, et que cette densité est obtenue comme intégrale de F(X, Y) mais maintenant, par rapport à dx. Donc ici, si je regarde sur mon domaine, X va varier entre 0 et 1, et je vais intégrer la fonction en tant que fonction de X, 1 / X et je sais que X > Y et j'intègre en dx. Donc finalement, je vais calculer l'intégrale de Y à 1 de dx sur x, et on sait qu'une primitive de 1 / X c'est Ln de Y, j'intègre Ln de Y entre 1 et Y ça me fait Ln de 1 qui vaut 0 moins Ln de Y. Et ceci est vrai pour Y donc dans le domaine, c'est-à -dire dans [0, 1]. Donc la densité de Y, c'est- Ln de Y indicatrice de Y dans [0, 1]. Nous voulons maintenant calculer l'espérance de Y. Par définition, l'espérance de Y est égale à l'intégrale de Y multiplié par la densité de Y dy et on sait que Y varie entre 0 et 1 ici, donc nous allons avoir moins l'intégrale de 0, 1, de y Ln de Y dy, donc là on va faire un peu de calcul, on va utiliser une intégration par parties, donc on va intégrer Y, ça me donne Y² / 2, donc je vais avoir donc moins Y² sur 2, Ln de Y compris entre 0 et 1, et plus l'intégrale de 0 à 1 de Y² / 2 fois la dérivée de Ln de Y, qui est 1 / Y dy. Et donc finalement, cette espérance, donc ici le premier terme va être nul hein, puisque le Ln de 1 vaut 0, Y, log de Y tend vers 0 quand Y tend vers 0. Et le deuxième terme, ça vaut donc Y / 2 intégré entre 0 et 1, donc ça doit nous faire du 1 / 4. Maintenant, on va s'intéresser à la recherche de la loi conditionnelle de Y sachant X = x et par définition, cette loi de Y sachant X = x, où j'ai fixé un x tel que la densité est non nulle, hein, donc on va prendre un X en [0, 1], donc celle-ci, c'est le quotient de f(X, Y) sur fX(c). Je vous rappelle que la densité de X c'est juste 1 sur [0, 1] puisque X admet la loi uniforme sur [0, 1] Donc finalement, ce quotient va être égal à 1 / X qui est ici fixé x est un nombre fixé ici, fois l'indicatrice que Y est compris entre 0 et x. Donc vous voyez que cette densité conditionnelle vous caractérise la loi uniforme sur [0, X]. Alors maintenant, que vaut l'espérance conditionnelle de Y sachant X = x? Alors on peut refaire le calcul, mais là , on va réfléchir un petit peu plus astucieusement, on a vu que pour une loi uniforme, la moyenne d'une loi uniforme c'est le milieu du segment, et donc, en fait, ici, on sait que l'espérance conditionnelle de Y sachant X = x ce sera X / 2. Et donc vous voyez que ça me définit une fonction, la fonction psi de x que j'ai définie tout à l'heure elle vaut X / 2, et donc la v.a. qu'on va appeler l'espérance conditionnelle de Y sachant X, ça sera X / 2.