那我们来看一下联合PDF有没有些例子呢 我们来看一下 假设我们来看等公车的这个例子 假设小美等公车的时间X 我们用X表示小美等公车的时间 小园呢他到公交站牌等公车这时间是Y 这个X跟Y 小圆跟小美这两个 好 因为 小圆才是真正是好兄弟啊 对不对 他这个 你看前面这两个 他跟小美下线的时间完全都是没有关系的 是independent 对不对 他非常不屑于小美 所以 他完全都不想跟她生活有任何搭咖 所以这个生活是完全independent 所以呢 包括这个等公车的时间 他们两个人也不会说一起去等公车什么 他们各自生活是独立的 所以 等公车的时间是完全独立的 然后呢 他们在等公车都是 他们公车都是0到10分钟 平均等车子时间都是0到10分钟都有可能 都机会均等 而且是个连续的概率分布 所以呢 他们不管是谁去等公车都是 0到10分钟等的任何长度机会都是均等的 那这种情况下 你看看 那X跟Y 是不是它们的概率密度 有没有哪一个点 你想想看它有没有可能 如果这里有个点在这边 就是这个地方 这个X就是小美等车超过10分钟 比如这个点是(12, 8)我问你 这个点有没有可能发生 就是 小美等车等了12分钟 小园等车等了8分钟 这不可能嘛 因为刚才有讲过X跟Y它们两个的概率分布都是0到10分钟之间 对不对 所以你看 这一点是不是就很清楚 它的这个(12, 8)这一点呢 你看 它的概率密度上面就是空的就是0 就趴在地上 对不对 但是 你看这一点 如果是这一点的话 比如说是(5,5)这一点 小美等车等了5分钟 小圆等车等了5分钟 这一点 它的发生有没有机会发生呢 是有机会会发生的 因为 你看两个都落在0跟10之间 对不对 但是老师问你 这在(5,5)这点发生的机会跟这一点 比如说这一点是 这个(2,3) 在(5,5)这点跟(2,3)这一点 这两点发生的机会有没有道理说哪一点可能发生 哪一点比较可能发生哪一点比较不可能发生 其实没有啊 因为X跟Y在它们在(0,10)之间都是机会均等 没有什么道理说 (5,5)这点比较容易发生或者说(2,3)这点比较容易发生 对不对 所以呢在这两点的概率密度应该怎么样 都是平的 都是一样的 事实上我们可以 从这样推论来看 我们可以发现说在这一个 10*10这个方形里面 没有一个点 没有说哪一个点它发生机会比较大 事实上每一个点发生机会都均等 所以这也就为了你看到 在这个例子里面 它的概率密度函数那个曲面是个平的 因为不管任何一个点你的f(x,y) 只要你落在10*10这个方块里面的话 你的概率密度呢 都是1/100 这是为什么它都是平的 但老师要给你讲一下 要注意哦不是说PDF 这个一定都是平的 不一定 给你看个例子 比如说 只是另外一个 这个Bivariate Gaussian是另外一种2D的PDF 一种常见的例子 你看它就像一个 像个什么 像个青春痘一样 有没有 像个痘子肿起来一样 像老师最近弄这个课都常常熬夜就 脸上常会长痘子 这痘子有没有 这个痘子你看它有没有平的 就没有平的嘛 对不对 所以这个呢要记住 不是说PDF都是平的 很多时候它可能不是平的 那我们刚才呢在讲这个discrete这个(x, y)的时候 我们提到说如果你有这个discrete 这个(x,y)这两个random variable的joint PMF的话 那它们两个的联合概率分布就被决定了 对不对 那同样的 如果你的(x, y)是连续的 那也是一样 连续的话只要人家给你什么 你的联合概率分布就决定了 没错 就是人家只要给你这个联合的joint PDF的话 因为它是联合PDF (x, y)的话 (x, y)的联合概率分布呢也就被决定了 ok 那刚刚前面有提到 就说 这个joint PDF 联合的PDF跟联合的CDF 这两个其实是有关系的 这个F(x, y) 如果人家给你这个f(x, y)的话 你只要把它积分 把它积分积起来你就可以得到 对x y都要积分你就可以得到F(x, y) 相反的 人家给F(x, y)你只要把它 对x y分别做一次偏微分 你就可以得到什么 你就可以得到f(x.y) 所以这两个是互通的 给你哪个一个都会另外一个 所以不管给你哪一个 这个Joint的概率分布呢就完全的决定了 ok 那这个Joint PDF它有一些性质 什么性质呢 比如说 我们以刚才前面那个例子 有没有 这个等公车这个PDF为例子来看 第一个 PDF值都一定大于等于0 你看看这个图 这个图上面的这个PDF值不是趴在平面上 PDF=0 不然就是 高起来的 都是大于等于0的 所以这是Joint PDF的一个重要的性质 就跟我们一维PDF一样 一维PDF是不是也是一定要大于等于0呢 也是嘛 对不对 第二个是什么 整个Joint PDF你把它从-∞积到∞大 -∞到∞大 对x对y分别从-∞到∞积起来 积起来这个值会等于多少 会等于1 那这个呢跟我们一维的PDF也是很像 一维的PDF你如果你把x从-∞到∞ 积起来是等于1 也是的 所以你看看 以这个例子来看的话 这个图这个例子看 它的这个平面高度是多少 是1/100 你如果把它整个PDF值不等于0的区域 10*10这个长方形 你要把整个积起来的话 这整个积起来值是多少 就100 * 1/100 刚好也是1 所以概率就是这个体积 这个体积就代表这个概率 你记得以前一维的PDF积分出来变面积 面积代表概率 现在是二维的PDF积分积出来 代表是体积 那个体积代表就是概率 然后整个从-∞积到∞ -∞积到∞积起来会等于1 这是个很重要的性质 另外呢 刚才不是有了吗 就是两个x跟y 如果两个是独立的话它们Joint PMF 会等于各自的PMF相乘 对不对 在这边呢 Joint PDF也是一样 如果两个x,y是independent的话 它们的Joint PDF会等于各自的PDF相乘 那这个你如果要证的话也是用概率的近似式 有没有 就用这个PDF 我们刚才讲这个PDF是来自什么 来自于落在那个小区间的小方块的概率 去除以△x △y嘛 你可以把它拆成 如果是independent的话 落在那个小区间的区域 就等于是x落在(x,x+△x )的概率乘上 y落在(y,y+△y)的概率 然后再除以 所以这个东西 利用刚才的这种方式 利用概率的独立性你也可以推导出 概率密度会等于它们各自相乘 另外呢 对于任何事件B 我们刚才讲 像前面的PMF事件B就是平面上的某个区域 对不对 那对于任何事件B 你的B发生的概率之前是summation 把那个x在B那个区域 discrete case 是把 在B那个区域里面的点的概率值把它summation起来 对不对 现在呢如果是连续的话 上个礼拜老师有讲过很多在discrete是summation的东西 在连续的case的话就把它变成积分 所以呢 就是把落在B那个区域里面的那些点的PDF把它积起来 什么意思呢 以这个图为例子 比如说我的B是这个区域 我想要算这个区域发生的概率 这个事件发生的概率 那事件发生的概率是什么 就是把落在B这里面的点(x,y)去积分 就把f(x,y)就是在B那个范围去做积分 也就是做这个区域的这个积分 所以你积分积出来结果会是应该是 就是一个圆锥体 这圆锥体的体积代表的就是这个事件的概率 因为一直在那个B上面去对f(x,y)那个曲面去做积分嘛 所以呢这个式子 你如果微积分不是很了解 没关系 反正文科的同学或者是高中生 你如果积分还没学 你就先记住这个式子就好 以后你就会用 那理科的同学 你可能就要了解这个事情了 最后我们来回顾一下这一节 这一节一开始我们来介绍的是什么 我们介绍什么叫做Joint的概率分布 为什么我们要考虑Joint的概率分布 为什么要考虑Joint的概率分布 就是因为你只看一个R.V.的PDF的时候 你其实有很资讯是看不到的 比如说 像小华跟小美的这些关系 这个下线的联动的关系 这个是你看不到的 这一定要两个随机变量一起看 它们联合概率分布你才得出这些里面的微妙之处 所以这就是为什么我们要考虑联合概率分布 这个是为什么 另外呢 联合PMF是什么 如果你x跟y 如果是discrete 我们就要看它的Joint PDF(疑口误 应为Joint PMF) 就是X=x且Y=y的概率 Joint PMF 那有了Joint PMF后我们就引申进来那Joint CDF是什么 Joint CDF就是X≤x且Y≤y的这个概率 这个东西呢Joint CDF要记住 它不是只有discrete的x, y可以用 同样的 这个定义可以套用在连续的x y的这种随机变量上面 对不对 最后呢我们探讨说 那如果你x y是连续的话 你想要分析它 在某一点发生这个机会大或是小的话 你就要用这个Joint PDF概率密度 那这个 很多概率是跟我们一维的PDF很像 是把它延伸过来到二维的case ok 这就是我们的第一个部分在讲联合概率分布