如何在 R 中使用多项分布
多项分布:可以看成是二项分布的推广。多项分布定义为当单个计数具有特定发生概率时确保特定计数的概率。
让我们考虑一个示例,其中随机变量 Y 具有多项分布。然后,我们可以借助以下公式计算结果 1 恰好 y 1次、结果 2 恰好 y 2次、结果 3 恰好 y 3次的概率。
Probability = n! * (p1y1 * p2y2 * … * pkyk) / (y1! * y2! … * yk!)
Here,
n: It represents the total number of events
y1: It signifies that the number of times the outcome 1 will take place
y2: It signifies that the number of times the outcome 2 will take place
……………………………..
……………………………..
……………………………..
yk: It signifies that the number of times the outcome k will take place
p1: It represents the probability of the outcome 1 occurs for a given trial
p2: It represents the probability of the outcome 1 occurs for a given trial
……………………………..
……………………………..
……………………………..
pk: It represents the probability of the outcome k occurs for a given trial
dmultinom()函数:用于计算多项式概率。
Syntax: dmultinom(x=c(parameter1, parameter2, parameter3), prob=c(parameter4, parameter5, parameter6))
Here,
- x: It represents a vector that stores the frequency of each outcome
- prob: It represents a vector that stores the probability of each outcome (the sum must be 1)
示例 1:
举行了总统选举,有三名潜在候选人。第一位候选人获得了20%的选票,第二位候选人获得了30%的选票,第三位候选人获得了50%的选票。如果随机选择 20 名选民,确定 4 人投票给第一个候选人、6 人投票给第二个候选人、10 人投票给第三个候选人的概率?
R
# Compute the multinomial probability
dmultinom(x=c(4, 6, 10), prob=c(.2, .3, .5))
R
# Compute the multinomial probability
dmultinom(x=c(2, 0, 0), prob=c(.3, .5, .2))
输出:
恰好有 4 人投票给第一个候选人,6 人投票给第二个候选人,10 人投票给第三个候选人的概率是 0.04419421。
示例 2:
假设一个袋子里有 3 个红球、5 个黑球和 2 个蓝球。假设从袋子里随机选择两个球,放回,两个球都是黑色的概率是多少?
R
# Compute the multinomial probability
dmultinom(x=c(2, 0, 0), prob=c(.3, .5, .2))
输出:
所有两个球都是黑色的概率等于 0.09。