一个抽象的统计问题

来源:百度知道 编辑:UC知道 时间:2024/09/21 16:39:34
对于一个样本空间 如何得到其中某一特定样本的上限和下限.

现实中比如我们想知道所有人中喜欢黄颜色人的概率,我们会有一个预期,然后一个实际值.如果想知道我门的这个实际值是否具有普遍性,那么就需要一个上限和下限.

如何得到这个上限和下限呢?
请大家给个思路.最好有个模型,谢谢.

首先做充分调查,例如以二十个人为一组,看其中有几个人喜欢黄色,然后做二十组调查(共四百个样本数据),但我觉得二十个人一组可能会太少了,可以看实际情况而定,但至少要保证不要在很多组中都出现零.或者你先调查五百人,再随机分组.
每一组可以看作是一个样本,按组号划分在X轴上,Y轴则是每一组中喜欢黄色的人数,作图.(这时假如你有足够知识条件的话还可以对这些数据进行插值,即增加坐标中的点数)然后对这些点进行曲线拟合.再观察图形,再找任何一本概率书,看这个图形与哪个概率分布接近(如离散统计中的泊松分布,威布尔分布,或连续统计中的指数分布,正态分面,卡方分布等等),然后选择一个作为你的模型(对于个人喜好这类随机事件我感觉是服从正态分布,但不一定,样本数据较小时也可能会表现为服从威布尔分布).
接着首先对你的数据在该模型上进行拟合度估计,对于不同的模型都有不同的计算公式,可以去查概率与数理统计的书.在进行拟合度估计时一般把最后算到的拟合度值取百分之九十作为接受范围,即当算到的拟合度大于百分之九十时就认为该模型可行,否则采用另外一种模型.
确定好模型后再对模型中的一些参数进行点估计,一般用L估计,即最大似然估计,有时间的话还可以算出它的最小无偏估计(也可以查阅相关书籍直接找公式,咱们重在应用,而不是理论论证),例如指数分布中的参数不清ramda,或正态分布中的miu,xigema,这样就初次完全确定了你的模型.
最后再对确定的模型进行区间估计,如取概率值为百分之三十对应的(人群中喜欢黄色的概率)为估计下限,百分之七十对应的为上限.
这就得到了结果.
但不是完美的.
还应该再次检验.即用你采用的模型进行一次估计,然后再次调查,看它和这一次调查有多大区别(当然不可能是一致的),也应该先设一个接受范围(可以设成百分之七十五,小样本的不能太大.)(具体操作参阅概率书).假如偏差很大的话(超出了你的接受域),就要考虑使用先验公式(概率术语)对你的模型进行修正,从而得到后验模型.再利用这个模型进行上下限的估计,这就是更好一些的结果.
当再次进行调查时,结果就更好.
从理认上可以证明这种方式是无限趋近于现实的(其实也很容易理解).
没有最好,只有更好!

(附:对于实际应用