資料內(nèi)容:
1. 撲克牌54張,平均分成2份,求這2份都有2張A的概率。
M表示兩個(gè)牌堆各有2個(gè)A的情況:M=4(25!25!)
N表示兩個(gè)牌堆完全隨機(jī)的情況:N=27!27!
所以概率為:M/N = 926/53*17
2. 男生點(diǎn)擊率增加,女生點(diǎn)擊率增加,總體為何減少?
因?yàn)槟信狞c(diǎn)擊率可能有較大差異,同時(shí)低點(diǎn)擊率群體的占比增大。
如原來男性20人,點(diǎn)擊1人;女性100人,點(diǎn)擊99人,總點(diǎn)擊率100/120。
現(xiàn)在男性100人,點(diǎn)擊6人;女性20人,點(diǎn)擊20人,總點(diǎn)擊率26/120。
即那個(gè)段子“A系中智商最低的人去讀B,同時(shí)提高了A系和B系的平均智商。”
3. 參數(shù)估計(jì)
用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)。
4. 假設(shè)檢驗(yàn)
參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,它們都是利用樣本對(duì)總體進(jìn)行某種推斷,但推斷的角度不同。
參數(shù)估計(jì)討論的是用樣本估計(jì)總體參數(shù)的方法,總體參數(shù)μ在估計(jì)前是未知的。
而在假設(shè)檢驗(yàn)中,則是先對(duì)μ的值提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。
5. 置信度、置信區(qū)間
置信區(qū)間是我們所計(jì)算出的變量存在的范圍,水平就是我們對(duì)于這個(gè)數(shù)值存在于我們計(jì)算出的這個(gè)范圍的可信程度。
舉例來講,有95%的把握,真正的數(shù)值在我們所計(jì)算的范圍里。
在這里,95%是置信水平,而計(jì)算出的范圍,就是置信區(qū)間。
如果置信度為95%, 則抽取100個(gè)樣本來估計(jì)總體的均值,由100個(gè)樣本所構(gòu)造的100個(gè)區(qū)間中,約有95個(gè)區(qū)間包含總體均值。
6. 協(xié)方差與相關(guān)系數(shù)的區(qū)別和聯(lián)系
協(xié)方差:
協(xié)方差表示的是兩個(gè)變量的總體的誤差,這與只表示一個(gè)變量誤差的方差不同。如果兩個(gè)變量的變化趨勢(shì)一致,也就是說如果其中一個(gè)大于自身的期望值,另外一個(gè)也大于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是正值。如果兩個(gè)變量的變化趨勢(shì)相反,即其中一個(gè)大于自身的期望值,另外一個(gè)卻小于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是負(fù)值。
相關(guān)系數(shù):
研究變量之間線性相關(guān)程度的量,取值范圍是[-1,1]。相關(guān)系數(shù)也可以看成協(xié)方差:一種剔除了兩個(gè)變量量綱影響、標(biāo)準(zhǔn)化后的特殊協(xié)方差。