国产乱码精品一区二区三区不卡_视频一区视频二区视频_国产日产精品一区二区三区四区_精品一区在线播放_亚洲精品九九_怡红院精品视频在线观看极品_看高清中日韩色视频_国产欧美一级_日韩欧美一区二区三区四区五区 _欧美日韩亚洲一区三区

首頁 > 技術(shù)支持 > 做實(shí)驗(yàn)需要掌握哪些統(tǒng)計(jì)學(xué)知識(shí)?

做實(shí)驗(yàn)需要掌握哪些統(tǒng)計(jì)學(xué)知識(shí)?

點(diǎn)擊次數(shù):1958     更新時(shí)間:2025-01-04

統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析的基石。學(xué)了統(tǒng)計(jì)學(xué),你會(huì)發(fā)現(xiàn)很多時(shí)候的分析并不靠譜。比如很多人都喜歡用平均數(shù)去分析一個(gè)事物的結(jié)果,但是這往往是粗糙的,準(zhǔn)確的。如果學(xué)了統(tǒng)計(jì)學(xué),那么我們就能以更多更科學(xué)的角度看待數(shù)據(jù)。 


大部分的數(shù)據(jù)分析,都會(huì)用到統(tǒng)計(jì)方面的以下知識(shí),可以重點(diǎn)學(xué)習(xí):

  • 基本的統(tǒng)計(jì)量:均值、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差、百分位數(shù)

  • 概率分布:幾何分布、二項(xiàng)分布、泊松分布、正態(tài)分布等

  • 總體和樣本:了解基本概念,抽樣的概念

  • 置信區(qū)間與假設(shè)檢驗(yàn):如何進(jìn)行驗(yàn)證分析

  • 相關(guān)性與回歸分析:一般數(shù)據(jù)分析的基本模型

通過基本的統(tǒng)計(jì)量,你可以進(jìn)行更多元化的可視化,以實(shí)現(xiàn)更加精細(xì)化的數(shù)據(jù)分析。這個(gè)時(shí)候也需要你去了解更多的Excel函數(shù)來實(shí)現(xiàn)基本的計(jì)算,或者python、R里面一些對(duì)應(yīng)的可視化方法。

有了總體和樣本的概念,你就知道在面對(duì)大規(guī)模數(shù)據(jù)的時(shí)候,怎樣去進(jìn)行抽樣分析。

你也可以應(yīng)用假設(shè)檢驗(yàn)的方法,對(duì)一些感性的假設(shè)做出更加精確地檢驗(yàn)。

利用回歸分析的方法,你可以對(duì)未來的一些數(shù)據(jù)、缺失的數(shù)據(jù)做基本的預(yù)測。

了解統(tǒng)計(jì)學(xué)的原理之后,你不一定能夠通過工具實(shí)現(xiàn),那么你需要去對(duì)應(yīng)的找網(wǎng)上找相關(guān)的實(shí)現(xiàn)方法,也可以看書。先推薦一本非常簡單的:吳喜之-《統(tǒng)計(jì)學(xué)·從數(shù)據(jù)到結(jié)論》。 

另外,如何精力允許,請(qǐng)掌握一些主流算法的原理,比如線性回歸、邏輯回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián)分析、聚類、協(xié)同過濾、隨機(jī)森林。再深入一點(diǎn),還可以掌握文本分析、深度學(xué)習(xí)、圖像識(shí)別等相關(guān)的算法。關(guān)于這些算法,不僅需要了解其原理,你最好可以流暢地闡述出來,還需要你知曉其在各行業(yè)的一些應(yīng)用場景。如果現(xiàn)階段不是工作剛需,可不作為重點(diǎn)。

本文算是一個(gè)知識(shí)點(diǎn)匯總,不做細(xì)致展開,讓大家了解統(tǒng)計(jì)學(xué)有哪幾大塊,每一類分別用于什么樣的分析場景。后面幾篇會(huì)以實(shí)際案例的方式,細(xì)致講講描述性統(tǒng)計(jì)、概率分布等。


知識(shí)點(diǎn)匯總:

1.集中趨勢

2.變異性

3.歸一化

4.正態(tài)分布

5.抽樣分布

6.估計(jì)

7.假設(shè)檢驗(yàn)

8.T檢驗(yàn)


一、集中趨勢

圖片


1.眾數(shù)

出現(xiàn)頻率最高的數(shù);

2.中位數(shù)

把樣本值排序,分布在最中間的值;

樣本總數(shù)為奇數(shù)時(shí),中位數(shù)為第(n+1)/2個(gè)值;

樣本總數(shù)為偶數(shù)時(shí),中位數(shù)是第n/2個(gè),第(n/2)+1個(gè)值的平均數(shù);

3.平均數(shù)

所有數(shù)的總和除以樣本數(shù)量;

現(xiàn)在大家接觸最多的概念應(yīng)該是平均數(shù),但有時(shí)候,平均數(shù)會(huì)因?yàn)槟承O值的出現(xiàn)收到很大影響。舉個(gè)小例子,你們班有20人,大家收入差不多,19人都是5000左右,但是有1個(gè)同學(xué)創(chuàng)業(yè)成功了,年入1個(gè)億,這時(shí)候統(tǒng)計(jì)你們班同學(xué)收入的“平均數(shù)"就是500萬了,這也很好的解釋了,每年各地的平均收入數(shù)據(jù)出爐,小伙伴們直呼給祖國拖后腿了,那是因?yàn)榇蠹沂杖氡黄骄耍藭r(shí),“中位數(shù)"更能合理的反映真實(shí)的情況;



二、變異性

圖片


1.四分位數(shù)

上面說到了“中位數(shù)",把樣本分成了2部分,再找個(gè)這2部分各自的“中位數(shù)",也就把樣本分為了4個(gè)部分,其中1/4處的值記為Q1,2/4處的值記為Q2,3/4處的值記為Q3

2.四分位距 IQR=Q3-Q1

圖片

3.異常值

小于Q1-1.5(IQR)或者大于Q3+1.5(IQR);

對(duì)于異常值,我們?cè)跀?shù)據(jù)處理的環(huán)節(jié)就要剔除;

4.方差

圖片

5.平方偏差

方差的算術(shù)平方根

6.貝塞爾矯正:修正樣本方差

實(shí)際在計(jì)算方差時(shí),分母要用n-1,而不是樣本數(shù)量n。原因在于,比如在高斯分布中,我們抽取一部分的樣本,用樣本的方差表示滿足高斯分布的大樣本數(shù)據(jù)集的方差。由于樣本主要是落在x=u中心值附近,那么樣本如果用如下公式算方差,那么預(yù)測方差一定小于大數(shù)據(jù)集的方差(因?yàn)?span style="-webkit-tap-highlight-color: transparent; margin: 0px; padding: 0px; outline: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important; letter-spacing: 0.544px;">高斯分布的邊沿抽取的數(shù)據(jù)也很少)。為了能彌補(bǔ)這方面的缺陷,那么我們把公式的n改為n-1,以此來提高方差的數(shù)值,這種方法叫貝塞爾矯正系數(shù)。



三、歸一化

圖片


1.標(biāo)準(zhǔn)分?jǐn)?shù)

一個(gè)給定分?jǐn)?shù) 距離 平均數(shù) 多少個(gè)標(biāo)準(zhǔn)差?

標(biāo)準(zhǔn)分?jǐn)?shù)是一種可以看出某分?jǐn)?shù)在分布中相對(duì)位置的方法。

標(biāo)準(zhǔn)分?jǐn)?shù)能夠真實(shí)的反映一個(gè)分?jǐn)?shù)距離平均數(shù)的相對(duì)標(biāo)準(zhǔn)距離。

圖片


四、正態(tài)分布

圖片



1.定義:隨機(jī)變量X服從一個(gè)數(shù)學(xué)期望為μ,方差為σ?2;的正態(tài)分布,記為N(μ,σ?2;)

隨機(jī)取一個(gè)樣本,有68.3%的概率位于距離均值μ有1個(gè)標(biāo)準(zhǔn)差σ內(nèi);

有95.4%的概率位于距離均值μ有2個(gè)標(biāo)準(zhǔn)差σ內(nèi);

有99.7%的概率位于距離均值μ有3個(gè)標(biāo)準(zhǔn)差σ內(nèi);

圖片


五、抽樣分布

圖片


1.中心極限定理

設(shè)從均值為μ,方差為σ?2;的任意一個(gè)總體中抽取樣本量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ?2;/n的正態(tài)分布

2.抽樣分布

設(shè)總體共有N個(gè)元素,從中隨機(jī)抽取一個(gè)容量為n的樣本,在重置抽樣時(shí),共有N·n種抽法,即可以組成N·n不同的樣本,在不重復(fù)抽樣時(shí),共有N·n個(gè)可能的樣本。每一個(gè)樣本都可以計(jì)算出一個(gè)均值,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。但現(xiàn)實(shí)中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布實(shí)際上是一種理論分布。數(shù)理統(tǒng)計(jì)學(xué)的相關(guān)定理已經(jīng)證明:在重置抽樣時(shí),樣本均值的方差為總體方差的1/n。

舉個(gè)例子:

48盆MM豆,計(jì)算出每盆有幾個(gè)藍(lán)色的MM豆,48個(gè)數(shù)據(jù)構(gòu)成了總體樣本。然后隨機(jī)選擇五盆,計(jì)算五盆中含有藍(lán)色MM豆的平均數(shù),然后反復(fù)進(jìn)行了50次。這就是n為5的樣本均值抽樣。

圖片


六、估計(jì)

圖片


1. 誤差界限

圖片

2. 置信度

We are some % sure the true population parameter falls within a specific range

我們有百分之多少確信總體中的值落在一個(gè)特定范圍內(nèi);

一般情況下,取95%的置信度就可以;

3. 置信區(qū)間

圖片


七、假設(shè)檢驗(yàn)

圖片

1.問題:什么是顯著性水平?

顯著性水平是估計(jì)總體參數(shù)落在某一區(qū)間內(nèi),可能犯錯(cuò)誤的概率,也就是Type I Error

A Type II Error is when you fail to reject the null when it is actually false.

圖片

圖片

2. 如何選擇備選檢驗(yàn)和零假設(shè)?

一個(gè)研究者想證明自己的研究結(jié)論是正確的,備擇假設(shè)的方向就要與想要證明其正確性的方向一致;

同時(shí)將研究者想收集證據(jù)證明其不正確的假設(shè)作為原假設(shè)H0


八、T檢驗(yàn)

圖片


1. 主要用于樣本含量較小(例如n<30),總體標(biāo)準(zhǔn)差σ未知的正態(tài)分布。

流程如下:

圖片

是用t分布理論來推論差異發(fā)生的概率,從而比較兩個(gè)平均數(shù)的差異是否顯著;

一般檢驗(yàn)水準(zhǔn)α取0.05即可;

計(jì)算檢驗(yàn)統(tǒng)計(jì)量的方法根據(jù)樣本形式不同;

2. 獨(dú)立樣本T檢驗(yàn):

現(xiàn)在要分析男生和女生的身高是否相同兩者的主要區(qū)別在于數(shù)據(jù)的來源和要分析的問題。

圖片

問題:為什么T檢驗(yàn)查表時(shí)候要n-1?

樣本均值替代總體均值損失了一個(gè)自由度

3. 配對(duì)樣本t檢驗(yàn)

分析人的早晨和晚上的身高是否不同,于是找來一撥人測他們?cè)缟虾屯砩系纳砀撸@里每個(gè)人就有兩個(gè)值,這里出現(xiàn)了配對(duì)

圖片

樣本誤差(Standard Error)

圖片


圖片

4. Pooled variance 合并方差

當(dāng)樣本平均數(shù)不一樣,但實(shí)際上認(rèn)為他們的方差是一樣的時(shí)候,需要合并方差

不要被公式嚇到,他的本質(zhì)是兩個(gè)樣本方差加權(quán)平均

圖片


圖片

5. Cohen’s d

效應(yīng)量(effect size):提示組間真正的差異占統(tǒng)計(jì)學(xué)差異的比例,值越大,組間差異越可靠。

圖片

圖片


在線咨詢 聯(lián)系方式 二維碼

服務(wù)熱線

13973264378

掃一掃,關(guān)注我們

国产乱码精品一区二区三区不卡_视频一区视频二区视频_国产日产精品一区二区三区四区_精品一区在线播放_亚洲精品九九_怡红院精品视频在线观看极品_看高清中日韩色视频_国产欧美一级_日韩欧美一区二区三区四区五区 _欧美日韩亚洲一区三区
国产亚洲精品自在久久| 91久久综合| 亚洲乱码视频| 亚洲免费婷婷| 日本一区免费看| 一区二区三区国产在线| 国模精品一区二区三区| 一区二区三区在线观看www| 亚洲欧美网站| 日本最新一区二区三区视频观看| 亚洲人成人一区二区三区| 亚洲成人a**址| 久久精品中文| 国产精品v欧美精品v日韩精品| 久久99久久99精品蜜柚传媒| 国产精品美女黄网| 一区二区三区不卡在线| 国产一区二区三区无遮挡 | 国产伦精品一区二区三区四区视频 | 97久草视频| 一区二区冒白浆视频| 国产91社区| 99在线观看免费视频精品观看| 日本一区视频在线播放| 久久大香伊蕉在人线观看热2| 欧美日韩 国产精品| 国产一区二区三区四区五区加勒比| 欧美日本久久| 欧美国产三区| 日本一区免费看| 国产99在线免费| 乱码第一页成人| 亚洲精品在线免费| 午夜精品久久久久99热蜜桃导演| 欧美在线视频二区| 精品国产第一页| 久久久精品动漫| 香蕉久久久久久久av网站| 亚洲一级网站| 一本一道久久a久久精品综合| 国产精品加勒比| 久久精选视频| 久久国产精品亚洲va麻豆| 欧美亚洲在线| 国产精品一级| 在线免费观看成人| 欧美最大成人综合网| 精品综合久久| 美日韩免费视频| 亚洲精品自在在线观看| 日韩资源av在线| 亚洲综合视频一区| 成人激情av| caoporen国产精品| caoporen国产精品| 久久影视中文粉嫩av| 国产日韩二区| 欧美成人第一区| 亚欧精品在线| 中文网丁香综合网| 制服诱惑一区| 欧美网站在线| 久久精品人人做人人爽电影蜜月| 国产精品毛片在线| 91精品黄色| 秋霞在线观看一区二区三区| 蜜桃导航-精品导航| 国产精品一区二区不卡视频| 国产三区二区一区久久| 欧美国产综合| 极品尤物久久久av免费看| 国内精品福利| 亚洲人成免费| 亚洲综合社区| 久久久99爱| 一本久道久久综合狠狠爱亚洲精品| 蜜桃av久久久亚洲精品| 免费国产一区二区| 久久偷窥视频| 日本午夜精品电影| 欧美日韩精品免费在线观看视频 | 玖玖玖国产精品| 国产伦精品一区二区三区视频免费 | 亚洲欧美日韩另类精品一区二区三区| 国产原创精品| 精品久久中出| 亚洲自拍的二区三区| 国产免费成人| 日韩av高清在线播放| 欧美极品jizzhd欧美| 国内外成人免费视频| 国产一区二区你懂的| 国产区欧美区日韩区| 四虎一区二区| 日韩国产在线一区| 2019国产精品视频| 日韩欧美亚洲在线| 伊人久久久大香线蕉综合直播| 一区二区亚洲精品| 国产精品乱子乱xxxx| 久久国产精品久久精品国产| 国产伦一区二区三区色一情| 国产欧美韩日| 91精品黄色| 色综合久久久久久久久五月| 日韩精品电影网站| 欧美久久在线| 在线亚洲欧美| 一本一道久久a久久精品综合| 亚洲人成毛片在线播放女女| 国产欧美日韩视频一区二区三区| 欧美a级在线| 国产日产高清欧美一区二区三区| 国产偷国产偷亚洲高清97cao| 日韩aⅴ视频一区二区三区| 国产综合第一页| 国内一区二区三区在线视频| 亚洲国产一区二区三区在线| 亚洲国产午夜| 欧美人xxxxx| 亚洲欧美日韩精品久久久| 蜜桃麻豆www久久国产精品| 一区二区精品国产| 国产精品久久亚洲7777| 亚洲精品乱码久久久久久蜜桃91| 日韩午夜免费| 免费成人av网站| 99精品国产福利在线观看免费 | 日韩av不卡在线播放| 国产精品s色| 老色鬼久久亚洲一区二区| 欧美暴力喷水在线| 国产午夜精品在线| 欧美lavv| 午夜日韩电影| 91久久国产自产拍夜夜嗨| 一区二区三区四区| 亚洲影院一区| 国产一区二区三区四区三区四 | 久久亚洲风情| 亚洲高清资源| 亚洲国产日本| 欧美日韩精品一区| 久久国产精品毛片| 欧美精品九九| 免费国产一区二区| 国产欧美一区二区视频| 欧美一区二区综合| 国产精品美女久久久| 欧美亚洲爱爱另类综合| 狠狠色综合色区| 99一区二区| 一区二区福利| 午夜久久tv| 国产精品主播| 亚洲高清资源| 欧美日韩影院| 丝袜美腿玉足3d专区一区| 久久亚洲视频| 久久xxxx精品视频| 一区在线视频| 国产精品美女黄网| 高清国语自产拍免费一区二区三区| 亚洲精品一区二区三| 国产精品乱码一区二区三区| 国产一区二区黄色| 午夜一级久久| 欧美激情日韩| 亚洲精品一卡二卡三卡四卡| 亚洲欧美亚洲| 日韩电影在线播放| 国产另类自拍| 先锋影音久久久| 91在线观看网站| 国产精品亚洲综合色区韩国| 欧美日韩精品免费看| 亚洲精品成人a8198a| 欧美视频成人| 在线看成人av电影| 先锋影音亚洲资源| 国外成人免费视频| 亚洲一二区在线| 欧美日韩高清免费| 亚洲成人自拍视频| 久久久噜噜噜久久狠狠50岁| 国产伦精品一区二区| 亚洲看片网站| 狠狠干一区二区| 国产精品日韩一区二区 | 亚洲永久一区二区三区在线| 国内精品久久久久久久97牛牛| 一本一道久久a久久精品综合| 欧美一区二区三区在线免费观看| 国内成人在线| 欧美三级第一页| 伊人久久综合| 亚洲图片小说在线| 亚洲午夜精品久久久中文影院av| 久久亚裔精品欧美| 久久久综合网|