統(tǒng)計學作為一門方法論科學,具有自己完善的方法體系。統(tǒng)計研究的具體方法有很多,這將在后續(xù)課程中學習,而從大的方面看,其基本研究方法有:
一、大量觀察法
這是統(tǒng)計活動過程中搜集數(shù)據(jù)資料階段(即統(tǒng)計調查階段)的基本方法:即要對所研究現(xiàn)象總體中的足夠多數(shù)的個體進行觀察和研究,以期認識具有規(guī)律性的總體數(shù)量特征。大量觀察法的數(shù)理依據(jù)是大數(shù)定律,大數(shù)定律是指雖然每個個體受偶然因素的影響作用不同而在數(shù)量上幾存有差異,但對總體而言可以相互抵消而呈現(xiàn)出穩(wěn)定的規(guī)律性,因此只有對足夠多數(shù)的個體進行觀察,觀察值的綜合結果才會趨向穩(wěn)定,建立在大量觀察法基礎上的數(shù)據(jù)資料才會給出一般的結論。統(tǒng)計學的各種調查方法都屬于大量觀察法。
二、統(tǒng)計分組法
由于所研究現(xiàn)象本身的復雜性、差異性及多層次性,需要我們對所研究現(xiàn)象進行分組或分類研究,以期在同質的基礎上探求不同組或類之間的差異性。統(tǒng)計分組在整個統(tǒng)計活動過程中都占有重要地位,在統(tǒng)計調查階段可通過統(tǒng)計分組法來搜集不同類的資料,并可使抽樣調查的樣本代表性得以提高(即分層抽樣方式);在統(tǒng)計整理階段可以通過統(tǒng)計分組法使各種數(shù)據(jù)資料得到分門別類的加工處理和儲存,并為編制分布數(shù)列提供基礎;在統(tǒng)計分析階段則可以通過統(tǒng)計分組法來劃分現(xiàn)象類型、研究總體內在結構、比較不同類或組之間的差異(顯著性檢驗)和分析不同變量之間的相關關系。統(tǒng)計學中的統(tǒng)計分組法有傳統(tǒng)分組法、判別分析法和聚類分析法等。
三、綜合指標法
統(tǒng)計研究現(xiàn)象的數(shù)量方面的特征是通過統(tǒng)計綜合指標來反映的。所謂綜合指標,是指用來從總體上反映所研究現(xiàn)象數(shù)量特征和數(shù)量關系的范疇及其數(shù)值,常見的有總量指標、相對指標,平均指標和標志變異指標等。綜合指標法在統(tǒng)計學、尤其是社會經濟統(tǒng)計學中占有十分重要的地位,是描述統(tǒng)計學的核心內容。如何最真實客觀地記錄、描述和反映所研究現(xiàn)象的數(shù)量特征和數(shù)量關系,是統(tǒng)計指標理論研究的一大課題。
四、統(tǒng)計模型法
在以統(tǒng)計指標來反映所研究現(xiàn)象的數(shù)量特征的同時,我們還經常需要對相關現(xiàn)象之間的數(shù)量變動關系進行定量研究,以了解某一(些)現(xiàn)象數(shù)量變動與另一(些)現(xiàn)象數(shù)量變動之間的關系及變動的影響程度。在研究這種數(shù)量變動關系時,需要根據(jù)具體的研究對象和一定的假定條件,用合適的數(shù)學方程來進行模擬,這種方法就叫做統(tǒng)計模型法。
五、統(tǒng)計推斷法
在統(tǒng)計認識活動中,我們所觀察的往往只是所研究現(xiàn)象總體中的一部分單位,掌握的只是具有隨機性的樣本觀察數(shù)據(jù),而認識總體數(shù)量特征是統(tǒng)計研究的目的,這就需要我們根據(jù)概率論和樣本分布理論,運用參數(shù)估計或假設檢驗的方法,由樣本觀測數(shù)據(jù)來推斷總體數(shù)量特征。這種由樣本來推斷總體的方法就叫統(tǒng)計推斷法。統(tǒng)計推斷法已在統(tǒng)計研究的許多領域得到應用,除了最常見的總體指標推斷外,統(tǒng)計模型參數(shù)的估計和檢驗、統(tǒng)計預測中原時間序列的估計和檢驗等,也都屬于統(tǒng)計推斷的范疇,都存在著誤差和置信度的問題。在實踐中這是一種有效又經濟的方法,其應用范圍很廣泛,發(fā)展很快,統(tǒng)計推斷法已成為現(xiàn)代統(tǒng)計學的基本方法。
1、聚類分析(Cluster Analysis)
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標準,聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動進行分類。聚類分析所使用方法的不同,常常會得到不同的結論。不同研究者對于同一組數(shù)據(jù)進行聚類分析,所得到的聚類數(shù)未必一致。
2、因子分析(Factor Analysis)
因子分析是指研究從變量群中提取共性因子的統(tǒng)計技術。因子分析就是從大量的數(shù)據(jù)中尋找內在的聯(lián)系,減少決策的困難。
因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質上大都屬近似方法,是以相關系數(shù)矩陣為基礎的,所不同的是相關系數(shù)矩陣對角線上的值,采用不同的共同性□2估值。在社會學研究中,因子分析常采用以主成分分析為基礎的反覆法。
3、相關分析(Correlation Analysis)
相關分析(correlation analysis),相關分析是研究現(xiàn)象之間是否存在某種依存關系,并對具體有依存關系的現(xiàn)象探討其相關方向以及相關程度。相關關系是一種非確定性的關系,例如,以X和Y分別記一個人的身高和體重,或分別記每公頃施肥量與每公頃小麥產量,則X與Y顯然有關系,而又沒有確切到可由其中的一個去精確地決定另一個的程度,這就是相關關系。
4、對應分析(Correspondence Analysis)
對應分析(Correspondence analysis)也稱關聯(lián)分析、R-Q型因子分析,通過分析由定性變量構成的交互匯總表來揭示變量間的聯(lián)系。可以揭示同一變量的各個類別之間的差異,以及不同變量各個類別之間的對應關系。對應分析的基本思想是將一個聯(lián)列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。
5、回歸分析
研究一個隨機變量Y對另一個(X)或一組(X1,X2,…,Xk)變量的相依關系的統(tǒng)計分析方法。回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關系的一種統(tǒng)計分析方法。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。
6、方差分析(ANOVA/Analysis of Variance)
又稱“變異數(shù)分析”或“F檢驗”,是R.A.Fisher發(fā)明的,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。方差分析是從觀測變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量。這個 還需要具體問題具體分析
統(tǒng)計方法有: 1、計量資料的統(tǒng)計方法 分析計量資料的統(tǒng)計分析方法可分為參數(shù)檢驗法和非參數(shù)檢驗法。
參數(shù)檢驗法主要為t檢驗和 方差分析(ANOVN,即F檢驗)等,兩組間均數(shù)比較時常用t檢驗和u檢驗,兩組以上均數(shù)比較時常用方差分析;非參數(shù)檢驗法主要包括秩和檢驗等。t檢驗可分為單組設計資料的t檢驗、配對設計資料的t檢驗和成組設計資料的t檢驗;當兩個小 樣本比較時要求兩 總體分布為 正態(tài)分布且方差齊性,若不能滿足以上要求,宜用t 檢驗或非參數(shù)方法( 秩和檢驗)。
方差分析可用于兩個以上 樣本均數(shù)的比較,應用該方法時,要求各個樣本是相互獨立的隨機樣本,各樣本來自正態(tài)總體且各處理組總體方差齊性。根據(jù)設計類型不同,方差分析中又包含了多種不同的方法。
對于 定量資料,應根據(jù)所采用的設計類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計分析方法,不應盲目套用t檢驗和 單因素方差分析。 2、計數(shù)資料的統(tǒng)計方法 計數(shù)資料的統(tǒng)計方法主要針對四格表和R*C表利用檢驗進行分析。
檢驗或u檢驗,若不能滿足 檢驗:當計數(shù)資料呈配對設計時,獲得的四格表為配對四格表,其用到的檢驗公式和校正公式可參考書籍。 R*C表可以分為雙向無序,單向有序、雙向有序屬性相同和雙向有序屬性不同四類,不同類的行列表根據(jù)其研究目的,其選擇的方法也不一樣。
3、等級資料的統(tǒng)計方法 等級資料(有序變量)是對性質和類別的等級進行分組,再清點每組觀察單位個數(shù)所得到的資料。在臨床醫(yī)學資料中,常遇到一些定性指標,如臨床療效的評價、疾病的臨床分期、病癥嚴重程度的臨床分級等,對這些指標常采用分成若干個等級然后分類計數(shù)的辦法來解決它的量化問題,這樣的資料統(tǒng)計上稱為等級資料。
統(tǒng)計方法的選擇: 統(tǒng)計資料豐富且錯綜復雜,要想做到合理選用統(tǒng)計分析方法并非易事。對于同一 個資料,若選擇不同的統(tǒng)計分析方法處理,有時其結論是截然不同的。
正確選擇統(tǒng)計方法的依據(jù)是: ①根據(jù)研究的目的,明確研究試驗設計類型、研究因素與水平數(shù); ②確定數(shù)據(jù)特征(是否正態(tài)分布等)和樣本量大小; ③ 正確判斷統(tǒng)計資料所對應的類型(計量、計數(shù)和等級資料),同時應根據(jù)統(tǒng)計方法的適宜條件進行正確的統(tǒng)計量值計算; 最后,還要根據(jù)專業(yè)知識與資料的實際情況,結合統(tǒng)計學原則,靈活地選擇統(tǒng)計分析方法。
數(shù)據(jù)分析落實到實處,一般就是圍繞用戶漏斗展開的。也就是人們常說的訪問-激活-留存-交易-推薦。
這核心的5步會有不同維度的細分。
獲客:來源、渠道、關鍵字、著陸頁、地域、設備、訪問時間、跳出率、訪問深度、停留時間、新客量等等;
激活:DAU(日活躍用戶)、MAU(月活躍用戶)
留存:日留存率、周留存率、月留存率
交易:訂單量、訂單金額、LTV
推薦:是否傳播(k>1)
需要獲取以上數(shù)據(jù),可以通過ptengine通過漏斗細分得到可視化圖表。一般來講,同比(本周和上周)、環(huán)比(本月第一周和上月第一周)、定基比(所有數(shù)據(jù)和當年第一周)即可獲得數(shù)據(jù)的變化情況。
以上,其實不用很專業(yè)也能做好數(shù)據(jù)分析,獲取數(shù)據(jù)并不難,難的是你能洞察數(shù)據(jù)背后的意義。
聲明:本網站尊重并保護知識產權,根據(jù)《信息網絡傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個月內通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學習鳥. 頁面生成時間:3.375秒