在數(shù)據(jù)分析過程中我們大多數(shù)是通過柱狀圖、折線圖、餅圖等來展示分析數(shù)據(jù)的差異。
但是當(dāng)我們擁有一批數(shù)據(jù)的時(shí)候,比如有500個(gè)數(shù)據(jù)指標(biāo),甚至有多組500個(gè)指標(biāo)的時(shí)候,上述幾個(gè)圖表就無能為力了。
面對(duì)大量的指標(biāo),而我們又需要了解這些數(shù)據(jù)的特性的時(shí)候,這個(gè)時(shí)候我們就需要對(duì)這些數(shù)據(jù)做描述性統(tǒng)計(jì)分析。
描述性統(tǒng)計(jì)是揭示數(shù)據(jù)分布特征的方式,表達(dá)定量數(shù)據(jù)的方法。包括數(shù)據(jù)的平均分析、集中趨勢、離散程度、頻率分布。
常見的描述性統(tǒng)計(jì)指標(biāo)有:
體現(xiàn)集中趨勢的指標(biāo):眾數(shù)、平均數(shù)、分位數(shù)
離散趨勢指標(biāo):極值與極差、平均差、方差、標(biāo)準(zhǔn)差、分位差
分布趨勢指標(biāo):峰態(tài)、偏態(tài)
*上述加粗指標(biāo)為箱形圖能夠展示的指標(biāo)
今天的主角箱形圖,就是一個(gè)包含了上述3個(gè)趨勢指標(biāo)的一個(gè)強(qiáng)大圖形。
箱形圖,又稱為盒式圖或箱線圖,因?yàn)樾螤钕裣渥佣妹?,用于分析一組或多組數(shù)據(jù)的范圍、中心位置和分布。
箱形圖不像柱狀圖、折線圖、餅圖一樣簡單易懂。
但只要我們稍微理解一下一些指標(biāo)的定義,就能很好地應(yīng)用起來。
今天我們可以借助一個(gè)例子來學(xué)習(xí)下這個(gè)圖形怎么應(yīng)用:
使用箱型圖來分析行業(yè)商品價(jià)格的分布特征。
*特別聲明:我們的數(shù)據(jù)來源是天貓生意參謀市場數(shù)據(jù)某個(gè)類目的商品TOP榜單。獲取榜單上商品的價(jià)格。
首先認(rèn)識(shí)一下箱形圖:
【名詞解釋】:
【Q1】:下四分位數(shù),就是指標(biāo)數(shù)值按降序序排行,處于3/4位置的數(shù)值稱為下四分位數(shù)。
【Q2】:中位數(shù),數(shù)值指標(biāo)按降序排行,排1/2位置的數(shù)值稱為中位數(shù)。
【Q3】:上四分位數(shù),數(shù)值指標(biāo)按降序排行,處于1/4位置的數(shù)值稱為上四分位數(shù)。
【IQR】:四分位距離,Q3和Q1的差,稱為四分位距離,公式:IQR=Q3-Q1。
【上邊緣】:上四分位數(shù)加上1.5倍的四分位距離跟數(shù)據(jù)指標(biāo)的最大值相比,取小的那個(gè)。上邊緣是上異常值的邊界。計(jì)算公式:上邊緣=(Q3 + 1.5 * IQR,MAX)取最小。
【下邊緣】:下四分位數(shù)減去1.5倍的四分位距離跟數(shù)據(jù)指標(biāo)的最小值相比,取大的那個(gè)。下邊緣是下異常值的邊界。計(jì)算公式:下邊緣 =(Q1 – 1.5 * IQR,MIN)取最大。
【異常值】:處于上下邊緣之外的數(shù)值都是異常值
【平均值】:所有指標(biāo)的算術(shù)平均值。
根據(jù)各個(gè)指標(biāo)的定義,我們通過這個(gè)圖形就可以直觀看出指標(biāo)的最大、最小、異常值。
平均值、中位數(shù)有分布形態(tài)。這個(gè)圖形比較復(fù)雜,但就是由于比較復(fù)雜,才能直觀帶給我們很多的信息。
我們用Excel 來制作箱形圖:
Excel制作箱形圖特別方便快捷
①先選擇左圖的數(shù)據(jù)區(qū)域:
②點(diǎn)擊插入圖表這里右下角小箭頭:
③在所有圖表中選擇箱形圖:
④這樣一個(gè)基本的箱形圖就做好了(可以添加多列數(shù)據(jù)做對(duì)比):
⑤我們看看實(shí)際例子中,我們能從箱形圖中洞察出什么內(nèi)容:
我們可以直觀獲取到以下信息:
1、價(jià)格最低是6.5最高是160,有兩個(gè)高異常值。
2、有兩個(gè)商品的價(jià)格比較突出,超出正常范圍很多,達(dá)到249、171。
3、有一半的商品價(jià)格集中在43-92之間,3/4的商品價(jià)格都在92以下。
4、價(jià)格中位數(shù)是67,平均值跟中位數(shù)比較接近,平均值為72。
以上數(shù)據(jù),就能更清晰地知道自己商品的價(jià)格所處的位置。
數(shù)據(jù)分析中箱形圖的用途:
1、開新品定價(jià):開新品的時(shí)候,對(duì)商品的價(jià)格能夠有一個(gè)較好的定位。
如果結(jié)合價(jià)格段數(shù)據(jù)的增長趨勢,就能決策進(jìn)入哪個(gè)商品價(jià)格帶比較合適。
2、類目對(duì)比:如果多個(gè)類目數(shù)據(jù)對(duì)比,就能分析出不同類目的客單價(jià)分布的差異性。
箱形圖是功能超級(jí)強(qiáng)大的一個(gè)分析圖形,趕緊使用起來吧,歡迎交流更多數(shù)據(jù)分析內(nèi)容
關(guān)于數(shù)據(jù)銀行的其它功能和應(yīng)用場景,我們會(huì)陸續(xù)在后續(xù)的文章分享,關(guān)注我們及時(shí)閱讀干貨內(nèi)容
~~~~~~~~~~~~~~~ 作者分割線 ~~~~~~~~~~~~~~
~~~~~~~~~~~~~公司介紹分割線 ~~~~~~~~~~~
「蔚云科技」專注成為一家數(shù)字商業(yè)運(yùn)營服務(wù)商,我們通過數(shù)字商業(yè)洞察、數(shù)字商業(yè)技術(shù)、數(shù)字商業(yè)運(yùn)營三大核心引擎,為客戶提供具有遠(yuǎn)見卓識(shí)的商業(yè)增長解決方案。
聚焦用“大數(shù)據(jù)”為企業(yè)提供「選品賦能」服務(wù),賦能企業(yè)。
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請(qǐng)發(fā)送郵件至 sumchina520@foxmail.com 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。