預測,是供應鏈繞不開的話題。其復雜性和難度,在所有供應鏈問題中可謂“首屈一指”。
同時,預測,又是統計分析里內容最為繁雜的。你甚至可以認為,整個統計分析理論,就是以預測為唯一目標的。
從本篇起,我們就來看看,供應鏈可以如何面對預測問題。
(按照本號開篇談及的方法論,每個案例將分為三個部分。首先是從技術方向審題,其次是從現實方向審題,最后是關于實用方案的總結。)
**************************************************************************
已知過去四年的銷售數據如下:
我們是否可以搭建合適模型,用于預測未來?
**************************************************************************
連續4年48個月的銷售數據,數據按照時間順序展開……并不意外,就像大多數供應鏈預測問題一樣,這是個時間序列分析問題。
對于時間序列分析,我們首先需要回答的第一個問題是:這是不是個平穩序列?
(知識點:時間序列分為兩類,即,平穩序列、非平穩序列。 所謂“平穩序列”,也即序列中只有隨機波動。
所謂“非平穩序列”,是指序列中包含著趨勢、季節性、周期性等一種或者多種成分。當然, 隨機波動,也一樣可以存在于“非平穩序列”之中。)
顧名思義,如果我們面前是個“平穩序列”,那么我們甚至可以說,這種序列是不需要“預測”的。因為,該序列本身的均值、方差等特征就已經足夠描述未來了。
如何確認是否是平穩序列呢?
按照統計學語言,這是個“假設檢驗”,這個問題可以重新表述為:這個序列是否滿足“平穩序列”的假設?--按照定義我們知道,平穩序列,應該是圍繞著均值而隨機波動的序列。
(統計假設的檢驗方法其實很多。我們這里僅推薦兩種簡單易用并且在Excel里非常容易實現的方式: 1、相關性分析。兩個序列之間的統計相關性,值范圍[-1,1],>0.7為強正相關,<-0.7為強負相關。Excel函數CORREL。
2、RMSE剩余標準差分析。先計算預測序列相對于原始序列的剩余標準差,然后以其相對于序列均值的比值來判定。要求該比值低于15%)
原序列的均值為808,“平穩序列”假設的涵義是,該數列每一個值都是圍繞均值808波動的。因此,假定的“平穩序列”即為均值序列: {808,808,808,808,……,808,808}
這里直接進入計算結果和結論。后面的“非平穩序列”分析中將詳細說明計算過程。
********************************************************************************
計算結果:相關性結果為-3.18918E-16,基本上等于0,完全不相關。 剩余標準差分析結果得到比值32%,未通過。
結論:該序列不是“平穩序列”。
********************************************************************************
既然不是“平穩序列”,那就意味著序列中應當含有趨勢、季節性、周期性等成分。我們現在需要做的,是第二個問題:求解該序列中的趨勢性、季節性和周期性。
首先,該序列的“季節性”。
自相關分析,可以清楚地揭示時間序列的季節性,尤其是季節周期的長度。
(知識點:所謂“自相關分析”,是指序列自身的相關性。
具體涵義是:原序列是從第1個數據開始的,如果我們剔除掉最前面的n-1個數據,
就得到了從第n個數據(n>1)開始的新序列,這個新序列與原序列的相關性,
就稱之為原數列的第n階自相關系數。)
對于48個值的原始序列,這里計算了1~36階自相關系數,如下表所示。
可以很清晰地看到,在第12、24、36階,自相關系數明顯提高到0.7左右的水平。這就清晰地告訴我們,原始序列具有明顯的“季節性”,并且這種季節性表現為年度正相關關系。也即,每年12個月的走勢都具有相似性,正所謂“年年月月花相似”。
***下表展示了實際計算過程,注意隱去了中間的一大部分列和行。主要的計算公式在單元格"B2","C3"(公式可以下拉自動填充至“C36”)和"A3"(公式可以下拉自動填充至“A36”)。A列的計算結果即為1~36階自相關系數。
其次,該序列的“趨勢性”。
趨勢性,描述的是時間序列季節性之上的增長趨勢,也即,每一個季節周期,對上一個季節周期的增長趨勢。
由于已經查明原始序列的季節周期為年(12個月),因此,這里的趨勢性其實就是年度增長趨勢。簡單計算結果如下表:
連續三年的增長率為8%,40%,19%。年均增長率22%。
正常接下來我們就應該分析這個年度增長趨勢了。但是很遺憾,對于本序列,這個分析沒啥意義。因為樣本數據量只有3個,我們只能簡單估計年度增長期望值為22%,而這個期望值的均方差高達59%。
這意味著:我們只能預測年度增長為22%,并且我們很清楚知道這個預測基本等同于拍腦袋。(所以,放棄吧少年 ^_^)
當然,這也并不意味著我們沒辦法處理“趨勢性”。我們只是需要更多的數據才能處理這類趨勢性問題,以及,我們或許需要查找其背后邏輯相關的宏觀經濟數據然后通過建模分析來解釋或者描述原始序列中的趨勢性。
最后,該序列的“周期性”。
周期性,也就是時間序列的循環波動,是時間序列所呈現的圍繞長期趨勢的一種波浪形或震蕩式波動。通常,周期性是由商業和經濟活動引起的,不同于趨勢變動也不同于季節變動,而是一種漲落相間的交替波動,其變動周期多在一年以上并且周期長短不一。
所以,我們幾乎不可能從前述4年數據中求得“周期性”。當然,除非是5~10年及以上尺度的供應鏈規劃問題,否則我們也完全不需要介入這個問題。
********************************************************************************
討論結果:該時間序列具有明顯的以12個月為周期的“季節性”。 該時間序列的趨勢性為持續正增長,但增長率可預測性差。
********************************************************************************
正兒八經講了半天,說實話我都累。
其實,真實工作沒這么復雜,圖形觀察通常是最簡易快捷通向結論的。請看下圖:
看著這個圖,所謂的“12個月周期的季節性”是不是顯而易見呢?(除了相對特殊的Y2)
所以,現實中,大多情況下你只需要直接檢驗各年度序列之間的相關性即可。
前文洋洋灑灑千言,您只需要作為知識背景了解一下即可,或者,以備不時之需——如果很悲催你所面對的不是年度季節性序列,那么你就照葫蘆畫瓢從頭開始來一遍好了……
我們已經完成了對案例1的定性解答,但是,實際工作總是要求我們給出定量工具的。
所以,第三個問題:如何構建定量模型來支持未來預測?
基于前述定性討論,我們知道,定量預測未來所需要的參數包括:(1)年度增長趨勢值(期望值22%,誤差可能很大);(2)12個月各自的季節趨勢值。
對于季節趨勢值,簡單粗暴的計算方式如下:
也即,我們的時間序列預測模型將長成下面的樣子:
Y(t) M(n) = Y(o) * (1 + Year Growth Rate) ^(t-o) * Season Factor(n)
這里的o表示基準年份,t 表示待預測年份,第t年;n表示待預測月份,n=1~12。 Y(o)表示基準年份的年度總和,Y(t) M(n)表示第t年的第n月的預測值。
可以看到,它不同于所有應用統計學書上能夠看到的乘法或者加法模型。但這不是重點,畢竟乘法或者加法都是表述方式而已。重點在于,搭出來的模型,是否是統計意義上可用的?
最后一個問題:模型的檢驗。
前文提及了兩種統計檢驗的簡單方法:相關性分析、剩余標準差分析。
但是首先,我們得依據預測模型生成預測序列,或者說,擬合序列。如下表:
請注意,這里忽略了明知道誤差很大的年度增長趨勢值,改采用了真實值。這么做的原因,會在下篇文章中解釋。
1、相關性分析計算過程如圖:
***下表展示了實際計算過程,注意隱去了中間的一大部分行。主要的計算公式在單元格"B4",即相關系數
2、剩余標準差分析
計算過程如圖:
***下表展示了實際計算過程,預測偏差即為對應預測值與原始序列值的差,預測方差為預測偏差的平方。 RMSE剩余標準差,計算公式=SQRT(SUM(C31:N34)/(48-2))。這里,C31:N34即為48個預測偏差的平方,“48-2”的含義是序列數48減去自由度2。這里的“減2”是計算剩余標準差是必須的。
RMSE/ave,即“剩余標準差 / 均值”,結果是個比值。判定標準為“<15%”
********************************************************************************
計算結果:相關性結果為0.945,遠大于0.7,預測模型與原始序列高度相關。 剩余標準差分析結果得到比值10%,通過,該模型擬合度可以接受。
結論:(在不考慮年度增長預測誤差的前提下,)該定量預測模型可接受。
********************************************************************************
案例1所提供的時間序列,為非平穩序列,有著明顯的以12個月為周期的季節性。
即便基于最簡單的移動平均法的季節因子定量模型,模型的擬合程度也是可以接受的。
(本篇完)
下一篇我們將繼續從現實方向討論案例1。
從“知其然”到“知其所以然”,我們就能夠理解,本篇技術方向討論中以“或繁或簡甚至有些隨心所欲地”調用不同統計學技術的原因所在。
下周日再見~~
中郵無人機(北京)有限公司揭牌
2699 閱讀智能倉儲企業“智世機器人”完成數千萬元A輪融資
2607 閱讀這家老牌物流巨頭被整合重組,四千多名員工將何去何從?
2054 閱讀2024最值錢的物流上市企業是誰?哪些物流企業被看好,哪些被看跌?
1520 閱讀地緣政治重塑下的全球供應鏈:轉型、挑戰與新秩序
1277 閱讀物流供應鏈領域“吸金”不力,但能給投融資事件頒幾個獎
1266 閱讀連續5年的“春節主力軍”,德邦為何如此穩?
1030 閱讀16連冠背后,日日順助力智家工廠物流降本增效
1036 閱讀1745億件,快遞業務量增速超預期
1015 閱讀扎根供應鏈創新25年,一家“耐力長跑型”企業的破局啟示
970 閱讀