前文我們從技術方向討論了“預測案例2”(預測案例2:有限客戶/行業), 主要是所需要的“聚類分析”,討論內容包括:
(1)對于有限客戶/行業,需要分析的行為特征是哪些?
(2)如何定量分析相似性?
(3)聚類分析的實際過程?
(4)聚類分析結論的實際意義?
本文繼續從現實方向討論此案例,以明確如何利用聚類分析來更好地支持預測。
前文我們簡單提到,聚類分析結果是需要有實際意義的。
這里再次重申這一點。
一再重申的意思是,如果分析結論與現實情況不相符,那么最大的可能性是數據本身原因造成的分析結論失真,而不是市場錯了。
例如:
對于下圖的客戶產品結構,相關系數矩陣會告訴你這是高度相關的一個客戶群。但是事實上,Prd01和Prd02可能只是這4家客戶眼中極不重要的通用附件;如果剔除這兩個產品,你就將得到完全相反的結論。
在這里,聚類分析本身并沒有出錯,出錯的只是你對產品結構范圍的取舍?;蛟S是因為你對產品理解不夠,或許是你沒能得到業務人員或產品管理人員足夠的支持。
第一個問題:關于行業和產品結構特性
制造業領域總是會有這樣的現象:除了大代理商,很少有客戶會購買你所有產品線的所有產品,——不要說“所有”,哪怕是超出10%都很少見。而且,越是產品門類齊全,你的客戶選用的比例就越低。
原因其實很簡單。產品門類齊全,只是說明你想服務的行業眾多,但是能通吃所有行業的客戶則屈指可數。
但是另一方面,制造業領域還有一個現象是:同一行業的客戶,盡管選用的具體產品型號可能千差萬別,但是,這些型號所歸屬的產品類卻又是基本一樣。
原因也不復雜。因為同一行業的產品技術路線大都是類似的。
這就好比你去超市買調味品,具體買什么牌子什么口味,大家都會不一樣;但是既然都是居家過日子,油鹽醬醋這幾個大類總歸是跑不掉的。
但是,不管超市貨架再怎么玲瑯滿目,你買給自家的也只會是其中一瓶,而斷然不會是每個品牌每種口味各買一瓶。
所以,前文的聚類分析中,從產品結構所做的分類,實際正是代表了不同的客戶行業(或者說細分行業,這取決于你選擇的產品樹的層次)。
第二個問題:關于行業新客戶和新行業客戶
處于成長期,典型特征就是會有持續的新客戶。也即,你的客戶清單會越來越長。
制造業客戶選用新品牌產品,是有自身節奏特點的。
第一步,試用測試。體現為樣品單或者時間軸上孤立的一張訂單。
第二步,小批量試用。
第三步,定型之后批量采購。
取決于選用新品牌的目的,上述節奏快慢會有很大差異。如果是客戶新產品定型時候的選用,則會因為客戶新品上市速度快慢而不同,不過節奏通常不會很快;而如果是替換現有品牌,節奏往往就會快很多,甚至會跳過某些中間步驟而直接進入批量采購。
這個過程中,是可以從銷售數據中觀察到這些新客戶或者銷售記錄異常點的。
如果這個新客戶屬于新行業,那么通常你會觀察到訂單產品結構特征上的異常。這會給你一定時間去做出響應,比如,是否需要針對性備貨。
如果這個新客戶屬于已有行業,那么通常你觀察到的是產品結構特征不變基礎上的總量增加。
所以,上述描述實際上是提供了一個“離群點檢測”的思路。而這正是數據挖掘技術里面的一個重要實用方法。
(知識點:離群點檢測,是數據挖掘技術的核心問題之一。
與數據清洗相反。數據清洗是盡可能剔除掉離群點,使數據質量更高、更能夠滿足統計假設;而離群點檢測則是盡可能識別出離群點,以方便采取針對行動。)
如果我們按照產品結構特征定期對訂單記錄進行“離群點檢測”,就有利于供應鏈去及時主動發現新的特殊客戶。如果該客戶涉及到交期敏感的產品,那么,這對于供應鏈在該客戶進入批量采購之前做好準備工作無疑是非常有利的,這將很好地提高供應鏈對于成長期業務的服務質量。
第三個問題:同一產品結構分組,不同市場趨勢分組
通常,制造業用戶在選定產品型號之后,其訂單就體現出一定程度的穩定性。前期的選型定型周期越長,后期的訂單穩定性就越強。
這并非是消費品行業所謂的客戶慣性或者渠道慣性,而是因為工業用戶選型是有成本的,需要實驗測試需要時間;換型則意味著又一次的成本和時間投入。所以,除非遭遇質量問題,否則輕易不會改變。(當然,被競品以價格等因素切換,則另當別論)
所以,一個產品結構特征分組所對應的一個行業,通常其市場趨勢也是一致的。行業大勢,是行業里所有客戶都難以回避的。
那么,我們在上一篇里所看到的不同市場趨勢又是怎么回事呢?
一起回憶一下上篇的結論:同樣擁有產品結構特性PG_C的客戶,卻又有 CG_A和CG_B兩種截然不同的季節趨勢。
這是因為,即便是同一行業,也會因為行業目標用戶的不同、甚至是行業用戶地域的不同而體現出市場趨勢的差異。
神州這么大,東南沿海入春的時候,東北大地還是冰天雪地,需求不同步,這很正常;作為全球制造業基地,出口目的地那么多,季節趨勢不同,這也很正常。
我們的問題是,如何處理這種細分情況?
這里首先需要注意的是該客戶分組的成長狀況。如果都已經進入穩定狀態,那么這兩個分組完全可以合并;如果是處于不同的成長階段,那么合并就存在著一定的風險。
不過,即便是處于不同成長期,如果我們可以拿到較為準確的月度客戶用量預測,那么,合并兩個分組則也是完全沒問題的。
為什么要討論合并分組的問題呢?
原因在于,預測領域,顆粒度越大,產品預測效果越好;顆粒度越細,產品預測風險越高。
單個客戶,受限于客戶實際下單過程中的種種設置或者流程、甚至于使用過程中各產品損耗的不同,都會使得每月實際訂單出現偏差。但是當很多個客戶放在一起考察時,則單個客戶的這種偏差,通常都會被群體平滑掉。
有了以上討論,我們就可以回到另一個重要的技術問題:基于兩年整體數據,我們得到了客戶分組的產品結構特征,但是這種產品結構是否具有足夠穩定性?
如果這種穩定性存疑,那么預測的質量也就可想而知了。所以,在搭建預測模型之前,我們必須要對此予以考察。
如何考察這種穩定性呢?
這個問題等價于,如何考察波動性?
我們知道,對于波動性的表示方式,XYZ是最常用也最簡潔明了的一種指標。X表示波動性低,因此可以使用平均值指導后續預測;Z表示波動性強,使用平均值指導后續預測會有較大偏差;Y介于兩者之間。
這里我們對“單位金額訂單所對應的產品訂量”的月度序列進行XYZ分析,計算過程如下圖:
請注意:為展示方便,圖中隱藏了部分行和列。除透視表外,主要計算公式在右上角。
可以看到,Group_5的部分Y和Z結果,在合并到Group_4+5之后改善成了X或Y,整體展現了較好的結構穩定性。
所有客戶分組以及分組合并的XYZ結果,見下圖:
可以看到:
(1)Group_1和Group_3經歷了高速增長。--從XYZ的計算原理知道,這也是其產品結構穩定性計算結果較差的根本原因。
(2)由于Group_3的增長遠高于Group_2,因此,Group_2+3的產品結構穩定性也并不完美。
(3)Group_4和Group_5的產品結構和增速都基本一樣,因此,Group_4+5展現了較好的結構穩定性。
借助于前面現實方向的討論,我們可以合理猜測在上一年(Y2)發生的事情:
(1)Group_1處于高速成長期;
(2)Group_2+3經歷了局部高速成長;
(3)Group _4+5處于成熟期。
當然,這些猜測,我們需要與業務討論確認。
同時,最重要的是:對于Y2的討論很清晰地告訴我們,必須要先得到業務對于新的一年各客戶組別所處市場狀態的判定,才能決定新模型里正確的客戶分組方式。
另一方面,成長期的市場,各個客戶分組的產品結構穩定性又會受到其自身所處的成長階段影響。
這些認識,都是我們在搭建預測模型時需要充分考慮的。
(本篇完)
基于這兩篇的討論,下一篇我們將討論搭建最終預測模型,以完成案例2。
這兩篇討論下來,不知道有多少朋友會感嘆:怎么會如此復雜?
復雜的原因,在于真實世界就是如此,當然更在于供應鏈對于交貨績效和存貨能夠更好平衡的孜孜不倦的追求。
誰都知道,如果我們自己工廠的彈性足夠大,根本就不需要在預測問題上面付出這么多。但是,工廠的彈性是有限度的,而且,彈性本身就意味著成本。^_^
下周日再見~~
中郵無人機(北京)有限公司揭牌
2622 閱讀智能倉儲企業“智世機器人”完成數千萬元A輪融資
2558 閱讀這家老牌物流巨頭被整合重組,四千多名員工將何去何從?
1963 閱讀2024最值錢的物流上市企業是誰?哪些物流企業被看好,哪些被看跌?
1436 閱讀地緣政治重塑下的全球供應鏈:轉型、挑戰與新秩序
1207 閱讀物流供應鏈領域“吸金”不力,但能給投融資事件頒幾個獎
1168 閱讀2024LOG供應鏈物流?突破創新獎候選案例——準時達國際供應鏈管理有限公司
1022 閱讀仿生學:蜂巢帶給供應鏈管理的啟示
990 閱讀16連冠背后,日日順助力智家工廠物流降本增效
1015 閱讀中遠海運回應被美國國防部列入“中國軍事企業”清單
945 閱讀