電商大數據――用數據驅動電商和商業案例解析

圖書信息

書名:電商大數據——用數據驅動電商和商業案例解析

宣傳語:國內第1本將大數據與電商完美結合的權威之作!
作者:雪鷹傳奇 著
ISBN:978-7-121-22556-7
出版時間:2014年3月
定價:98.00元
頁數:360頁
開本:16開

編輯推薦

(1)《電商大數據——用數據驅動電商和商業案例解析》是國內第1本將大數據與電商完美結合的權威之作!本書是軟精裝版,提供200組客戶、67個維度指標的核心網店數據資源供學習,書中案例在電商實戰中已創造過巨大價值,淘寶天貓京東和獨立B2C均適用。
(2)作者李必文是國內難得對電商與大數據均有深度研究的人,他是電商“數據驅動學”的倡導者和領跑者,更是資深電商經理人。
(3)如果你贊成本書一半以上觀點,請勿錯過《電商大數據》:
電商運營者,要更擅長根據需求“養”數據,數據“養”到一定程度,就會有價值。
電商大數據不一定量級要有多巨大,但數據維度要儘可能豐滿。
商品打折優惠的幅度應大於11.6%,因為11.6%是一個閾值,為人類的最小心理感覺差。
50%的客戶點擊網站的次數都在3次以內。
快銷品類目購買7次以上的客戶便是絕對忠誠的客戶。
新客戶在收到商品後的10天之內二次購買的機率最高。
真正的大數據,不是噱頭,更不是空心的概念,是“夢想照進現實”般的落地和豐厚的經驗價值。

目錄

上篇 電商戰略戰術
第1章 電子商務的戰略解析 / 2
1.1 三言兩語電子商務 / 3
1.1.1 電子商務的特質 / 3
1.1.2 電子商務的整合效應 / 4
1.2 電子商務的動態格局 / 4
1.2.1 草根淘寶平台動了誰的乳酪 / 4
1.2.2 貓與狗的戰爭 / 6
1.2.3 線下傳統企業大鱷的電商夢 / 8
1.3 電子商務時代的品牌運作 / 11
1.3.1 電商品牌的定位 / 11
1.3.2 電商品牌的突圍 / 14
1.3.3 品牌和平台的對立面 / 15
1.4 電子商務時代的“鐵血”戰爭 / 16
1.4.1 電子商務時代的價格之戰 / 16
1.4.2 電子商務時代的人才之戰 / 17
1.4.3 電子商務時代的流量之戰 / 18
1.4.4 電子商務時代的數據之戰 / 19
參考文獻 / 20
第2章 電子商務的戰術解析 / 21
2.1 關於電子商務創業 / 22
2.2 電子商務10大行銷學定律 / 23
2.3 電子商務的10大敗局定律 / 31
2.3.1 正式運營已經錯失銷售旺季 / 31
2.3.2 人云亦云,草根小賣家沒有清晰的電商運作策略 / 32
2.3.3 不注重商品品質和服務 / 33
2.3.4 企業發展過程中團隊有分歧,紅利分配不公平 / 35
2.3.5 過分燒錢砸廣告,忽視PV轉化率,經濟入不敷出而死 / 35
2.3.6 缺乏高質量、穩健的供貨商,供應鏈孱弱 / 36
2.3.7 捨不得投錢慢慢耗死 / 37
2.3.8 品牌定位模糊不清 / 37
2.3.9 實體企業向天貓商城轉型缺少經驗,用傳統行業手段指導商城運營 / 38
2.3.10 電商一上馬,業務全面鋪開和團隊組建冗餘 / 38
2.4 電子商務的10大心理學定律 / 39
第3章 電商大鱷逐鹿中原、數據驅動主宰沉浮 / 43
3.1 你不知道的數據挖掘 / 44
3.1.1 數據挖掘原來是這么回事 / 44
3.1.2 孫子兵法曰:雜於利而務可信也,雜於害而患可解也 / 51
3.2 數據挖掘在電子商務中的多面性 / 54
3.2.1 數據挖掘在電子商務行業中廣泛套用 / 54
3.2.2 數據挖掘是有巨大價值的,但結論常常是錯誤的 / 57
3.2.3 客觀認識數據挖掘 / 59
3.3 電子商務數據挖掘的“AVSM法則” / 62
3.4 數據挖掘的工具 / 65
3.4.1 數據採集工具 / 65
3.4.2 客戶端數據分析工具 / 66
3.4.3 客戶端數據挖掘工具 / 67
3.4.4 數據存儲——資料庫系統 / 68
3.5 延伸閱讀 / 69
3.5.1 谷歌與Facebook的數據挖掘之戰 / 69
3.5.2 軍事戰略上的數據分析 / 70
參考文獻 / 72
中篇 基礎商業案例
第4章 搭建數據化體系 / 74
4.1 繪製銷售圖譜 / 75
4.2 數據化指標及體系 / 77
4.2.1 晴雨表體系的建立 / 77
4.2.2 晴雨表的解讀技巧 / 80
4.2.3 組建流量漏斗模型 / 82
4.2.4 診斷流量黑洞 / 86
4.2.5 診斷流量驟變原因 / 87
4.3 數據分析入門案例 / 88
4.4 數據挖掘入門案例 / 93
4.4.1 漫話統計學 / 93
4.4.2 喜歡買連衣裙的客戶比喜歡買衛衣的客戶更有價值嗎 / 94
4.5 數學建模入門案例 / 95
參考文獻 / 97
第5章 廣告投放策略 / 98
5.1 網際網路廣告的特徵 / 99
5.1.1 定向性 / 99
5.1.2 強化品牌印象的利器 / 99
5.1.3 一把雙刃劍 / 100
5.1.4 非強迫性 / 100
5.2 網際網路廣告的形態 / 101
5.2.1 CPC廣告及“通貨膨脹”/ 101
5.2.2 CPS廣告及“高開低走”/ 104
5.2.3 CPM廣告及“創意無極限”/ 106
5.2.4 硬廣及“暴力拓展”/ 108
5.3 廣告投放戰略 / 111
5.3.1 廣告投放預算 / 111
5.3.2 廣告效果量化模型 / 113
5.3.3 投放策略確定 / 115
5.4 精準投放基礎篇 / 118
5.4.1 分時段投放 / 118
5.4.2 分地域投放 / 121
5.4.3 分品類投放 / 122
5.4.4 關鍵字遴選 / 123
5.5 廣告投放高級策略 / 124
5.5.1 CPC出價與點擊率、轉化率之間的理論數學模型 / 124
5.5.2 深度解讀CPC與點擊率之間的意義 / 125
5.5.3 CPC廣告的三種平衡點 / 127
5.5.4 廣告投放線性組合最佳化 / 130
5.6 廣告資源的整合和管理 / 133
參考文獻 / 135
第6章 數據驅動藝術設計 / 136
6.1 數據驅動與藝術設計漫談 / 137
6.2 網站首頁最優長度如何測定 / 139
6.3 網頁的結構布局策略 / 140
6.3.1 經典的結構布局理論 / 140
6.3.2 站內搜尋的設定 / 142
6.3.3 首頁商品撤換的“ROI”原則 / 142
6.4 商品詳情頁的“倒三角形”結構 / 143
6.5 警惕搭配套餐的騙局 / 146
6.5.1 人類最小心理感覺差 / 146
6.5.2 搭配套餐的新陳代謝 / 147
6.6 關聯推薦的設計 / 148
6.6.1 關聯推薦的機理 / 148
6.6.2 支持度、置信度和提升度 / 149
6.6.3 小結 / 156
參考文獻 / 157
下篇 大數據驅動
第7章 數據化管理 / 160
7.1 任何一個團隊或項目不能量化就不能管理 / 161
7.2 客服團隊數據化管理 / 162
7.2.1 客服團隊排班設計 / 163
7.2.2 客服團隊的績效管理 / 163
7.2.3 客服團隊忠誠度激勵方案 / 170
7.2.4 客服團隊數據化管理高級套用:測算諮詢並發數 / 174
7.3 供應鏈數據化管理 / 177
7.3.1 供應鏈數據化管理的點和面 / 177
7.3.2 大數據環境下供應鏈管理的通路 / 179
7.3.3 商品結構如何布局 / 181
7.3.4 銷量預測的三種最基本的方法 / 183
7.3.5 現貨模式下的彈性補貨策略 / 188
7.3.6 智慧型化倉庫揀貨路徑的設計 / 191
7.4 大型促銷活動促銷節點的設計 / 198
參考文獻 / 202
第8章 客戶“怪誕行為”研究 / 203
8.1 商品預售是顛覆了零售模式還是電商之殤 / 204
8.2 客戶手機號和電子信箱里隱藏的秘密 / 206
8.2.1 手機號與客戶購買力之間的關係 / 206
8.2.2 從Mail地址里窺探那些不能說的秘密 / 208
8.3 數學模型量化客戶行為 / 211
8.3.1 冪函式解析客戶流失機率 / 211
8.3.2 對數函式解析客戶究竟會點擊網頁幾次 / 217
8.4 “7次購物原則”與客戶忠誠度 / 218
8.4.1 知識儲備:條件機率 / 218
8.4.2 Logistic回歸模型解析客戶流失機率分布 / 220
8.5 客戶生命周期貫穿銷售始終 / 225
參考文獻 / 228
第9章 客戶關係管理 / 229
9.1 客戶關係管理沒那么簡單 / 230
9.1.1 客戶關係管理的生死穴 / 230
9.1.2 客戶關係管理的流程 / 235
9.2 客戶關係的五部曲 / 237
9.2.1 資料庫的組建 / 237
9.2.2 資料庫的加厚 / 243
9.2.3 資料庫的標籤 / 245
9.2.4 資料庫的挖掘 / 248
9.2.5 客戶關係管理的落地 / 250
9.3 與時俱進的客戶關係管理 / 252
9.3.1 客戶服務的類型 / 252
9.3.2 客戶關係管理用好現代網際網路新媒體 / 255
9.3.3 客戶關係管理商業流小結 / 259
9.4 客戶關係管理商業案例 / 262
9.4.1 用決策樹為有價值的客戶畫像 / 262
9.4.2 基於神經網路建立客戶流失預警機制 / 264
參考文獻 / 272
第10章 數據驅動高級商業案例 / 273
10.1 基於網路爬蟲技術架上庫存調整項目 / 274
10.1.1 背景 / 274
10.1.2 架上庫存調整的意義 / 275
10.1.3 調整方案的流程圖 / 276
10.1.4 三言兩語:網路爬蟲是什麼 / 278
10.1.5 架上庫存調整臨界點的設定 / 279
10.1.6 架上庫存調整結果展示 / 280
10.2 淘品牌資本化運作所面對的局勢 / 286
10.3 數據驅動小結 / 287
10.3.1 電商數據驅動團隊組建 / 287
10.3.2 學好數據驅動的方法 / 287
10.3.3 實施數據驅動的四大障礙 / 290
教材習題 / 291
重要附錄 神經網路訓練和測試優質商業樣本 / 295

精彩節摘

3.2 數據挖掘在電子商務中的多面性
3.2.1 數據挖掘在電商行業中的常見案例
數據挖掘已經在商品數據化管理、各種網路廣告組合最佳化投放、CRM(客戶關係維護)和市場行銷等領域取得了相當豐碩的成果,正在以不同程度地驅動讓電商企業向前發展。下面羅列的是常見的一些案例,作為拋磚引玉,讀者朋友可以先行獨立思考。
1.通過數據指標判斷一個電商網站是否健康就好比去醫院體檢,比如抽血化驗,血小板總數、白細胞總數、紅細胞壓積容量、淋巴細胞百分比、粒細胞百分比等項目數據就類比於電商網站數據指標,通過指標就能判斷網站是否運營良好,所以需要知道兩類值:實際值和參考值。但是難點在於,如果沒有足夠的經驗,往往很難將數據指標與背後的問題一一對應起來,這就是所謂的“先驗知識”。如果一個店鋪或者電商網站(快消品類目)有較長時間沒有上新,那么以下指標一定會下滑的是?
A.瀏覽回頭率↓ B.訪問深度↓ C.瀏覽回頭率↓ D.訪問深度↓
2.因為某些商品(比如快消品中的真皮女鞋、羽絨服、皮草等)成本高、出貨周期長或者其他原因,這些商品經常預售。某一銷售旺季波段,凡是與預售商品一起下單的很多數額巨大的訂單都因為缺貨而導致大批訂單未能及時發出,用戶體驗及其糟糕(拆單聽起來是個不錯的主意,但是成本變高並且實踐證明客戶並不喜歡接二連三的包裹陸續到來)。現在能做的無非是亡羊補牢的挽救措施,請你通過數據分析解決以下三個問題:
(1)請分析缺貨產品的成分結構。經常會戲劇性地出現因為一個類似小吊帶的小物件缺貨而導致大批貨物不能傳送,如何避免?請給出建議。
(2)為了能給客戶更好的體驗,現在或許是唯一能做到並一定會起到顯著效果的措施是什麼?並計算成本有多大。
(3)預售商品導致不能發貨的問題並沒有完,還會衍生出其他問題。例如,某預售A商品與現貨B商品被C客戶同一天拍下並付款,但是當A商品到貨後,C客戶訂單仍然不能發出,原因是原來的現貨B被其他訂單挪用,B商品也因為缺貨而變成預售,無辜的C客戶無奈只能一等再等。當然,接下來可能損失了一名C客戶或者其身邊的朋友。為了避免此種情況發生,請給出你詳盡的數據支持方案。
備註:原始庫存數據和訂單數據此處略去。
3.一件女裝剛剛上架,很多新客戶一般不會輕易出手購買,請問大部分新客戶的心理是在等待觀望新品評價出來之後再購買,還是因為從眾心理,等部分人群購買了才會出手。所以:
(1)請通過數據分析還原新客戶在購買新品時的心態。對於新品或者新開張的店鋪或網站,女人的哪種心態更多一點?
(2)運用此結論,如果你是一個女裝主線品牌的操盤手,現如今欲創建副線品牌,如何操作才最可能成功?
備註:原始訂單數據此處略去。
4.請你一口氣列舉出影響客戶可能流失的40個數據指標用來組建客戶預流失數學模型,且這些指標目前基於淘寶數據工具或者獨立B2C網上商城運用GA(一種網站數據採集工具)並結合ERP系統都可以抓取到。如果該預流失數學模型用在精準會員行銷方面,你將策劃哪些行銷方案?為了使客人最終成為忠誠度極高的客戶,請給出你的連環精準行銷方案。
5.在女裝商品標題進行SEO的時候,常常會使用熱詞比如韓版和歐美等一些搜尋量很多的辭彙,顯然熱詞會帶來更多的自然流量。問題是:
(1)熱詞在提高流量的同時是不是對轉化率也會有一定程度的提升,姑且不論提升程度的多寡,但是會有一定量的提升嗎?請不要一拍腦袋就流利地說出答案,因為每個決策都會影響到隱性和顯性的銷售額。
(2)對於一個成熟的電商網站和店鋪,熱詞有時候可能與品牌調性不合,如何權衡此問題?
備註:原始流量和銷售數據此處略去。
6.現有一定量庫存商品(女裝類目),為了儘快釋放出現金流,公司想把這批庫存消化。如果你主持這件事情:
(1)你打算從什麼角度來分析庫存結構?
(2)按照優先權,哪些子類目的庫存應該最先清理,依據是什麼?
(3)通過對不同地域的客戶群購買特徵的數據分析,你能得到什麼樣的結論並基於此結論制定何種有效的清倉計畫?
(4)為了防止庫存積壓的事件重現,請你通過數據分析,能否給出在訂貨時間節點和數量兩方面的彈性補貨機制,並依據女裝的銷售生命周期,在保證庫存量和公司利潤兼容的情況下,選擇什麼樣的清貨流程才最佳?
7.在女裝類目中(也包括其他服裝類目),視覺效果表現往往需要藉助模特去表現,因為服裝只有穿在模特身上才能完美詮釋神韻,但是模特是有生命周期的,而且品牌風格的轉變也是需要更換模特。在更換模特的時候,原來的女性客戶往往表現出不買賬抑或不支持的聲音,而且通常反對聲音都是相當的激烈。這是很正常的,風格轉型必然會遭遇陣痛,不可避免。但是,女人心理的天然屬性意味著即使有再多反對聲音,也會有噪音,也永遠不能完全還原整個事件的真實狀態。問題是,轉型意味著改變而不一定意味著朝好的方向改變。老闆很糾結,在大批老客戶反對聲音中,無法拿捏準是不是應該堅持轉型。
(1)你應該從數據的哪些角度分析模特轉型是否成功呢?經過客觀的數據分析結果表明,倘若模特轉型是成功的,也給老闆儘早吃一顆“定心丸”;倘若轉型不成功,也給老闆提供決策支持,及早防止老客戶開始流失。
(2)衍生另一個問題。大家都在談論“意見領袖”的作用,女模特幾乎每個女裝電商企業都在用,從需求角度上說,一些成熟有財力的女裝電商企業都希望得到在平民中有較高影響力和號召力“意見領袖”模特。問題是,“意見領袖”發揮的作用究竟有多大有沒有比較靠譜的方法分離出來以便進行合理的量化呢?比如請網路紅人代言天貓商城,取得成功的可能性有多大?
(3)目前女性SNS(Social Network Site,社交網站)分享做的比較優秀的平台有“蘑菇街”和“美麗說”。利用上面結論,請你預測一下,如果這兩個平台上具有超高人氣和眾多冬粉的美麗達人自己開一個跟她風格比較搭的網上小店,你覺得她市場號召力有多大,能不能快速地做起來(在啟動資金完備但不是燒錢的前提下,且供應鏈基本順暢)?說明:此問題伸縮性較大,所以只要給出數據分析的思路即可。
8.以下問題稍微技術性強一點。快消品客人的生命周期通常服從以下何種分布?
A.冪函式分布 B.負指數分布 C.常態分配右半部分 D.不確定
9.新客戶再次回頭購買的機率比較低,假如目前只有20%左右回頭。為了提升新客戶的二次購買率,現進行新客戶資料庫行銷。最簡單也是最容易操作的是發放10元優惠券鼓勵新客戶感受二次購物體驗。為了使客戶對我們的優惠券保有量並不總是充足的(客戶優惠券保有量過多對後續行銷活動會有所鉗制),優惠券有效期設定為一周。但是,實際測試的行銷效果並不理想,優惠券使用率不到8%,儘管跟優惠券行銷的老套過時有不小的關係,不過,這不是該問題需要討論的內容。請用數據分析說明:
(1)影響優惠券使用率最重要的因子是什麼?
(2)我們猜想,按照常理推斷,剛剛進入網購的客戶(這可以從淘寶或者獨立B2C商城的信用等級來大致區分,比如一顆心的客戶與一黃鑽的客戶相比,前者網購時間大概不會太長),應該更在乎優惠券,而網購達人應該覺得優惠券不是很稀罕。請從數據分析的角度來預測,如果新客戶行銷方案改成二顆心以下(含兩顆心)的客戶使用優惠券行銷,而兩顆心以上的客戶改用其他更有新意一點的行銷方式,那么10元優惠券對兩顆星的新客戶刺激購買是否有顯著提升作用呢?
備註:原始優惠券、客戶等級數據及訂單數據此處略去。
10.客戶沉睡周期如何劃分才有利?如果周期過短,也許會打擾到客戶甚至引起客戶逆反心理從而造成了客戶永久性流失;如果周期過長,對於沉睡客戶的喚醒是極為不利的,其可以喚醒的機率會伴隨周期的變長而急劇衰減。
3.2.2 數據挖掘是有巨大價值的,但結論常常是錯誤的
數據挖掘顯然不是萬能的。比如在廣告投放方面(任何一個規模公司,不論去梅地亞中心進行廣告競標,還是在各大入口網站硬廣投放,廣告費用都是不菲的),希望能對目標人群進行精準投放。地毯式的廣告會吸引人的注意,但是未必會引起別人的興趣。假設我們經過數據挖掘得出30~45歲的年輕高級白領女性是我們的潛在客戶,並且經過進一步分析知道她們經常登錄的社交網站及習慣出入的公共場合。於是,我們依據數據挖掘的信息實施廣告的定點投放,但是發現目標客群的回響機率只有15%左右。高達85%的客群人群對廣告置之不理,看起來是一件相當沮喪的事情。換句話說,對大部分的個體消費者來說,數據挖掘的人群定位差不多都是錯的。
儘管數據挖掘不是很精確,但數據挖掘是有價值的。雖然預測出來的客群人群只有15%產生了效果,但是相比沒有使用數據挖掘,憑經驗或者漫無目的地全方位的廣告轟炸,效果要好得多,就像現在推銷保險如果繼續採取挨個電話推銷,很容易把客戶打死,下次再想把保險推銷出去就會變成幾乎不可能事件,所以,講究策略很重要。沒有方向性的廣告實際上就是廣告的隨機播放,碰見目標用戶的機率極低,可能只有2%的客戶回響。從商業角度來解析,數據挖掘過程換來15%的回響客戶是非常值得的。當然,從市場行銷的另一個角度來說,正是因為數據挖掘在有些時候不是很精準,廣告投放具有一定的隨機性,才不會失去拓展市場的機會。所以,我們在廣告有效投放的時候,也需要一些不確定性,保證吸引目標群體的同時,也教育或者培育可能是我們的潛在客戶使之覆蓋面更廣。最好的比例可能是希望廣告吸引來的80%是我們現在的客戶,20%是未來客戶,“二八法則”,總之為未來潛在的客戶也預留覆蓋的機會。假如有一份廣告,95%的客戶都產生了購買行為,從眼前來講,這份廣告是異常成功的,其實不然。從長遠目光來看,這份廣告的客群面過於狹窄。
圖3-10就是根據多次試驗條件下,得出某項活動的人群回響率。我們針對活動可能吻合的消費人群進行評級,越評級高的對活動回響率越高。
一般情況下,在廣告投放之前,都會進行必要的評估。比如在大型入口網站上投放廣告,我們可以根據已有的數據模擬一下廣告的效果,比如,用與CPC進行比較,看看廣告是否值得投放。其中,UV是網站訪問人數,CPC是廣告每次點擊花費的成本。
3.2.3 客觀認識數據挖掘
數據挖掘工程師在某種意義上講,他們是電商操盤手的“軍師”。數據挖掘最重要的支撐點在一個“挖”字。何謂“挖”?就是憑經驗和肉眼看不出來的現象和行為規律,通過數據分析展示出來。所以,數據挖掘一定是預先沒有的結論而通過各種方法的分析從數據中提取出來的,而不是一眼看出來的,比如在電子商務數據挖掘關聯推薦的案例中,作者曾經碰見通過挖掘3C商品(Computer、Communication、Consumer Electronics)訂單數據來找出關聯商品,不過不幸的是,得出的結論常常是尷尬的,比如得出這樣的結論:經過對海量數據進行挖掘,發現手機和手機殼的關聯性特別大。實際上,得出的關聯銷售結論是正確的,只是用處不大,因為該結論再現了商業常識。換句話講,從數據里挖出來的結論引導公司運營,而不是用肉眼看出顯而易見的結論,然後羅列數據去佐證它,這中間的邏輯關係不能本末倒置了。數據挖掘最膚淺的表現是所從事的行業背景與統計學技術之間找不到挈合點,更甭提大而化之地、誇誇其談所謂的“數據驅動運營”了。
我們還要警惕數據的“小數定理”,這也是數據挖掘的局限性之一。與之相對應的,從統計學的角度已經知道,“大數定理”告訴我們,樣本越多越會接近事情的真相。但是,很多時候在進行數據挖掘的過程中,縱然樣本很多,技術使用非常高深,還是會出現情緒性的偏差,數據挖掘的結論幾乎總是收斂於50%左右,這讓數據挖掘陷入困境。比如在女裝電商公司,為了減少庫存的壓力,常常採用“預覽”策略,就是客戶可以對商品進行收藏和評價,公司會根據女性客戶“民意”走向來大概預估商品的階段性銷售數量。但是,經常事與願違,之前看起來喜歡該商品的女性客戶等商品真的上架銷售之後,很可能不再買。這樣案例還有很多,不管採集的樣本容量有多大,結論總會出現不可控的情緒性偏差,尤其在女性各項消費領域表現尤甚。因此,儘量縮短女性客戶的思考時間有利於提升商品轉化率(注意:“思考時間”跟“停留時間”是截然不同的兩個概念,不要混淆)。
另外,正確運用數據挖掘模型,否則就不能達到預期目的。在電子商務行業會經常使用RFM模型來進行會員行銷。對於CRM維護,作者看到近年各種CRM軟體如雨後春筍,都在搶占市場。巧合的是,每個CRM軟體裡面似乎總有一個叫RFM模型:最近一次消費時間(Recency)、消費頻率(Frequency)、消費金額(Monetary)三個方面。這個RFM模型最早來自美國零售行業,被我們電商業界移植到國內電商CRM環境下,不僅對客戶群體的劃分粗糙,而且是水土不服。看起來有經典理論作為支撐,宣傳起來也有理有據,但是實際效果定然不痛不癢。數據挖掘會經常用到數據建模,比如這個RFM模型用於對流失客戶的聚類上,除了R/F/M要素之外,僅對於淘寶賣家(其他獨立B2C網上商城類似)來說,買家中差評和投訴的頻率一定直接影響到客戶是否流失但無法體現在RFM模型里。至少,這個經典模型需要修正。我們看一個運用人工神經網路基於RFM模型來預測客戶的留存問題。圖3-11是神經網路的結構,最上層四個點分別表示R/F/M三要素和中差評次數這四個指標,中間一層是神經網路的CPU處理器,最下面一層是預計留存的結果(繼續保留或者流失),這裡面還耦合了很多高新技術,就沒必要說明了。我們訓練客戶樣本數為46053對,計算機經過三天三夜的不間斷計算,樣本預測結果如圖3-12所示:尚存客戶(沒有流失的客戶)的預測準確率47%,流失用戶的預測準確率70%(該公司的客戶回頭率極低,為15%~20%之間波動)預測效果非常差,通過此案例,我們至少得出四方面的啟示:
RFM模型雖然經典,但是並非放之四海而皆準,需要結合實際使用情景。
數據分析樣本的選擇特別重要。
並非技術越高級、越華麗,得出結論就越有價值,實用性總是第一位的。
再現了“小數定理”,雖然樣本較多,技術很高,但是預測結果很差。

作者簡介

雪鷹傳奇真名李必文,國內電商“數據驅動學”的倡導者和領跑者,數據分析“AVSM法則”的創始人。知名電商經理人,具有豐富的電子商務一線從業經驗;國內兩家知名電商商學院量化管理和數據化運營方向講師;北京某著名線下品牌熟女皮草電商項目戰略顧問。
目前在上海陸家嘴一家國資背景的金融集團管理層任職,主要研究方向是大數據、BI(商業智慧型)和網際網路金融。

前言

當今社會,經濟形態和商業文明已經進入整合階段,比如電商耦合了物流、零售、支付手段、網際網路等載體,各種載體產生的數據匯整在一起便形成“大數據”。大數據的故事、傳奇、思想和成功案例,我們已耳熟能詳,在本書中亦有大量電商案例介紹。真正的大數據,不是噱頭,更不是空心的概念,是“夢想照進現實”般的落地和創造豐厚的經濟價值。
商業中的大數據
“大數據”若按照學術界的嚴格定義,其量級通常不低於1PB(也就是1024TB)。電商各種數據源量級巨大,但是相對粗糙、噪聲高,甚至部分是流水,經過數據的篩選、洗滌、轉換、聚合等動作之後,“大數據”往往會變成可供商業分析和挖掘“小數據”。所以,大數據是相對的。
目前,儘管大數據如火如荼,但是商業模式和盈利模式並不清晰。能算得上真正的“大數據”量級同時完全由大數據創造的巨額經濟價值足以養活整個公司的企業,在筆者看來,僅網路搜尋巨擘谷歌和百度兩家。而大部分商業場景之下的基於數據的決策倘若按照“大數據”的學術定義,皆稱不上大數據,但是數據化決策和管理屢見不鮮、無處不在。所以,商業中(包括電商行業)的大數據一般指的是數據維度比較豐滿且數據觀測數在1000萬以上的規模。
數據驅動電商
電商企業的興衰榮辱總能最先在運營數據方面窺見端倪,數據亦能在量化層面揭櫫電商生態的進化與成長。電商群雄逐鹿中原,數據驅動主宰沉浮。
數據驅動跟數據分析、數據挖掘和數學建模有本質的區別,後面三種皆側重數據技術層面,沒有考慮到商業流程和使用者。數據驅動的核心是數據創造生產力。筆者不論在商學院傳道授業解惑,還是在企業的管理實踐中,總是不停地重申:數據只有產生價值才會有價值。
數據與商業結合,懂商業才能談數據分析或挖掘,兩者皆成為業界共識,但是如果說數據撐持商業則過於籠統,沒有說到點子上,數據應當是作用於“商業決策點”,哪裡遇到決策的拐點,哪裡便需要數據,並不是商業和商務中方方面面都離不開數據。認清數據在商業中的角色也很重要。
本書由來
筆者曾一直想寫一本電子商務數據化管理和數據化運營方面的書。數據驅動主題的電商教材並不多見,源於一線的真實、有效的商業案例則更少。筆者浸淫電商行業多年,非常希望能把自己團隊的數據化管理和運營經驗編撰起來,彙編成一本書,讓後來者稍有借鑑。
約莫大半年前的一天,電子工業出版社的張彥紅老師通過阿里巴巴公司的朋友找到筆者,表明希望出版數據電商書籍的意向。我們不謀而合,筆者非常榮幸地接下了這本有關數據電商的書,並下定決心拼盡全力、盡筆者所能寫一本像樣的書。但是,動起手來並不容易,認認真真寫一本書是一件很苦的事情,也是一件很痛苦的事情。筆者給自己制定的寫作計畫是半年時間,如此速度還是基於現已掌握豐富寫作素材的基礎上。於是,白天上班,夜晚和周末推掉了一切應酬,筆耕不輟,有時候為了確認案例中的數據是否靠譜,便要推敲好幾天。終於,這本書如期跟大家見面了。
本書著眼於電商數據化的思想,儘量弱化各種深奧難懂的技術細節,但是如果全是思想就流於泛泛而論、空洞無物,內容略顯膚淺,而且不容易深入掌握商業案例的本質。所以,筆者對內容結構的部署也做了一番精心編排。全書分成三個層次:第一個層次著眼於電商的思想,商業模式是電商從業者必須了解的;第二個層次是基礎性的數據驅動方法和商業案例;第三個層次是大數據方面的高級套用,讀者在這個層次中不僅會感受到大數據的思想,同時筆者會立體呈現完整的大數據案例。為了讓本書內容深入淺出、形象生動,對關鍵性的技術以“知識小卡片”的形式展現給讀者,期望能達到“知其然並知其所以然”的效果。
本書特點
這本書特色鮮明,縱觀全書有以下一些特點:
(1)不論是獨立B2C還是阿里系電商都通用。書中大量的商業案例既有來自獨立B2C的,也有來自淘寶、天貓、京東等平台的。筆者試圖把數據驅動體系納入到整個電商生態中去闡述。
(2)豐富詳實的真實商業案例。筆者一直以為,只有真實、有效的商業案例才能對讀者具有正確的導向性。原創、豐富的案例是這本書最鮮明的特色。例如為了使供應鏈數據化管理的數據源更加合理,筆者僅清洗大量數據就花費了兩周左右的時間。每個案例的遴選,站在筆者的角度上,都來之不易。
(3)側重數據思路的設計。在寫作過程中,一直有一個問題困擾筆者,就是不斷地問自己:這本書的價值在哪裡?現在,這本不算特別厚實但是筆者嘔心瀝血之作的價值在於,電腦雖然能替代人工計算過程,但是永遠無法替代數據驅動的思想和思路,必須由我們人類賦予計算機以睿智的思路,計算機只是把我們解決問題的思路做成軟體封裝起來而已。另外,側重數據分析、挖掘思路的設計與僅圍繞數據求解工具闡述事實相比,書籍不容易過時。
(4)本書具有一些獨特的內容。譬如用博弈論解釋了淘寶平台商家集群的現象,用弗洛伊德夢的解析理論去解釋網際網路生態等,並非筆者牽強附會,而是知識之間確實可以融會貫通。有的時候,我們以為發現了或者發明了一種新方法或新理論,其實有可能在其他領域早已可以找到影子。
(5)對技術思路做了化繁為簡的講解。書中所講解的商業案例很多都是根據數據驅動大項目改編而來,以期儘可能使案例精彩、詳實;至於技術層面,部分來自當前先進的人工智慧技術和一些統計學理論。為了規避讀者閱讀的時候,生僻的技術理論所帶來的不適應的體驗,我們對技術思路做了化繁為簡的講解,對結論做了近似白話的敘述。
(6)注重舉一反三能力的培養。德國教育學家斯普朗格曾說:“不是傳授已有的東西,而是要把人的創造力量誘導出來,將生命感、價值感喚醒。喚醒,是一種教育手段。父母和教師不要總是叮嚀、檢查、監督、審查他們。孩子一旦得到更多的信任和期待,內在動力就會被激發,會更聰明、能幹、有悟性。” 斯普朗格的方法論不僅適合孩子的教育,亦對筆者有所啟示。讀完這本書,相信讀者會有更多的靈感。靈感也許並不來自這本書,但是有可能是閱讀過程中碰撞出來的。創造力是需要被哪怕一點點微弱的靈感喚醒的。
(7)內容詳實,文字活潑,字裡行間透射靈動鮮活的魅力。在本書編寫過程中,在保證描述精準的前提下,我們摒棄那些刻板、索然無味的文字,讓文字也有活力和張力。
這本書能夠如期完成,筆者的夫人查玲鳳女士功不可沒,是她分擔了家庭的里里外外才讓筆者有足夠的時間和精力去編寫這本書。還要重點感謝電子工業出版社張彥紅老師(出版喜洋洋)長期的鼓勵和支持,因為寫作難度極大,曾經一度想放棄。另外,感謝電子工業出版社各位文字校對老師及給出中肯意見的各位老師,辛苦了!
這本書適合獨立B2C商城的高管、各種電商平台的店長和數據驅動相關從業者使用,也適合作為在校電子商務本科生和研究生的參考用書。
由於筆者經驗和知識水平有限,書中若有疏漏或者紕漏的地方,還請讀者朋友們不吝批評指正。
雪鷹傳奇
上海市浦東新區陸家嘴
2014年2月

相關詞條

熱門詞條

聯絡我們