隨著大數(shù)據(jù)時(shí)代的來臨,大數(shù)據(jù)分析也應(yīng)運(yùn)而生。大數(shù)據(jù)作為時(shí)下最火熱的IT行業(yè)的詞匯,其爆炸式增長在大容量、多樣性和高增速方面,全面考驗(yàn)著現(xiàn)代企業(yè)的數(shù)據(jù)處理和分析能力;同時(shí),也為企業(yè)帶來了獲取更豐富、更深入和更準(zhǔn)確地洞察市場行為的大量機(jī)會。對企業(yè)而言,能夠從大數(shù)據(jù)中獲得全新價(jià)值的消息是令人振奮的。
然而,大數(shù)據(jù)時(shí)代是到來,那么大數(shù)據(jù)意味著什么,它到底會改變什么?如何從大數(shù)據(jù)中發(fā)掘出“真金白銀”則是一個(gè)現(xiàn)實(shí)的挑戰(zhàn)。僅僅從技術(shù)角度回答,已不足以解惑。如果來個(gè)必須,大數(shù)據(jù)只是賓語,那么離開了人這個(gè)主語,它再大也沒有意義。所以我們需要把大數(shù)據(jù)放在人的背景中加以透視,理解它作為時(shí)代變革的力量。
作為通用的一種分析手段,我們不妨把這個(gè)主語化成“涂料行業(yè)”,分析大數(shù)據(jù)對涂料行業(yè)的影響,解讀為何大數(shù)據(jù)分析能為涂料行業(yè)帶來時(shí)代變革的力量。
涂料大數(shù)據(jù)應(yīng)用案例
數(shù)據(jù)時(shí)代下 涂料行業(yè)的大數(shù)據(jù)分析
之一:油水之爭
近兩年,涂料行業(yè)討論最激烈的問題就是水性漆將代替油性漆的時(shí)代已經(jīng)到來了。涂料行業(yè)發(fā)展到今天已經(jīng)算得上是成熟的行業(yè),傳統(tǒng)的油性涂料和現(xiàn)代創(chuàng)新性的水性涂料,究竟誰的優(yōu)勢強(qiáng),亦或者有界別于兩者的一種特殊涂料的存在,符合人們的時(shí)代發(fā)展需求。大數(shù)據(jù)分析的優(yōu)勢是可以通過收集起來的數(shù)據(jù),預(yù)測未來涂料行業(yè)發(fā)展的大趨勢,通過這些預(yù)測,涂料企業(yè)便可以進(jìn)行有效的改革創(chuàng)新。
之二:電商領(lǐng)域的涂料企業(yè)
越來越多的涂料企業(yè)開始涉足大數(shù)據(jù)平臺,利用大數(shù)據(jù)精準(zhǔn)的分析能力,和海量的信息庫,對市場的需求方向進(jìn)行整體把握。對于涉足電商領(lǐng)域的涂料企業(yè)而言,大數(shù)據(jù)存在的意義是,它能通過網(wǎng)絡(luò)平臺反映的顧客“大數(shù)據(jù)”信息,使互聯(lián)網(wǎng)企業(yè)可以更加準(zhǔn)確地對用戶進(jìn)行行為分析、需求挖掘。通過大數(shù)據(jù)提供分析,涂料企業(yè)便會對關(guān)注度高的產(chǎn)品進(jìn)一步加大推廣投入。借鑒服裝行業(yè)"打爆款"的策略思路,將一個(gè)單品做出一個(gè)成規(guī)模的量級,這對于企業(yè)來說將是極大的利好。
之三:涂料企業(yè)的品牌宣傳
作為社會上一個(gè)不較為人所了解的領(lǐng)域,涂料行業(yè)一直都是在“摸著國外的石頭過河”,其中,國外的石頭就是指立邦、多樂士、威士伯等國際著名涂料品牌。在中國,由于相關(guān)媒體或機(jī)構(gòu)對涂料行業(yè)的關(guān)注度一直都不高,所有,涂料行業(yè)很多數(shù)據(jù)價(jià)值一直都被人們所忽視,消失在歷史的輪轉(zhuǎn)中。過去,涂料企業(yè)對數(shù)據(jù)的認(rèn)知也局限于一些宏觀數(shù)據(jù),例如年產(chǎn)量、年增長率、月產(chǎn)量等宏觀信息,對消費(fèi)者的認(rèn)知一般只是通過線下調(diào)查問卷的方式來攝取。
知識普及:
大數(shù)據(jù)分析的五階段:
1.Sample:抽取一些代表性的樣本數(shù)據(jù)集(通常為訓(xùn)練集、驗(yàn)證集和測試集)。樣本容量的選擇標(biāo)準(zhǔn)為:包含足夠的重要信息,同時(shí)也要便于分析操作。該步驟涉及的處理工具為:數(shù)據(jù)導(dǎo)入、合并、粘貼、過濾以及統(tǒng)計(jì)抽樣方法。
2.Explore:通過考察關(guān)聯(lián)性、趨勢性以及異常值的方式來探索數(shù)據(jù),增進(jìn)對于數(shù)據(jù)的認(rèn)識。該步驟涉及的工具為:統(tǒng)計(jì)報(bào)告、視圖探索、變量選擇以及變量聚類等方法。
3.Modify:以模型選擇為目標(biāo),通過創(chuàng)建、選擇以及轉(zhuǎn)換變量的方式來修改數(shù)據(jù)集。該步驟涉及工具為:變量轉(zhuǎn)換、缺失處理、重新編碼以及數(shù)據(jù)分箱等。
4.Model:為了獲得可靠的預(yù)測結(jié)果,我們需要借助于分析工具來訓(xùn)練統(tǒng)計(jì)模型或者機(jī)器學(xué)習(xí)模型。該步驟涉及技術(shù)為:線性及邏輯回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、偏最小二乘法、LARS及LASSO、K近鄰法以及其他用戶(包括非SAS用戶)的模型算法。
5.Assess:評估數(shù)據(jù)挖掘結(jié)果的有效性和可靠性。涉及技術(shù)為:比較模型及計(jì)算新的擬合統(tǒng)計(jì)量、臨界分析、決策支持、報(bào)告生成、評分代碼管理等。數(shù)據(jù)挖掘者可能不會使用全部SEMMA分析步驟。然而,在獲得滿意結(jié)果之前,可能需要多次重復(fù)其中部分或者全部步驟。
|