數(shù)據(jù)準(zhǔn)備
? 數(shù)據(jù)準(zhǔn)備又可分為四個子步驟:數(shù)據(jù)選取、數(shù)據(jù)集成.?dāng)?shù)據(jù)預(yù)處理和數(shù)據(jù)變換。 ?
? 1、數(shù)據(jù)選取:根據(jù)用戶的需要從原始數(shù)據(jù)庫,數(shù)據(jù)文件等處抽取相關(guān)數(shù)據(jù)。確定發(fā)現(xiàn)任務(wù)的操作對象。
? 2、數(shù)據(jù)集成:將多種數(shù)據(jù)源集成到統(tǒng)一的數(shù)據(jù)倉庫中,組合在一起,以便于數(shù)據(jù)的進(jìn)一步處理。
? 3、數(shù)據(jù)預(yù)處理:一般包括消除噪聲、推導(dǎo)計算缺值數(shù)據(jù)、消除重復(fù)記錄完成數(shù)據(jù)類型轉(zhuǎn)換。有的數(shù)據(jù)挖掘算法專門針對離散值,因此,需要將連續(xù)值數(shù)據(jù)轉(zhuǎn)換為離散值的數(shù)據(jù)以便于符號歸納;而有的算法需要將離散值轉(zhuǎn)換為連續(xù)值,這些變換都可以在該階段完成。
? 4、數(shù)據(jù)變換:可以將數(shù)據(jù)變換或統(tǒng)一成適合挖掘的形式,并可以消減數(shù)據(jù)維數(shù),從初始特征中找出真正有用的特征以減少數(shù)據(jù)開采時要考慮的特征或變量的個數(shù)。
CRM模型建立
? 有些人認(rèn)為數(shù)據(jù)挖掘即為這一步,這可以說是狹義的數(shù)據(jù)挖掘。首先要確定任務(wù)或目的是什么,如分類、聚類、概念描述、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)等。任務(wù)確定后,要決定使用什么樣的挖掘算法。同樣的任務(wù)可以用不同的算法來實現(xiàn)。
? 選擇算法的時候主要從以下兩方面考慮:一是根據(jù)數(shù)據(jù)的特點來選擇與之相關(guān)的算法;是根據(jù)用戶或是運行系統(tǒng)的要求來選擇相應(yīng)的算法,有的用戶希望獲取描述型的容易理解的知識,有的用戶希望獲取預(yù)測準(zhǔn)確度盡可能高的預(yù)測型知識。選好算法后,運行挖掘算法,得到問題的模型。
模式解釋和評價
? CRM軟件模型建立階段發(fā)掘出的模式,經(jīng)過用戶或機器的評價,可能存在冗余或無關(guān)的模式,需要將其剔除;也有可能模式不滿足用戶要求,則需要整個發(fā)掘過程退回到發(fā)掘階段之前,如重新選取數(shù)據(jù)、采用新的數(shù)據(jù)變換方法,設(shè)定新的數(shù)據(jù)挖掘參數(shù)值,甚至換一種挖掘算法。
知識表示
? 為了便于用戶理解,實用可視化技術(shù)蔣發(fā)掘的模式,可視化,或?qū)⒔Y(jié)果轉(zhuǎn)換為用戶易懂的另一種形式表示,例如,將分類決策樹轉(zhuǎn)化為“if...then...”的規(guī)則。
版權(quán)申明:本文來自投稿,本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)文章或圖片等內(nèi)容涉嫌抄襲侵權(quán)/違法違規(guī), 請第一時間發(fā)送郵件至 416782630@qq.com 舉報,一經(jīng)查實,本站將立刻刪除!
八駿CRM系統(tǒng)是一款可以滿足醫(yī)療器械、企業(yè)服務(wù)、軟高科、制造業(yè)、貿(mào)易行業(yè)等領(lǐng)域的客戶關(guān)系管理系統(tǒng)及業(yè)務(wù)流程管理平臺,覆蓋PC端+APP,將多端數(shù)據(jù)打通并同步,并且基于客戶管理,實現(xiàn)售前、售中、售后全業(yè)務(wù)環(huán)節(jié)的人、財、物、事的管理,打造一站式業(yè)務(wù)管理平臺,并且對接釘釘、企業(yè)微信等,支持定制開發(fā),可私有化部署。咨詢合作和了解系統(tǒng)可聯(lián)系客戶經(jīng)理 15558191031(微信同號)。