November??2007No.11
基于數(shù)據(jù)挖掘技術(shù)的企業(yè)智能競(jìng)爭(zhēng)情報(bào)系統(tǒng)研究
閆曉妍
(鄭州大學(xué),鄭州450001)
??摘 要! 現(xiàn)代意義的企業(yè)競(jìng)爭(zhēng)是經(jīng)濟(jì)發(fā)展的動(dòng)力所在,許多大中型企業(yè)都非常重視競(jìng)爭(zhēng)情報(bào)策略的制定,紛紛建立企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng),以提高企業(yè)競(jìng)爭(zhēng)力。隨著網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)的不斷發(fā)展,將數(shù)據(jù)挖掘技術(shù)引入企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)是一個(gè)嶄新的、有重要意義的課題。本文從數(shù)據(jù)挖掘的含義和一般過(guò)程入手,分析了數(shù)據(jù)挖掘的相關(guān)技術(shù)及數(shù)據(jù)挖掘在企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)中的應(yīng)用,重點(diǎn)探討如何構(gòu)建基于數(shù)據(jù)挖掘技術(shù)的企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)。
??關(guān)鍵詞! 數(shù)據(jù)挖掘;競(jìng)爭(zhēng)情報(bào);企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)
??Abstract! Moderncompetitionbetweenenterprisesisthedynamicforceofeconomy.Manylargeenterprisespaymoreattentiontoinformationstrategy,andtheybuildenterprisecompetitionintelligencesystemsinordertoenhancetheircompetitiveability.Alongwiththedevelopmentofnetworktechnologyanddatabasetechnology,enterprisecom??petitionintelligencesystemsbasedondataminingisanewandimportanttopic.Thispaperintroducestheconceptofda??taminingandthegeneralprocess,analyzesrelevanttechnologiesanditsapplicationsintheenterprisecompetitionintel??ligencesystem,thendiscusseshowtobuildenterprisecompetitionsystembasedondataminingtostrengthenthecom??petitiveofenterprise.
??Keywords! datamining;competitiveintelligence;enterprisecompetitiveintelligencesystem
??中圖分類(lèi)號(hào)!F270??05
??文獻(xiàn)標(biāo)識(shí)碼!A
??文章編號(hào)!1008-0821(2007)11-0187-03
現(xiàn)代意義的企業(yè)競(jìng)爭(zhēng)是經(jīng)濟(jì)發(fā)展的動(dòng)力所在,?適者生modeling)、分析關(guān)聯(lián)(linkanalysis)、偏差檢測(cè)(deviation
存,優(yōu)勝劣汰#這一市場(chǎng)競(jìng)爭(zhēng)法則的客觀存在迫使企業(yè)必detection)、建立依賴(lài)模型(dependencymodeling)和概括總須不斷提高自身的競(jìng)爭(zhēng)力。企業(yè)想要順應(yīng)環(huán)境變化,做出結(jié)(summarization)。在國(guó)外,數(shù)據(jù)挖掘主要應(yīng)用在金融業(yè)、最優(yōu)決策,贏得競(jìng)爭(zhēng)優(yōu)勢(shì),就必須在充分了解和分析競(jìng)爭(zhēng)零售業(yè)等行業(yè),涉及市場(chǎng)營(yíng)銷(xiāo)、風(fēng)險(xiǎn)管理、欺詐偵測(cè)環(huán)境及競(jìng)爭(zhēng)對(duì)手的基礎(chǔ)上,制定科學(xué)的競(jìng)爭(zhēng)戰(zhàn)略。競(jìng)爭(zhēng)情(Frauddetection)、客戶(hù)關(guān)系的建立和維護(hù)等過(guò)程。
報(bào)可以說(shuō)是企業(yè)賴(lài)以生存的繼人才、資金、技術(shù)之后的第2 數(shù)據(jù)挖掘
四種要素,是現(xiàn)代企業(yè)競(jìng)爭(zhēng)戰(zhàn)略的關(guān)鍵部分。
數(shù)據(jù)挖掘(DataMining)是指從大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)1 企業(yè)競(jìng)爭(zhēng)情報(bào)與競(jìng)爭(zhēng)情報(bào)系統(tǒng)
中的大量數(shù)據(jù)中提取輔助決策的關(guān)鍵性知識(shí),這些知識(shí)是?競(jìng)爭(zhēng)情報(bào)#是從英文CompetitiveIntelligence翻譯過(guò)來(lái)隱含的、未知的、非平凡的及潛在有用的信息或模式,其
的,簡(jiǎn)稱(chēng)CI。關(guān)于競(jìng)爭(zhēng)情報(bào),國(guó)際上有來(lái)自不同領(lǐng)域、不目的是為了提高市場(chǎng)決策能力、環(huán)境監(jiān)視、風(fēng)險(xiǎn)預(yù)警、在
同研究方向的學(xué)者的多種解釋,如Cottrill和Kotler、斯丹文經(jīng)驗(yàn)?zāi)P突A(chǔ)上預(yù)測(cè)未來(lái)趨勢(shì)等,把握行業(yè)結(jié)構(gòu)的進(jìn)化,?德迪約的過(guò)程說(shuō),認(rèn)為競(jìng)爭(zhēng)情報(bào)是一種過(guò)程,即情報(bào)的采跟蹤正在出現(xiàn)的連續(xù)性和非連續(xù)性變化,以及分析現(xiàn)有和集、加工和分析過(guò)程;也有不少學(xué)者認(rèn)為競(jìng)爭(zhēng)情報(bào)是一種潛在競(jìng)爭(zhēng)對(duì)手的能力和方向,從而幫助企業(yè)贏得競(jìng)爭(zhēng)優(yōu)勢(shì)。產(chǎn)品,是上述過(guò)程的產(chǎn)物,德迪約?伯恩哈特、戈登都持有這些知識(shí)的表現(xiàn)形式可以是概念(Concepts)、規(guī)則此觀點(diǎn)。我國(guó)學(xué)者包昌火認(rèn)為:?競(jìng)爭(zhēng)情報(bào)是關(guān)于競(jìng)爭(zhēng)環(huán)(Rules)、規(guī)律(Regularities)、模式(Partems)、約束(Con??境、競(jìng)爭(zhēng)對(duì)手和競(jìng)爭(zhēng)策略的信息和研究。它既是一種過(guò)程,straints)、可視化(Visualizations)等。
又是一種產(chǎn)品。過(guò)程是對(duì)競(jìng)爭(zhēng)情報(bào)的搜集和分析;產(chǎn)品是2??1 數(shù)據(jù)挖掘的一般過(guò)程
指由此形成的情報(bào)或策略。#競(jìng)爭(zhēng)情報(bào)的目的是為企業(yè)經(jīng)營(yíng)數(shù)據(jù)挖掘是一種新的信息處理技術(shù),其主要特點(diǎn)是對(duì)決策提供情報(bào)保障,提高企業(yè)的核心競(jìng)爭(zhēng)力。
數(shù)據(jù)庫(kù)中的大量數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)是企業(yè)為了增強(qiáng)競(jìng)爭(zhēng)力而建立起來(lái)處理,并從中提取輔助決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘過(guò)程的,以人工智能為主導(dǎo)、信息網(wǎng)絡(luò)為手段,人機(jī)結(jié)合的戰(zhàn)包括數(shù)據(jù)準(zhǔn)備、挖掘過(guò)程和模式的解釋和評(píng)價(jià)等幾個(gè)階段。略決策系統(tǒng)和咨詢(xún)系統(tǒng)。競(jìng)爭(zhēng)情報(bào)系統(tǒng)通過(guò)對(duì)競(jìng)爭(zhēng)對(duì)手的數(shù)據(jù)挖掘的一般過(guò)程如圖1所示。
追蹤分析及企業(yè)自身和外部競(jìng)爭(zhēng)環(huán)境的相關(guān)競(jìng)爭(zhēng)性情報(bào)的2??1??1 數(shù)據(jù)準(zhǔn)備階段
收集、存儲(chǔ)、處理、分析,并以適當(dāng)方式為企業(yè)決策者提數(shù)據(jù)準(zhǔn)備對(duì)于數(shù)據(jù)挖掘的成功應(yīng)用至關(guān)重要,數(shù)據(jù)準(zhǔn)供信息支持。數(shù)據(jù)挖掘過(guò)程主要通過(guò)聚類(lèi)分析(clustering/備階段需要進(jìn)行數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)縮減和轉(zhuǎn)化。segmentation)、可視化(visualization)、預(yù)測(cè)模型(predictive
數(shù)據(jù)集成從多個(gè)文件、異構(gòu)數(shù)據(jù)庫(kù)中提取并集成數(shù)據(jù),需
收稿日期:2007??07??12
基金項(xiàng)目:本文是河南省教育廳自然科學(xué)基金項(xiàng)目(編號(hào):200787003)的研究成果之一。
作者簡(jiǎn)介:閆曉妍(1985??),女,鄭州大學(xué)信息管理系06級(jí)碩士研究生,研究方向:網(wǎng)絡(luò)信息資源管理,已發(fā)表論文1篇。
??187??%
企業(yè)情報(bào)
工作
現(xiàn)代情報(bào)
2007年11月第11期November??2007No.11
圖1 數(shù)據(jù)挖掘的一般過(guò)程
要解決語(yǔ)義二義性,規(guī)范數(shù)據(jù)格式,消除冗余、重復(fù)的數(shù)警以及潛在顧客發(fā)現(xiàn)。據(jù),同時(shí)對(duì)數(shù)據(jù)進(jìn)行清洗,消除噪聲數(shù)據(jù)、異常數(shù)據(jù)及不完整數(shù)據(jù);數(shù)據(jù)選擇是在相關(guān)領(lǐng)域?qū)<抑R(shí)的指導(dǎo)下,辨別出需要進(jìn)行分析的數(shù)據(jù),縮小處理范圍,提高數(shù)據(jù)挖掘
%
2??2??2 決策樹(shù)分析法
決策樹(shù)是一種樹(shù)型結(jié)構(gòu)的預(yù)測(cè)模型,決策樹(shù)分析首先利用決策樹(shù)算法尋找數(shù)據(jù)庫(kù)中具有最大信息量的屬性作為訓(xùn)練集建立決策樹(shù)的根節(jié)點(diǎn),再根據(jù)屬性值大于或小于根節(jié)點(diǎn)的屬性值建立樹(shù)的分支,直至所有的屬性都被歸入樹(shù)型結(jié)構(gòu)中,然后對(duì)決策樹(shù)進(jìn)行剪枝處理,最后把決策樹(shù)轉(zhuǎn)化為規(guī)則,即從每一個(gè)葉節(jié)點(diǎn)得出決策規(guī)則。其中樹(shù)的非終端節(jié)點(diǎn)表示屬性,葉節(jié)點(diǎn)表示所屬的不同類(lèi)別。與神經(jīng)元網(wǎng)絡(luò)最大的不同在于其決策制定的過(guò)程是可見(jiàn)的,其輸出結(jié)果較為直觀、易于理解。決策樹(shù)方法主要用于分類(lèi)挖掘,通常用于市場(chǎng)細(xì)分、產(chǎn)品定位、貸款風(fēng)險(xiǎn)分析等。2??2??3 最近相鄰技術(shù)
最近相鄰技術(shù)就是依據(jù)?Doasyourneighborsdo#原則,相鄰的數(shù)據(jù)必然有相近的屬性或行為的規(guī)律,通過(guò)發(fā)現(xiàn)那些接近新情況的舊情況,并假設(shè)新情況的結(jié)果將于那些舊情況(已知案例)的大多數(shù)一致,即通過(guò)K個(gè)與之最相近的歷史記錄的組合來(lái)辨別新的記錄,有時(shí)也稱(chēng)這種技術(shù)為與K最近鄰方法。最近相鄰技術(shù)可以用于聚類(lèi)、偏差分析等任務(wù)。
2??2??4 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是一種通過(guò)訓(xùn)練來(lái)學(xué)習(xí)的非線性預(yù)測(cè)模型,具有對(duì)非線性系統(tǒng)數(shù)據(jù)的快速擬合能力,可以完成分類(lèi)、聚類(lèi)、特征提取等多種數(shù)據(jù)挖掘任務(wù)。其最大特點(diǎn)在于它具有學(xué)習(xí)能力,可以通過(guò)學(xué)習(xí)大量樣本數(shù)據(jù),來(lái)獲取輸入、輸出之間的函數(shù)關(guān)系。人工神經(jīng)網(wǎng)絡(luò)采用信息分布式存儲(chǔ)方式,具有很強(qiáng)的聯(lián)想能力,而且識(shí)別速度快,很適合處理大量的數(shù)據(jù),進(jìn)行海量數(shù)據(jù)挖掘。人工神經(jīng)網(wǎng)絡(luò)在事務(wù)數(shù)據(jù)庫(kù)的分析和建模方面應(yīng)用廣泛。2??2??5 可視化
采用直觀的圖形方式將信息模式、數(shù)據(jù)的關(guān)聯(lián)或趨勢(shì)呈現(xiàn)給決策者,決策者可以通過(guò)可視化技術(shù)交互的分析數(shù)據(jù)。這是一類(lèi)輔助方法,數(shù)據(jù)可視化極大的擴(kuò)展了數(shù)據(jù)表達(dá)能力和人們對(duì)數(shù)據(jù)的理解能力,這在數(shù)據(jù)挖掘中是非常重要的??梢暬抢糜?jì)算機(jī)支撐的、交互的、對(duì)抽象數(shù)據(jù)的可視表示,來(lái)增強(qiáng)人們對(duì)這些抽象信息的認(rèn)知,便于找出潛在的知識(shí)和信息。可視化是這樣一個(gè)過(guò)程,它將非空間的信息用圖像、曲線、三維圖形和動(dòng)畫(huà)顯示,充分利用人們對(duì)可視模式快速識(shí)別的自然能力去進(jìn)行觀測(cè)、瀏覽、判別和理解信息。在這個(gè)過(guò)程中,人們利用計(jì)算機(jī)系統(tǒng)從屏幕上觀察交互圖形、圖像并通過(guò)可視模型處理信息。
的效率和質(zhì)量;另外在數(shù)據(jù)在經(jīng)過(guò)挖掘前,必須要加以精煉處理,降低復(fù)雜數(shù)據(jù)的維數(shù),減少有效變量的個(gè)數(shù),以
減輕數(shù)據(jù)挖掘工作的復(fù)雜性。2??1??2 挖掘知識(shí)和信息
挖掘知識(shí)和信息是數(shù)據(jù)挖掘過(guò)程的重要環(huán)節(jié),包括確定挖掘的任務(wù)類(lèi)型,即首先提出數(shù)據(jù)挖掘的假設(shè),并通過(guò)數(shù)據(jù)挖掘過(guò)程來(lái)驗(yàn)證這個(gè)假設(shè)。在確定挖掘任務(wù)的基礎(chǔ)上,選擇合適的挖掘技術(shù),不同類(lèi)型的數(shù)據(jù)有不同的特點(diǎn),特定的用戶(hù)有特定的需求,數(shù)據(jù)挖掘應(yīng)該選用與之相關(guān)的算法來(lái)實(shí)現(xiàn),如分類(lèi)模型常用決策樹(shù)來(lái)實(shí)現(xiàn),聚類(lèi)常使用聚類(lèi)分析技術(shù),關(guān)聯(lián)發(fā)現(xiàn)和序列發(fā)現(xiàn)常用來(lái)挖掘數(shù)據(jù)間的依賴(lài)關(guān)系。然后根據(jù)選定的算法,確定適當(dāng)?shù)哪P秃蛥?shù)集合,在模式空間進(jìn)行反復(fù)迭代搜索,直至從數(shù)據(jù)集合中抽取出隱藏的、新穎的模式。2??1??3 模式的解釋和評(píng)價(jià)
根據(jù)用戶(hù)的決策目標(biāo),對(duì)數(shù)據(jù)挖掘的模式進(jìn)行解釋和評(píng)價(jià),過(guò)濾出有用的知識(shí)。數(shù)據(jù)挖掘階段發(fā)現(xiàn)的模式可能不滿(mǎn)足用戶(hù)要求,這些模式需要經(jīng)過(guò)進(jìn)一步處理,包括消除無(wú)關(guān)的、多余的模式,過(guò)濾出支持企業(yè)決策的關(guān)鍵信息,利用可視化技術(shù)將有潛在有用的模式以圖形或邏輯可視化的形式表示,轉(zhuǎn)化為用戶(hù)可理解的語(yǔ)言。此外還包括解決發(fā)現(xiàn)結(jié)果與以前知識(shí)的沖突,利用統(tǒng)計(jì)方法對(duì)模式進(jìn)行評(píng)價(jià),可通過(guò)反復(fù)多次的挖掘,重新選取數(shù)據(jù),調(diào)整參數(shù),以得到最優(yōu)、最適合的模式。
企業(yè)情報(bào)工作
2??2 數(shù)據(jù)挖掘的關(guān)鍵技術(shù)
數(shù)據(jù)挖掘是綜合運(yùn)用統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、經(jīng)濟(jì)計(jì)量學(xué)等多門(mén)學(xué)科的技術(shù),尤其是近幾年來(lái),自然語(yǔ)言理解、語(yǔ)義關(guān)聯(lián)分析、詞頻分布統(tǒng)計(jì)、語(yǔ)料學(xué)研究等可以用于進(jìn)行情報(bào)分析的技術(shù)方法和工具,已經(jīng)成為數(shù)據(jù)挖掘技術(shù)的重要研究方向,并形成了大量軟件產(chǎn)品。2??2??1 關(guān)聯(lián)規(guī)則分析法
關(guān)聯(lián)規(guī)則是指在數(shù)據(jù)庫(kù)的記錄中挖掘出滿(mǎn)足一定條件的依賴(lài)關(guān)系,它揭示出數(shù)據(jù)間未知的依賴(lài)關(guān)系,實(shí)際上就是數(shù)據(jù)對(duì)象之間相關(guān)性的確定,用關(guān)聯(lián)找出所有能將一組數(shù)據(jù)項(xiàng)和另一組數(shù)據(jù)項(xiàng)相聯(lián)系的規(guī)則,這種規(guī)則的建立通常并不是確切的關(guān)系,而是具有一定置信度的可能值,一般用?支持度#和?可信度#來(lái)測(cè)度以淘汰那些無(wú)用的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則分析法可用于超市的貨架擺放和庫(kù)存預(yù)
??188??2007年11月第11期November??2007No.11
現(xiàn)代情報(bào)
3 基于數(shù)據(jù)挖掘技術(shù)的企業(yè)智能競(jìng)爭(zhēng)情報(bào)系統(tǒng)設(shè)計(jì)
智能化信息處理技術(shù)是情報(bào)學(xué)研究與應(yīng)用的前沿領(lǐng)域,企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)要想解決信息過(guò)載問(wèn)題,發(fā)揮其決策支持的功能,必須引入先進(jìn)的信息處理技術(shù)。企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)一般由競(jìng)爭(zhēng)情報(bào)收集子系統(tǒng)、數(shù)據(jù)預(yù)處理子系統(tǒng)、數(shù)據(jù)挖掘子系統(tǒng)及服務(wù)子系統(tǒng)構(gòu)成,各部分模塊功能如下:
對(duì)手,并可用于反競(jìng)爭(zhēng)情報(bào);根據(jù)用戶(hù)信息,可以將用戶(hù)進(jìn)行聚類(lèi);對(duì)用戶(hù)進(jìn)行關(guān)聯(lián)分析,可以找到用戶(hù)消費(fèi)規(guī)律、潛在用戶(hù)、易失市場(chǎng)等;長(zhǎng)期跟蹤行業(yè)網(wǎng)站,抽取企業(yè)相關(guān)的關(guān)鍵信息,可以提供市場(chǎng)預(yù)警。
3??4 服務(wù)子系統(tǒng)模塊
利用可視化技術(shù)對(duì)數(shù)據(jù)分析結(jié)果以適當(dāng)方式與用戶(hù)進(jìn)行人際交互。競(jìng)爭(zhēng)情報(bào)服務(wù)子系統(tǒng)是為整個(gè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)提供一個(gè)信息交流和共享的平臺(tái),競(jìng)爭(zhēng)情報(bào)服務(wù)子系統(tǒng)應(yīng)具有情報(bào)知識(shí)樹(shù)分類(lèi)導(dǎo)航、情報(bào)預(yù)警、多途徑檢索、最新推送服務(wù)等功能。通過(guò)對(duì)挖掘的結(jié)果進(jìn)行分析評(píng)價(jià),生成3??1 收集子系統(tǒng)模塊
根據(jù)企業(yè)確立的情報(bào)需求,收集、整理各種信息,并自動(dòng)識(shí)別與抽取所需要的文本信息,最終形成一個(gè)有關(guān)企業(yè)競(jìng)爭(zhēng)情報(bào)的文本集合。競(jìng)爭(zhēng)情報(bào)收集子系統(tǒng)是競(jìng)爭(zhēng)情報(bào)工作的基礎(chǔ),其收集信息的速度和質(zhì)量將極大的影響效能競(jìng)爭(zhēng)情報(bào)分析報(bào)告,提交企業(yè)決策者,為決策提供服務(wù)和和效益。企業(yè)競(jìng)爭(zhēng)情報(bào)的獲取可以來(lái)自于企業(yè)外部網(wǎng)絡(luò)信依據(jù)。該子系統(tǒng)模塊使用可視化技術(shù)將分析結(jié)果以適當(dāng)方息,如企業(yè)門(mén)戶(hù)網(wǎng)站、行業(yè)網(wǎng)站、競(jìng)爭(zhēng)對(duì)手網(wǎng)站、Web服式及時(shí)反饋給適當(dāng)?shù)牟块T(mén)和人員,用圖形等地顯示數(shù)務(wù)器日志文件等;也可以來(lái)自于企業(yè)內(nèi)部,如以企業(yè)的據(jù),揭示數(shù)據(jù)之間的關(guān)聯(lián)和隱藏在數(shù)據(jù)背后的信息,多途MIS、ERP等信息系統(tǒng)為中心,企業(yè)日常業(yè)務(wù)積累的數(shù)據(jù)信徑智能檢索技術(shù)使用戶(hù)可以在圖形界面上直接對(duì)空間對(duì)象息形成的關(guān)系型數(shù)據(jù)庫(kù)、文檔數(shù)據(jù)庫(kù)等;還可以來(lái)自于媒進(jìn)行查詢(xún)和分析,提供一種新的決策支持方式,從而極大體、報(bào)紙、雜志等。不同來(lái)源的數(shù)據(jù)表現(xiàn)形式多種多樣,地提高競(jìng)爭(zhēng)決策的水平。
可以是報(bào)表、圖形、音頻、視頻、演示文稿等,競(jìng)爭(zhēng)情報(bào)收集系統(tǒng)的主要任務(wù)是將不同形式、不同來(lái)源的數(shù)據(jù)通過(guò)4 結(jié)束語(yǔ)
面對(duì)企業(yè)內(nèi)外呈爆炸式增長(zhǎng)的信息,如何從中提煉出數(shù)據(jù)采集器收集起來(lái),并進(jìn)行過(guò)濾、去重規(guī)范化處理,存對(duì)企業(yè)有益的關(guān)鍵信息,是現(xiàn)代企業(yè)面臨的一個(gè)挑戰(zhàn),企儲(chǔ)在情報(bào)數(shù)據(jù)倉(cāng)庫(kù)中,為競(jìng)爭(zhēng)情報(bào)分析做好基礎(chǔ)數(shù)據(jù)準(zhǔn)備。業(yè)競(jìng)爭(zhēng)情報(bào)工作的分析功能和決策研究功能至關(guān)重要。人因此,對(duì)于不同形式、不同渠道收集的數(shù)據(jù),競(jìng)爭(zhēng)情報(bào)收們把數(shù)據(jù)視為知識(shí)的源泉,競(jìng)爭(zhēng)情報(bào)不是簡(jiǎn)單的數(shù)據(jù)堆砌,集子系統(tǒng)應(yīng)具備數(shù)據(jù)錄入、格式轉(zhuǎn)換、信息自動(dòng)歸類(lèi)等基本功能。
也不是簡(jiǎn)單的數(shù)據(jù)加工,而是要注入創(chuàng)造性的勞動(dòng),形成3??2 數(shù)據(jù)預(yù)處理子系統(tǒng)模塊
有價(jià)值的、能反映客觀事物本質(zhì)的情報(bào)產(chǎn)品,服務(wù)于企業(yè)的科學(xué)決策。競(jìng)爭(zhēng)情報(bào)系統(tǒng)個(gè)性化定制功能可以為企業(yè)提從正式渠道如外部公開(kāi)信息源、內(nèi)部工作報(bào)告、信息供最貼切的決策支持,情報(bào)來(lái)源更加廣泛,預(yù)警更加準(zhǔn)確管理系統(tǒng)等收集到的一般都是量化了的信息,易于整理排序;而利用非正式渠道,即通過(guò)電話采訪、實(shí)地調(diào)查、問(wèn)及時(shí)。數(shù)據(jù)挖掘作為一種新的商業(yè)信息處理技術(shù),是解決卷調(diào)查等方式收集到的信息多為陳述性的信息,且誤差較企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)處理海量數(shù)據(jù)的關(guān)鍵,研究數(shù)據(jù)挖掘技大,無(wú)法直接用于數(shù)據(jù)挖掘。數(shù)據(jù)預(yù)處理子系統(tǒng)主要是對(duì)術(shù)在企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)中的應(yīng)用,對(duì)增強(qiáng)我國(guó)企業(yè)的競(jìng)爭(zhēng)
數(shù)據(jù)采集器收集到的數(shù)據(jù)(主要是非結(jié)構(gòu)化和半結(jié)構(gòu)化的力有重要意義。數(shù)據(jù))進(jìn)行提煉、固化、過(guò)濾、清洗、轉(zhuǎn)換以及整合,導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市中結(jié)構(gòu)化存儲(chǔ),使之更加有序化,參考文獻(xiàn)以適應(yīng)特定的情報(bào)分析問(wèn)題,為數(shù)據(jù)挖掘提供符合要求的[1]劉樹(shù)民.競(jìng)爭(zhēng)情報(bào)??????挖掘企業(yè)的知識(shí)資源[M].南數(shù)據(jù)。
京:東南大學(xué)出版社,2004.
3??3 智能數(shù)據(jù)挖掘子系統(tǒng)模塊
[2]AmirM??Hormozi,StacyGiles.Datamining:ACompetitive競(jìng)爭(zhēng)情報(bào)分析是競(jìng)爭(zhēng)情報(bào)系統(tǒng)的核心,主要借助于系WeaponforBankingandRetailIndustries[M].InformationSys??統(tǒng)提供的各種分析模型以及數(shù)據(jù)挖掘工具對(duì)數(shù)據(jù)倉(cāng)庫(kù)中存temsManagement,2004:62-71.
儲(chǔ)的信息進(jìn)行綜合分析,進(jìn)行情報(bào)自動(dòng)分類(lèi)、自動(dòng)摘要、[3]苗杰,倪波.面向集成競(jìng)爭(zhēng)情報(bào)系統(tǒng)的數(shù)據(jù)挖掘應(yīng)用自動(dòng)提取、自動(dòng)聚類(lèi)等智能化處理分析,充分挖掘信息中研究[J].情報(bào)學(xué)報(bào),2004,(4):443-450.
隱藏的價(jià)值。該子系統(tǒng)主要包括數(shù)據(jù)分析以及模式發(fā)現(xiàn)工[4]沈麗容.競(jìng)爭(zhēng)情報(bào)??????中國(guó)企業(yè)生存的第四要素具,其中的數(shù)據(jù)挖掘工具是企業(yè)實(shí)現(xiàn)數(shù)據(jù)深層次挖掘的核[M].北京:北京圖書(shū)館出版社,2003.
心技術(shù),可以在大量的數(shù)據(jù)中發(fā)現(xiàn)未知的關(guān)系、模式以及[5]王知津,等.競(jìng)爭(zhēng)情報(bào)[M].北京:科學(xué)技術(shù)文獻(xiàn)出趨勢(shì)等,功能包括概念描述、關(guān)聯(lián)分析、分類(lèi)與聚類(lèi)、偏版社,2005.
差檢測(cè)、時(shí)序演變分析、信息摘要、信息抽取、元數(shù)據(jù)挖[6]王眾托.知識(shí)系統(tǒng)工程[M].北京:科學(xué)出版社,掘等。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡(luò)已經(jīng)成為企業(yè)信息的2004.
重要來(lái)源,對(duì)文本資源的挖掘技術(shù)顯得更為重要,基于文[7]張曉翊.企業(yè)信息檢索淺析[J].江漢大學(xué)學(xué)報(bào),本內(nèi)容的自動(dòng)分類(lèi)、自動(dòng)摘要、自動(dòng)聚類(lèi)以及相似性檢索2003,(6):51-53.
等技術(shù)的成熟,為企業(yè)競(jìng)爭(zhēng)情報(bào)提供了強(qiáng)有力的技術(shù)支持,[8]蒲群瑩.基于數(shù)據(jù)挖掘的競(jìng)爭(zhēng)情報(bào)系統(tǒng)模型[J].情如分析Web服務(wù)器日志及登陸數(shù)據(jù)可以幫助系統(tǒng)找到競(jìng)爭(zhēng)
報(bào)技術(shù),2005,(1):38-43.
??1??%
企
業(yè)
情報(bào)
工
作
因篇幅問(wèn)題不能全部顯示,請(qǐng)點(diǎn)此查看更多更全內(nèi)容
Copyright ? 2019- 91gzw.com 版權(quán)所有 湘ICP備2023023988號(hào)-2
違法及侵權(quán)請(qǐng)聯(lián)系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市萬(wàn)商天勤律師事務(wù)所王興未律師提供法律服務(wù)