close
壹、 智慧的內涵
應用統計主要是利用智慧型科技中之統計分析與資料探勘為工具,用來解決問題的學問,這是企業主要的功能中之行銷與創新的基礎,也是企業永續經營的要素。智慧型科技應用是以問題為導向之「智慧型資料分析」,就是說學習方法的時候心中要有問題之意。資料卻是已經發生的事實,泛指文字、數字、聲音及圖像等。經驗可轉換為資料,因而可以結合質化與量化分析深入研究,使問題之結構清楚,層次分明,才能對問題產生細膩的洞察力。
在企業經營中,有許多已經存在的資料,如何從個別企業所發生的資料中,獲得資訊,進一步發現知識,用來描述描述由資料萃取(Extract)知識的整個過程,稱為KDD(Knowledge Discovering in Databases),在這裡,知識的意義是指資料之間的關係(Relationships)及其型態(Patterns),而資料探勘(Data Mining)用在KDD發現知識過程中的步驟 ( cf.Adriaansand Zantinge(1996))。

當在資料庫中有大量資料隱藏著許多資訊,不能輕易由一些査詢設備(Query Facilities)所獲得,用資料探勘演算法可以在資料庫中呈現最佳聚類(Optimal Clustering)或有趣的規則(Regularities),以協助KDD的進行。資料探勘工具並不能取代資料庫查詢工具,但可以讓使用者增加許多解決問題的可能性的啟示。

KDD為過濾及分析資料的過程,其目的是在創造自我學習組織,由此可知,資料探勘是KDD的工具,而KDD是智慧型資料分析的程序。KDD可在企業中進行個案研究,由資料庫中利用決策樹(Decision Tree)建構法找到資料結構中之資料間的關係與型態,並由各水準組合了解合併狀況,再由經驗及專業判斷,再次進行重組後再進行建構樹狀圖,這樣由決策樹所提供之資訊,更能對市場動態確實掌握。接著由各種不同背景專家利用層級程序分析法(Analytic Hierarchy Process),或模糊邏輯(Fuzzy Logic),使變數間的差異層次分明,並挑選重要變數,再以多元尺度法(Multidimensional Scaling,MDS)找企業定位,利用聚類分析找到目標顧客群,對有經驗的專業人士針對所挑出之變數,進行聯合分析,分析顧客偏好,了解顧客需求,提升顧客服務的效果。

這種將過去單純質化分析的個案研究,提升至量化分析,深入問題內部結構,而不再只是一般性的歸納,這樣的個案研究才有客觀依據,論述才有深度。若進一步歸納多家企業的共同特性,再由這些資料庫中作為抽樣母體,進行抽樣作預測,將使企業具有強大的決策能力。

我們將智慧型科技之一些主種方法的精神分述如下:
一、層級程序分析法(Analytic Hierarchy Process, AHP)
Saaty 在 1971年提出層級程序分析法,以下簡稱為AHP法),為可以將問題建立層次分明的層級系統化評估的科學方法,將系統由不同的層面給予層級分解,而形成層級結構。以比例尺度(Ratio Scale)執行各因素間的評估,進行成對比較(Pairwise Comparison)評估,並以1,2,…,9的比例尺度對各評估指標間的相對權重做成對比較,建立比較矩陣,反應不同層級中各因素間的優先順序 (Priority),我們可以藉由對許多不同背景的專家的訪問結果得到一些共識。
AHP法的運算過程係將g個事物經過兩兩比較之後,透過人的知覺判斷(judgments)給予數量化的解釋,用以呈現g個事物中第i與第j事物之間的相對重要性(relative importance) 。矩陣 即為將g個事物經過兩兩比較之後的比較矩陣,並亦算特徵向量及求解最大特徵值,作為評估決策者對於兩兩比較基準之判斷是否一致之基準,當決策者對兩兩比較基準之判斷不具一致性時,矩陣A中之元素 會產生微量的變動,也會隨之作微量的改變,可用一致性指標CI(Consistency Index)來評量。但兩兩比較事物之個數增加而產生比較上的錯誤,使用隨機所產生的錯誤指標稱為隨機指標RI(Random Index),而CI值和RI值的比例即為一致性比例(CR),此一比例是用來判斷單一階層間各因素的決定一致性。
接著整合各層級要素的相對重要程度,以歸納出最底層各評估準則之權重。歸納的方法玆根據問卷調查取得專家對各層級要素相對重要程度的看法,並經由成對比較矩陣的建立、優先向量及最大特徵值的計算、並進行一致性的檢定,取得各層級要素的權重。若在三個層級的評估準則系統中,最底層評估準則的權重係從第二層要素的權重往下相乘第三層要素的權重後,即可得到整體系統下各評估準則之權重。
在各層級要素的權重計算後,便可進行整個層級權重的計算。若整個層級結構能通過一致性檢定,最後便依各替代方案之加權高低來決定最終目標的替代方案。(參考:吳萬益、林清河(2000))

二、決策樹建構法(Construction of Decision Trees)
決策樹是樹狀的資料分析與資料探勘(Data Mining)工具, 能利用樹狀圖的分割(Split)自動確認和評估區隔。利用樹狀圖立可找出最佳獲利之區隔。
目前多變量統計方法大部分處理小量樣本(sample)數據,對於受測量之變數是事前固定的,基本假設為變數之間的資料型態是相同的,且相關是有固定形式的。因此,模型中僅需追蹤少數參數所涉入各種因素之效應。但在大量資料集(Large Data Set)中,牽涉很多變數,必須隨時加入更多變數,辨別更大資料集的結構,及嘗試多種不同的方法。而且,可能更複雜的是各變數間的資料型態是不同的,因此變數間的相關也是不同型式的。複雜資料集來自向度的問題,其困難是向度越高,同質性資料點越稀少及異質性資料越分散。

三、類神經網路(Artificial Neural Network)
類神經網路或譯為人工神經網路,是指模仿生物神經網路的資訊處理系統(類似人類神經結構的一個平行計算模式。其較精確的定義為「一種計算系統,包括軟體、硬體,它使用大量簡單的相連人工類神經元來模仿生物神經網路的能力」。
由於類神經網路是屬於無模式(model free)之分析方法,對於決定合適之網路結構,隱藏層之層數及與各層內所應包含之神經元數目等,有較大的自由度。但當模式設定不佳時,亦常會出現學習速度緩慢及陷入局部最佳值(Local Optimal)等情況。因此,當建立網路模式時,對於相關參數的設定常須進行多方面的考量。
通常,對於輸入層之輸入變數方面,由於類神經網路對於變數的選取沒有如傳統統計方法般的限制,研究者常以文獻探討、專家意見判斷或經由統計方法處理,來決定輸入層之輸入變數。而在網路隱藏層方面,根據經驗顯示隱藏曾在一到二層時會有最好的效果,至於隱藏層中所需設定的神經元數目,其決定方法眾多,但直至目前為止並無最佳之設定方式可供使用,通常使用者皆會依系統的特性來進行判斷。目前許多的研究是以過去類似研究所累積的經驗法則來計算隱藏層的神經元數目,一般認為沒有速成的法則可以用來決定此一參數,唯有透過試誤法(trial and error)才能達成。由於隱藏層的神經元數目會影響整個網路的學習能力,因此過多的神經元數目雖然可以達到較好的學習效果,但是在訓練時卻需要花費較多時間,在使用上較不方便且會造成網路的記憶現象(memorization)而缺乏歸納(generalization)的能力;而過少的神經元數目則會促使網路模式無法完整地描述輸入和輸出變數間的關係。

四、基因演算法(Genetic Algorithms,Gas)
Holland在 1975年提出的基因演算法則,基本的精神在於模仿生物界中的物競天擇、適者生存的自然演進法則。基因演算法則的主要運算子為複製 (reproduction)、交配(crossover)與突變(mutation),將我們所感興趣的問題編碼為染色體(chromosona)的二元字串(binary string),即將一般常用的十進位計算原則改為二進位計算原則,如11(十進位)=1011(二進位)。如此重複地產生N種初始物種位元字串,並依據求解的條件設計適合度函數(fitness function),適應函數值高的字串將被挑選至交配池(mating poor)中,此即複製過程。在依據交配及突變的運算,及完成一代基因演算法則,重複地試驗以產生最強的物種。
在Gas的演算過程中,首先必須將問題所有變數編成二進位元(或其他形式如文字、數字等),這些字元有如生物中之遺傳基因(Gene);接著將這些字元組成一條字串(String),一條字串就代表問題的一組解,而這些字串就如同自然界中,各物種的染色體,有各自不同的組合。不同物種的集合(多條字串所成的集合),統稱為族群 (Population)。
接著必須根據這些族群所面對的生態環境,架構物種對環境適應能力的評估方式;義即將問題的目標函數或限制式,轉化為 Gas的適應度函數(Fitness Function)。適應度函數為評估各物種適應能力之依據,決定哪些該留下來,哪些必須被淘汰,就如同生物界中的「物競天擇,適者生存」!
當適應度函數定義出來後,再經由演算過程中三個主要基本運算元:複製、交配、突變的重複演算,就可以達到演化的目的。當演化結果達到設定的目標,則必須將優秀物種的染色體解碼,即為Gas的解。

五、模糊邏輯(Fuzzy Logic)
Fuzzy 的原意是「界線不分明」的意思。模糊邏輯是由Zadeh教授於1965年所提出一種以數學模型來描述語意式的模糊資訊的方法,我們可以將其視為是傳統集合理論的一種推廣型式。傳統的明確集合與模糊集合最大的差別就在於明確集合的歸屬函數是唯一的,而模糊集合可以有無限多種的歸屬函數,也就是因為這個特性,使得模糊系統可以調整其歸屬函數以適應不同的變異環境。模糊理論是以人類解決問題之思考模式為其出發點,許多主觀意識之表達,並非二元邏輯所能夠明確說明的,因此Zadeh教授便對模糊所定義的集合引進歸屬函數表示元素與集合的相容程度。
就如同Zadeh教授所提出的,大致上來說,所有的知識領域都可以加以模糊化,只要將傳統的明確集合模糊化後,推廣至模糊集合即可。模糊化的好處是可以提供更佳的推廣性、錯誤容忍性、以及更適合應用在真實世界中的非線性系統。

六、灰色理論(Grey Theory)
灰色世界介於白色與黑色之間的顏色,用於隱喻在探討某一系統時,對於系統特性的認識與掌握介於完全清楚(白色)即完全不知道(黑色)之間。因此,對於資訊不完全(如資料很少的狀況),可利用灰色來描述,將不明確的「灰色結果」轉化為明確的「白色結果」,再據以執行。此一理論為鄧巨龍教授(1982)提出之灰色理論(grey theory),可有效處理無法量化及系統內部訊息無法完全掌握等決策與控制的相關議題。
資訊不完全包含下列狀況:
Ø 系統的影響因素不完全明瞭
Ø 因素關係不完全清楚
Ø 系統結構不完全知道
Ø 系統的作用原理不完全確知

七、聯合分析
聯合分析,為在已知消費者對一組受測體集合整體評估其偏好結構的一種分析方法,市場研究者經常要回答如下的問題:何種產品屬性(因子)對顧客而言是最喜愛的?產品屬性的何種水準是顧客心中最需要的?顧客需在產品的許多屬性的水準組合上作抉擇。聯合分析在發展產品設計上是一項有效的工具,可以了解每一位顧客對產品的屬性之偏好。
蒐集資料時,受訪者針對產品屬性之水準的不同組合依喜好加以排序(Ranking)或給分數(Rating)。為了避免組合數太多而造成排序或給分數的困難,常使用直交設計(Orthogonal Design),以最少的水準組合數的整體反應,評估每個組合的成份效用值(Utility Score),然後分解受訪者喜好的一特定水準組合中每一因子水準的重要性(Green,Tull and Albaum(1988))。
上述之直交設計,就是按照直交表進行的實驗設計,它是進行多因素多水準實驗的效率最高的設計方法。這種設計不僅能明確各因素的主次地位,而且能知道那些因素存在什麼性質的交互影響,還可以找出諸因素各水準的最佳搭配,因此它已廣泛地應用於各領域的科學研究。直交設計法保留了因子設計(Factorial Design)整體考慮、綜合比較的優點,避免了因子設計的全面試驗工作量大的弊病。實際上,正交設計是全面試驗的部份實施。例如,7個因子2個水準的實驗,若按因子設計需設128( =128)種搭配,而按 直交表只需8種搭配,按直交表只需16種搭配,這就使工作量減少16或8倍。因此,一切多因子多水準的實驗,都可使用直交設計來確定最佳搭配。

八、多元尺度法(Multidimensional Scaling, MDS)
多元尺度法是投入有關消費者對事物的知覺資料,變換成一組以物品或其特點構成的多向(Dimensions)知覺的幾何空間(Geometric space)。因此空間中的點乃代表物品,而點際間的距離則表示各物品間的差異程度。
多元尺度法是使用個體間之接近性所產生的空間表示法。接近矩陣(Proximity Matrix)通常是一個不相似(Dissimilarity)矩陣。空間表示由對應每一個體的點所成之幾何圖形組成。這些個體越相似,對應點就越接近。在許多應用上,接近性測量不使用直接測量,而是由人類判斷所得之相似性知覺。個體間之接近性測量通常反映相似或不相似程度,如兩個體更相似,則相似測度值增加,但是對應之不相似測度值降低。



貳、創新的基礎
目前企業面臨的環境日益複雜,企業經營者必須擁有充分且精確的資訊才能確保決策的品質,企業經營者及相關研究人員,熟悉企業研究方法的內涵與運用,結合質化與量化的研究設計,深入了解問題的結構,並產生有效的見解,已經成為相當重要的議題。
企業研究係應用科學方法,作為決策基礎。涉及如何搜集資料、分析資料,以幫助管理者瞭解企業的各項問題,增加決策效能 (Effectiveness )與效率(Efficiency)。在企業研究的領域之中,運用搜集資料的方法,透過這些方法研究者可以搜集到所需的資料,加以分析應用,瞭解企業所面臨的環境,進而利用智慧型科技透過有效的策略解決企業問題、滿足消費者需要,而提供有效的資訊。
研究目的在瞭解企業之角色、功能與對企業管理之重要性及其主要內涵,融合應用企管知識培養從事企劃書之撰寫與企業實務研究之能力。
一項研究工作可分解成投入(Input)、過程(Process)、產出(Output)等三個階段。研究者由規劃、設計、資料蒐集、以至於報告撰寫,都蘊含一套深厚的學理素養。嚴謹的研究設計、問卷設計、抽樣設計,可確保「投入」品質;流暢的報告撰寫可確保「產出」一份高品質的研究。
若能在問題爆發前,就能有所感覺,並進一步的消除掉引起問題發生的因素,不需要等到問題爆發時,才急於想辦法解決的話,那麼我們將有效解決問題。在面臨問題時,利用科學方法,先多面向的觀察問題,利用工具,清楚的讓問題架構呈現,層次分明,逐步從外層消除產生問題的原因,不宜直接碰觸問題,並以一個客觀的立場及基準,細膩地分析問題,進而解決問題。
在企業中,員工的經驗可以藉由智慧型科技之應用轉成資料保存下來,才能確實執行知識管理。知識管理是企業持久性發展的基礎,其關鍵在於差異化,及即是所謂的特色。以往從品質、成本、經濟規模、顧客服務、大量廣告等要件來吸引客戶,但隨之社會進步,有形產品容易被模仿,不能顯現企業的特色,顧客易於流失。因此,不能再以有形資產作為差異化的基礎,應該以無形產品作為差異化的目標,不斷創新( innovation),來提高經營效能。「知識經濟」是泛指以知識為基礎的新經濟運用模式。意即直接建立在知識和資訊的激發,具創造性或創意 (creativity)。一個企業或組織藉由組織內部的學習與經驗累積,以及組織外部可經由有效的統計調查(如供應商、顧客、競爭者所填寫的問卷調查),做為企業或組織創新的基礎。進一步應用統計分析與資料探勘(data mining)為工具,以問題為導向,活用資料作分析,發掘知識,產生智慧,掌握解決問題的關鍵,培養決策能力。
在這個資料爆炸的時代,每一天都有新的事物被發現,要善於利用資料,協助我們判斷或利用所得到的訊息,並作適當的解讀。人不能只單靠資訊及知識,還需要有智慧,來幫助我們瞭解所有隱藏於事物背後的意義。
過去的經驗是人們所需要一種知識的基礎,也往往是創新的來源,經由經驗的體會,才有強烈的感覺而產生細膩敏銳的洞察力,這是一種直覺的意涵,是智慧的表現,而智慧是創新基礎。要培養智慧須具備下列基本要素:
Ø 培養用心做事的態度。
Ø 熱心做事。
Ø 處事積極且有創意。
Ø 做事誠懇且專心。



參、結語
現在工商業發達,抽樣母體隨時在變動,所以先由資料發現知識,也就是所謂的KDD,再利用統計分析方法,將更有競爭力。對於質化研究者,需將質化轉成量化,並且將質化與量化融合一體,效果更好,智慧型資料分析就是要達到此目的。
對企業經營中之個案研究非常重要,資料已經先於知識發生,利用資料探勘(Data Mining)方法,對各別企業已經發生之大量資料,挖掘資訊,進而發現知識。這種藉由擷取資料中有用的資訊、發現知識進而創造資料價值,這就是產生智慧的過程。至於由個案所產生之知識,只是一種想法,對個別企業經營有用,若要制定政策,必須再根據知識進行抽樣,以達到一般化的規律,作為決策之依據。



肆、參考文獻
吳萬益、林清河著(2000) 企業研究方法 華泰文化事業股份有限公司
馮正民、邱裕鈞著(民93) 研究分析方法 建都文化事業股份有限公司
Adriaans,PandZantinge(1996),Data Mining, Addison-Wesley
Green,P.E.,Tull,D.S. and Albaum,G.(1988), Research for Marketing Decisions,
Prentice Hall,Englewood,New Jersey, 5th Edition
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 YuRu 的頭像
    YuRu

    YuRu's Life

    YuRu 發表在 痞客邦 留言(0) 人氣()