「數據治理」:人工智慧企業的基本功
2022 年 Computex 上可以觀察到,雲端運算與人工智慧如今在各個產業都備受重視,從自動駕駛到自然語言的辨識,都需要人工智慧的參與。
人工智慧可以藉由演算法,從過往的數據中學習,找出數據的特定模式,並隨時配合新輸入的資料做出調整與回應,以模仿人類的思考與行為模式。而高效率的人工智慧,必須高度仰賴對資料庫的管理,沒有好的資料,或是資料沒有妥善的管理,資料終究只是一堆無用的數據,無法產生應有的價值。
因此「數據治理」(Data Governance) 是現代化企業相當重視的管理邏輯之一。
甚麼是數據治理
根據定義,數據治理指的是在兼顧資訊安全的前提下,讓數據保持高度準確性、可近性與易用性的各種管理策略。每一個企業,都可能有獨一無二的數據治理策略,以確保在收到大量營運資訊之後,能夠好好地應用。
以電商為例,許多電商在每日的營運中,自然會累積大量的顧客數據。一個沒有導入數據治理的公司,可能收集到許多重複、無效的會員資料。未經清洗和處理就放進客戶行銷平台中,很有可能會重複地濫伐行銷訊息,反而造成客戶反感,傷害品牌形象。業務端也可能因為虛胖的會員數量,對於實際的業務量總是無法掌握。
執行數據治理前:統整數據結構與使用方式
數據治理是需要企業跨部門合作的事情,並非是資訊部門要負責,也不是業務或行銷部門要主導的事情,需要各部門一同協作,能打破數據的孤島。
最常見的方式就是每一個業務部門負責處理特定的幾項數據,擁有數據的負責人要確定該項數據可以被清楚定義、標準化並向其他的同仁說明,並在共識會議上,確認這些數據,在整個公司內有唯一的明確定義。一般而言,數據的負責人也具有管理數據分享權限的權力。統整了數據的結構,才能夠有統一的語言讓數據用同樣的方式被收錄到數據庫中。
導入雲端數據工具:兼具成本與效益
隨著雲端運算的普及,越來越多的數據工具都可以在雲端執行。對於企業來說,將雲端運算和雲端的數據工具導入數據治理中,越來越普遍。例如龐大且複雜的通用型 AI(Generalist AI),就很大程度地仰賴了雲端架構。
對於許多中小企業而言,為了享受雲端的便利,完全仰賴一己之力,建構所有的硬體與軟體越來越不實際。公有雲能提供許多資料科學工具或人工智慧模型,私有雲則保障了資料的私隱性。整合公有雲與私有雲,能夠自由調度資料的混合雲模式,能夠有效控制成本,提升效益,更是中小企業導入人工智慧時最好的數據治理策略之一。
未來每家企業都是科技業,數據將是產生商業價值的基本來源。企業在日常營運中不斷累積的資料庫,訓練人工智慧模型挖掘有意義的重要資訊,是未來幾年的重要趨勢。運用正確的工具,做好數據治理,將會是每個企業相當基礎的管理工作。