Page 18 - profile-ok
P. 18

研究群   |   Research Laboratories










                                             資料處理與探勘實驗室                                                                           Information Processing and Discovery (iPAD)

                                                                                                                                  Laboratory








            研究人員                               研究群介紹

           陳孟彰 Meng-Chang	Chen               資料處理與探勘實驗室的研究重點是(1)大量資料計算和(2)資料探勘技術和應用。                                                     我們稱這樣的資料為不確定性資料。不同於定值資料的處理,
           Research	Fellow	                                                                                                              我們需要利用機率或統計理論,來定義新的資料查詢模式,以
           Computer	Science	,	University	of	California,	Los	  1. 大量資料計算
           Angles	                                                                                                                       及估計不確定性物體之間距離的機率分佈,才能較準確地模擬
                                               ●   基於代理人的知識表徵與推理                                                                         不確定性帶來的影響。
           王大為 Da-Wei	Wang
           Research	Fellow                       巨量資料中往往隱藏著許多資訊與知識。我們希望以形式邏輯為基礎,探討智慧型代
           Computer	Science	,	Yale	University	   理人相關的知識表徵與推理問題。我們將探討如何從大量資料中歸納出有用的法則與
           徐讚昇 Tsan-sheng	Hsu                    知識,並特別著重這些知識的表徵問題,經由適當的邏輯語言表徵工具,致使這些歸                                                 ●   社群網路探勘
           Research	Fellow                       納出來的知識可以作為代理人程式進行進一步推理與決策的基礎;而不同代理人程式                                                   近年來由於網際網路	Web	2.0	與社群相關應用的盛行,大量多
           Computer	Sciences	,	University	of	Texas	at	Austin  可以經由共同的溝通語言,達到交換知識的目的,同時代理人程式從不同來源獲取的                                      樣化的新型態資料也應運而生。如何在這些大量的社群網路資
           陳銘憲 Ming-Syan	Chen                    知識,亦可經由適當的融合機制,產生更複雜的知識。如此全面性的分散式協同知識                                                   訊中尋求出有價值的知識,進而提供創新的服務與應用,是我
           Distinguished	Research	Fellow         萃取與處理機制,將使得巨量資料中所隱藏的知識,成為有用的決策輔助工具,而決                                                   們極欲研究的方向。未來可能的研究包括:1)建立具效率與系
           Computer,	Information	and	Control	Engineering	,	  策者則不會因資訊過度氾濫而無所適從。                                                          統性之社群網路資料收集模組、2)社群網路中重要個體與群體
           The	University	of	Michigan	at	Ann	Arbor
                                                                                                                                         識別技術之開發、3)設計漸進式更新的演算法,以適應社群網
           葉彌妍 Mi-Yen	Yeh                                                                                                                路資料隨時間變動的特性。
           Assistant	Research	Fellow           ●   隱私風險和威脅
           Electrical	Engineering	,	National	Taiwan	University
           廖弘源 Hong-Yuan	Mark	Liao               近年來為了各種目的,各單位蒐集大量的個人資料。這些資料如果能夠分享,將可以                                                 ●   雲端環境底下之資料管理與資料探勘
           Research	Fellow                       增進公共利益。不過這同時也對個人隱私造成很大的威脅。如何能夠分享資料同時又
           Electrical	Engineering	,	Northwestern	University  可以保障個人隱私是我們想要研究的問題。過去幾年我們提出討論資料集公開所帶來                                       雲端運算提供虛擬化計算資源,讓平台即服務、軟體即服務的
           廖純中 Churn-Jung	Liau                   的隱私威脅的邏輯模式,進而提出量化的隱私風險指標,並以此指標為基礎,設計隱                                                   架構得以實現。在此環境中的研究方向:資料庫與資料探勘即
           Research	Fellow                       私閘門系統	CellSecu。未來我們希望研究更具挑戰性的資料庫連結問題,如何能夠在                                              服務。傳統資料庫大多採用關聯式資料模型,而在雲端環境中
           CSIE	,	National	Taiwan	University     不直接串連資料庫的情形下,計算出連結後的重要結果。初步的想法是利用私密的向                                                   必需研究是否有新式組織資料的方法(例如能配合映射與簡化
                                                 量內積協定作為基礎元件建構各種應用系統。而終極的目標是,發展能以高階語言為                                                   概念的資料型),並配合設計出相關資料庫技術,包含新的檢
                                                 輸入而自動編 譯出私密協定之系統。                                                                       索、同步機制、隱私保護、線上交易分  析等服務。在資料探
                                                                                                                                         勘方面,延伸傳統平行及分散式探勘演算法,我們希望能設計
                                                                                                                                         有效運用雲端資源的方法,分析多重來源的資料,並將結果輸
                                               ●   大圖存取                                                                                  出至有需求的多個端點使用者。
                                                 圖可以用來作為許多應用的基本模型,例如圖可應用在社會網路,賽局圖形,以及傳
                                                 染病傳播等研究。有些實際的應用所面對的圖相當大,以目前主記憶體的容量,這些                                                 ●   資料流之資料探勘
                                                 圖往往沒有辦法整個放進主記憶體內,此時原來發展的許多圖論演算法就必須修改,
                                                 或需要重新設計來面對無法存入主記憶體對效能的挑戰。在過去我們對於象棋的殘局                                                   在許多應用中,需要處理大量以資料流形式增加的資料,例如
                                                 以及疾病模擬提出演算法方面的修改與設計,得到還不錯的效果。未來我們希望能就                                                   股票交易資料、感測網路的量測資料、監視影像資料、和氣象
                                                 這些議題更深入的研究,同時也希望能 將所發展出來的方法,應用到其他的領域。                                                   預報資料等。這些應用中之資料流通常有以下特性,例如:持
                                                                                                                                         續匯入、數量龐大、快速產生等等。在有限運算資源下,我
                                                                                                                                         們必需設計即時且可能是近似的探勘演算法,以適應資料流
                                             2. 資料探勘技術及應用                                                                                特性。在這樣的環境下,我們討論議題包括:1)資料流摘要處
                                                                                                                                         理、2)不同資料流處理模型下對應的探勘演算法。我們更 進一
                                               ●   不確定性資料查詢處理與探勘
                                                                                                                                         步會驗證探勘所得之近似結果能否滿足需要即時決策之應用。
                                                 在資料收集的過程中,可能會因為資料收集設備有誤差,或是一些人為因素,例如為
                                                 了保護隱私而刻意將敏感性高的資料模糊化,而造成資料的值可能包含了一些不確定
                                                 性。因此,我們所獲得的資料並非是所得的定值,而應該是一個可能值的機率分佈。                                                 ●   多模式資料探勘
                                                                                                                                         多模式探勘為一新研究方向,整合多來源的知識發現,並了解
                                                                                                                                         他們之間的關係和影響。一個典型的應用是股市預測需要從交
                                                                                                                                         易資料以及新聞事件流中探勘知識。整合多來源知識很困難因
                                                                                                                                         為知識的格式、意義、時間性的不一致性。在這項研究中,我
                                                                                                                                         們以預測市場來研究方面多模式探勘問題。






      18                                                                                                                                                                                                                                19
   13   14   15   16   17   18   19   20   21   22   23