Page 19 - profile-ok
P. 19

研究群   |   Research Laboratories










 資料處理與探勘實驗室  Information Processing and Discovery (iPAD)

          Laboratory








 研究人員  研究群介紹

 陳孟彰 Meng-Chang	Chen  資料處理與探勘實驗室的研究重點是(1)大量資料計算和(2)資料探勘技術和應用。   我們稱這樣的資料為不確定性資料。不同於定值資料的處理,
 Research	Fellow	  我們需要利用機率或統計理論,來定義新的資料查詢模式,以
 Computer	Science	,	University	of	California,	Los	  1. 大量資料計算
 Angles	          及估計不確定性物體之間距離的機率分佈,才能較準確地模擬
 ●   基於代理人的知識表徵與推理   不確定性帶來的影響。
 王大為 Da-Wei	Wang
 Research	Fellow  巨量資料中往往隱藏著許多資訊與知識。我們希望以形式邏輯為基礎,探討智慧型代
 Computer	Science	,	Yale	University	  理人相關的知識表徵與推理問題。我們將探討如何從大量資料中歸納出有用的法則與
 徐讚昇 Tsan-sheng	Hsu  知識,並特別著重這些知識的表徵問題,經由適當的邏輯語言表徵工具,致使這些歸  ●   社群網路探勘
 Research	Fellow  納出來的知識可以作為代理人程式進行進一步推理與決策的基礎;而不同代理人程式  近年來由於網際網路	Web	2.0	與社群相關應用的盛行,大量多
 Computer	Sciences	,	University	of	Texas	at	Austin  可以經由共同的溝通語言,達到交換知識的目的,同時代理人程式從不同來源獲取的  樣化的新型態資料也應運而生。如何在這些大量的社群網路資
 陳銘憲 Ming-Syan	Chen  知識,亦可經由適當的融合機制,產生更複雜的知識。如此全面性的分散式協同知識  訊中尋求出有價值的知識,進而提供創新的服務與應用,是我
 Distinguished	Research	Fellow  萃取與處理機制,將使得巨量資料中所隱藏的知識,成為有用的決策輔助工具,而決  們極欲研究的方向。未來可能的研究包括:1)建立具效率與系
 Computer,	Information	and	Control	Engineering	,	  策者則不會因資訊過度氾濫而無所適從。   統性之社群網路資料收集模組、2)社群網路中重要個體與群體
 The	University	of	Michigan	at	Ann	Arbor
                  識別技術之開發、3)設計漸進式更新的演算法,以適應社群網
 葉彌妍 Mi-Yen	Yeh   路資料隨時間變動的特性。
 Assistant	Research	Fellow  ●   隱私風險和威脅
 Electrical	Engineering	,	National	Taiwan	University
 廖弘源 Hong-Yuan	Mark	Liao  近年來為了各種目的,各單位蒐集大量的個人資料。這些資料如果能夠分享,將可以  ●   雲端環境底下之資料管理與資料探勘
 Research	Fellow  增進公共利益。不過這同時也對個人隱私造成很大的威脅。如何能夠分享資料同時又
 Electrical	Engineering	,	Northwestern	University  可以保障個人隱私是我們想要研究的問題。過去幾年我們提出討論資料集公開所帶來  雲端運算提供虛擬化計算資源,讓平台即服務、軟體即服務的
 廖純中 Churn-Jung	Liau  的隱私威脅的邏輯模式,進而提出量化的隱私風險指標,並以此指標為基礎,設計隱  架構得以實現。在此環境中的研究方向:資料庫與資料探勘即
 Research	Fellow  私閘門系統	CellSecu。未來我們希望研究更具挑戰性的資料庫連結問題,如何能夠在  服務。傳統資料庫大多採用關聯式資料模型,而在雲端環境中
 CSIE	,	National	Taiwan	University  不直接串連資料庫的情形下,計算出連結後的重要結果。初步的想法是利用私密的向  必需研究是否有新式組織資料的方法(例如能配合映射與簡化
 量內積協定作為基礎元件建構各種應用系統。而終極的目標是,發展能以高階語言為  概念的資料型),並配合設計出相關資料庫技術,包含新的檢
 輸入而自動編 譯出私密協定之系統。  索、同步機制、隱私保護、線上交易分  析等服務。在資料探
                  勘方面,延伸傳統平行及分散式探勘演算法,我們希望能設計
                  有效運用雲端資源的方法,分析多重來源的資料,並將結果輸
 ●   大圖存取         出至有需求的多個端點使用者。
 圖可以用來作為許多應用的基本模型,例如圖可應用在社會網路,賽局圖形,以及傳
 染病傳播等研究。有些實際的應用所面對的圖相當大,以目前主記憶體的容量,這些  ●   資料流之資料探勘
 圖往往沒有辦法整個放進主記憶體內,此時原來發展的許多圖論演算法就必須修改,
 或需要重新設計來面對無法存入主記憶體對效能的挑戰。在過去我們對於象棋的殘局  在許多應用中,需要處理大量以資料流形式增加的資料,例如
 以及疾病模擬提出演算法方面的修改與設計,得到還不錯的效果。未來我們希望能就  股票交易資料、感測網路的量測資料、監視影像資料、和氣象
 這些議題更深入的研究,同時也希望能 將所發展出來的方法,應用到其他的領域。  預報資料等。這些應用中之資料流通常有以下特性,例如:持
                  續匯入、數量龐大、快速產生等等。在有限運算資源下,我
                  們必需設計即時且可能是近似的探勘演算法,以適應資料流
 2. 資料探勘技術及應用     特性。在這樣的環境下,我們討論議題包括:1)資料流摘要處
                  理、2)不同資料流處理模型下對應的探勘演算法。我們更 進一
 ●   不確定性資料查詢處理與探勘
                  步會驗證探勘所得之近似結果能否滿足需要即時決策之應用。
 在資料收集的過程中,可能會因為資料收集設備有誤差,或是一些人為因素,例如為
 了保護隱私而刻意將敏感性高的資料模糊化,而造成資料的值可能包含了一些不確定
 性。因此,我們所獲得的資料並非是所得的定值,而應該是一個可能值的機率分佈。  ●   多模式資料探勘
                  多模式探勘為一新研究方向,整合多來源的知識發現,並了解
                  他們之間的關係和影響。一個典型的應用是股市預測需要從交
                  易資料以及新聞事件流中探勘知識。整合多來源知識很困難因
                  為知識的格式、意義、時間性的不一致性。在這項研究中,我
                  們以預測市場來研究方面多模式探勘問題。






 18                                                                                                              19
   14   15   16   17   18   19   20   21   22   23   24