Page 18 - profile-ok
P. 18
研究群 | Research Laboratories
資料處理與探勘實驗室 Information Processing and Discovery (iPAD)
Laboratory
研究人員 研究群介紹
陳孟彰 Meng-Chang Chen 資料處理與探勘實驗室的研究重點是(1)大量資料計算和(2)資料探勘技術和應用。 我們稱這樣的資料為不確定性資料。不同於定值資料的處理,
Research Fellow 我們需要利用機率或統計理論,來定義新的資料查詢模式,以
Computer Science , University of California, Los 1. 大量資料計算
Angles 及估計不確定性物體之間距離的機率分佈,才能較準確地模擬
● 基於代理人的知識表徵與推理 不確定性帶來的影響。
王大為 Da-Wei Wang
Research Fellow 巨量資料中往往隱藏著許多資訊與知識。我們希望以形式邏輯為基礎,探討智慧型代
Computer Science , Yale University 理人相關的知識表徵與推理問題。我們將探討如何從大量資料中歸納出有用的法則與
徐讚昇 Tsan-sheng Hsu 知識,並特別著重這些知識的表徵問題,經由適當的邏輯語言表徵工具,致使這些歸 ● 社群網路探勘
Research Fellow 納出來的知識可以作為代理人程式進行進一步推理與決策的基礎;而不同代理人程式 近年來由於網際網路 Web 2.0 與社群相關應用的盛行,大量多
Computer Sciences , University of Texas at Austin 可以經由共同的溝通語言,達到交換知識的目的,同時代理人程式從不同來源獲取的 樣化的新型態資料也應運而生。如何在這些大量的社群網路資
陳銘憲 Ming-Syan Chen 知識,亦可經由適當的融合機制,產生更複雜的知識。如此全面性的分散式協同知識 訊中尋求出有價值的知識,進而提供創新的服務與應用,是我
Distinguished Research Fellow 萃取與處理機制,將使得巨量資料中所隱藏的知識,成為有用的決策輔助工具,而決 們極欲研究的方向。未來可能的研究包括:1)建立具效率與系
Computer, Information and Control Engineering , 策者則不會因資訊過度氾濫而無所適從。 統性之社群網路資料收集模組、2)社群網路中重要個體與群體
The University of Michigan at Ann Arbor
識別技術之開發、3)設計漸進式更新的演算法,以適應社群網
葉彌妍 Mi-Yen Yeh 路資料隨時間變動的特性。
Assistant Research Fellow ● 隱私風險和威脅
Electrical Engineering , National Taiwan University
廖弘源 Hong-Yuan Mark Liao 近年來為了各種目的,各單位蒐集大量的個人資料。這些資料如果能夠分享,將可以 ● 雲端環境底下之資料管理與資料探勘
Research Fellow 增進公共利益。不過這同時也對個人隱私造成很大的威脅。如何能夠分享資料同時又
Electrical Engineering , Northwestern University 可以保障個人隱私是我們想要研究的問題。過去幾年我們提出討論資料集公開所帶來 雲端運算提供虛擬化計算資源,讓平台即服務、軟體即服務的
廖純中 Churn-Jung Liau 的隱私威脅的邏輯模式,進而提出量化的隱私風險指標,並以此指標為基礎,設計隱 架構得以實現。在此環境中的研究方向:資料庫與資料探勘即
Research Fellow 私閘門系統 CellSecu。未來我們希望研究更具挑戰性的資料庫連結問題,如何能夠在 服務。傳統資料庫大多採用關聯式資料模型,而在雲端環境中
CSIE , National Taiwan University 不直接串連資料庫的情形下,計算出連結後的重要結果。初步的想法是利用私密的向 必需研究是否有新式組織資料的方法(例如能配合映射與簡化
量內積協定作為基礎元件建構各種應用系統。而終極的目標是,發展能以高階語言為 概念的資料型),並配合設計出相關資料庫技術,包含新的檢
輸入而自動編 譯出私密協定之系統。 索、同步機制、隱私保護、線上交易分 析等服務。在資料探
勘方面,延伸傳統平行及分散式探勘演算法,我們希望能設計
有效運用雲端資源的方法,分析多重來源的資料,並將結果輸
● 大圖存取 出至有需求的多個端點使用者。
圖可以用來作為許多應用的基本模型,例如圖可應用在社會網路,賽局圖形,以及傳
染病傳播等研究。有些實際的應用所面對的圖相當大,以目前主記憶體的容量,這些 ● 資料流之資料探勘
圖往往沒有辦法整個放進主記憶體內,此時原來發展的許多圖論演算法就必須修改,
或需要重新設計來面對無法存入主記憶體對效能的挑戰。在過去我們對於象棋的殘局 在許多應用中,需要處理大量以資料流形式增加的資料,例如
以及疾病模擬提出演算法方面的修改與設計,得到還不錯的效果。未來我們希望能就 股票交易資料、感測網路的量測資料、監視影像資料、和氣象
這些議題更深入的研究,同時也希望能 將所發展出來的方法,應用到其他的領域。 預報資料等。這些應用中之資料流通常有以下特性,例如:持
續匯入、數量龐大、快速產生等等。在有限運算資源下,我
們必需設計即時且可能是近似的探勘演算法,以適應資料流
2. 資料探勘技術及應用 特性。在這樣的環境下,我們討論議題包括:1)資料流摘要處
理、2)不同資料流處理模型下對應的探勘演算法。我們更 進一
● 不確定性資料查詢處理與探勘
步會驗證探勘所得之近似結果能否滿足需要即時決策之應用。
在資料收集的過程中,可能會因為資料收集設備有誤差,或是一些人為因素,例如為
了保護隱私而刻意將敏感性高的資料模糊化,而造成資料的值可能包含了一些不確定
性。因此,我們所獲得的資料並非是所得的定值,而應該是一個可能值的機率分佈。 ● 多模式資料探勘
多模式探勘為一新研究方向,整合多來源的知識發現,並了解
他們之間的關係和影響。一個典型的應用是股市預測需要從交
易資料以及新聞事件流中探勘知識。整合多來源知識很困難因
為知識的格式、意義、時間性的不一致性。在這項研究中,我
們以預測市場來研究方面多模式探勘問題。
18 19