Page 20 - profile2014.indd
P. 20
資料處理與探勘實驗室
Lab
研究人員
陳孟彰 Meng Chang Chen 在資料爆炸的時代裡,各種資料,例如感應器資料、軌跡資料、交易資料、多
Research Fellow 媒體資料,以飛快的速度時時刻刻產生。目前硬體與網路高質與量,價錢相對
陳銘憲 Ming-Syan Chen 便宜,是最佳時刻發展相關研究議題,以善用這些資料來改進現有服務,或用
Distinguished Research Fellow 來解決目前無法解決的問題。所以本研究小組的主要目標在於起始相關創新研
張原豪 Yuan-Hao Chang 究以達科學與技術的卓越性。 目前我們著重於以下研究領域 (1)有效收集、表
Assistant Research Fellow 現、儲存、與處理大量各式資料,(2)探討資料探勘技術來有效率、有效益的發
葉彌妍 Mi-Yen Yeh 現有價值之知識。目前我們研究的議題包括(1)時間序列資料分析與探勘,(2)社
Associate Research Fellow 群網路分析與查詢處理,(3)適地性資料收集平台與應用,(4)資料中心儲存系統
楊得年 De-Nian Yang 設計。 各計畫簡述於下:
Associate Research Fellow
廖弘源 Hong-Yuan Mark Liao 1. 時間序列資料的分析與探勘
Distinguished Research Fellow
時間序列可視為以時間為索引排序的連續資料。由於許多種資料都可以用時間
序列的形式來表示,故時間序列分析被廣泛的應用在各個領域上。例如:感測
器每小時所記錄的資料、金融市場上每日產生的交易資料以及透過具衛星定位
功能的行動設備的移動軌跡記錄等。透過分析與挖掘時間序列資料,我們不但
能夠觀察到資料的特性,更能在其中發現對後續服務與應用有所幫助的寶貴知
識。
本研究的目的在設計有效率的演算法以找出同一條時間序列之內或是多條序列
彼此之間有意義的樣式和與其他有趣的知識,並同時考量實務應用中所存在的
各種條件限制。為了能處理不斷增加、高維度且資料量龐大的資訊,我們必須
開發高效率且同時能有效地找出各種樣式的方法。時間序列分析可被廣泛的應
用在各個領域上。例如:我們可以分析股票交易資料,把具有共同變化趨勢的
股票組合提供給交易員做為決策參考。另外,透過分析人與車輛之衛星定位軌
跡資料,可用來瞭解人們行動與駕駛的行為模式,進而發展出更好的位置感知
服務或是作為城市規畫的參考。目前我們已針對多重時間序列串流研發出可在
線上或是離線執行的摘要與分群演算法。我們也設計了相似資料搜尋演算法,
可運用在單一或是多重時間串流下,並同時考量各種限制條件,例如:時間資
料流分散於不同地點、資料含有隨機誤差等雜訊、考慮各種不同相似性量測方
法等。我們嘗試開發出軌跡資料探勘與搜尋演算法,可以從龐大的歷史軌跡資
料中擷取出有用的資訊。
2. 社群網路分析與查詢處理
隨著社群應用普及與興盛,社群網路資料量目前正迅速地成長。在社群網路柘
樸分析中,列舉所有可能之子圖模式乃不切實際,且目前的研究多著重於同質
性社群網路之分析。然對於異質性社群網路,目前同質性社群網路之拓樸分析
法並無法適用,且由於其節點與連結會存在多種類型(例如節點之身份,連結之
關係),故異質性社群網路之拓樸分析仍為十分困難之研究議題。此外,在社群
網路中,查詢處理與最佳化之相關研究仍在剛起步之階段。對於複雜之社群網
路架構與多種可能的節點、連結參數設定,在短暫的時間內求得符合多種限制
20 研究群 Research Laboratories