Page 13 - profile2014.indd

P. 13

生物資訊實驗室

義蛋白質同義字，其為一小段連續的胺基
酸序列，可用來表明該蛋白質在演化的過
程中已發生或可能發生的序列變化；我們
經由分析大量的蛋白質序列，定義許多的
蛋白質同義字。UniLoc可以同時預測原
核與真核生物的蛋白質細胞定位，且有效
率地辨別單一與多重定位的蛋白質，並且
達到很高的準確率，高於目前其他著名的
細胞定位預測方法。

以疾病中心的人類蛋白知識庫：我們蛋白
體學生物資訊研究，最終目標是找到疾病
Figure 1. The Web framework for Integrated Omic Data to reveal the 偵測的生物標記。因此，我們開發一個人
hidden biological regulations and pathways. 類蛋白體知識庫，特別針對人類膜蛋白提供詳細資訊，透過
整合現有的各種資料庫及預測工具，發展視覺化工具，並提
供使用者勾選生物標記篩選條件，找出候選名單。此外，使
分析複雜生物樣本的大規模醣蛋白質譜數據的軟體。其次，
用這個蛋白體知識庫，我們和台灣其他實驗室共同參與國際
由於SWATH的質譜實驗方法，近年被提出並在targeted 蛋
人類蛋白體計畫負責第四號染色體分析。該計畫目前階段共
白體學分析受到重視，我們提出一個名為ProDIA的計算方
同的使命，是找出至今未被實驗偵測出的蛋白質，我們提供
法及系統，從SWATH的質譜數據產出大規模MS/MS圖譜，
未被偵測蛋白質名單給團隊成員，讓他們進行後續實驗找出
進行蛋白質定性分析；結合傳統實驗方法的鑑定，可提升蛋
這些蛋白質。
白體的整體鑑定。此外，在醣蛋白研究過程中，我們發現圖
譜轉成peak list是研究上的瓶頸，現有的轉檔程式無法提供生物資訊研究是跨領域研究，我們的研究合作夥伴包含本院
電荷資訊或有質量不準確的問題，因此我們正在進行圖譜轉的化學研究所、生物化學研究所、植物與微生物研究所、細
檔程式的發展。胞生物與個體生物研究所、生物醫學研究所、生物多樣性中
心、基因體中心，及院外的國衛院、台大生命科學院、台大
近年我們也進行代謝體的高通量質譜分析的研究。由於目前
生物資源暨農學院、台大醫院、陽明大學生命科學院，以及
代謝體的定量與定性工具不多，且有其限制，故此我們發展美國密西根州立大學醫學院和植物生物學研究所、加州大學
代謝體定量分析的計算方法及軟體，結果顯示具高準確率。
洛杉磯分校醫學院和美國微軟公司等。
同時，我們也完成一套代謝體定性的計算方法，嚴謹地進行
數據資料的叢集，進而透過搜尋代謝體資料庫，進行高準確
率的代謝物定性分析。

蛋白質結構與細胞定位預測：在蛋白質結構預測上，我們特
別針對膜蛋白發展一系列的預測工具，包括：膜蛋白的穿膜
螺旋區塊及其拓樸性質、螺旋間交互作用及接觸點的預測、
穿膜區塊的lipid exposure預測，並建構完成一個已知螺旋
結構間交互作用的知識庫。此外，我們也特別進行訊號胜肽
的預測，因為訊號胜肽容易和穿膜螺旋混淆，且和蛋白質分
泌有關。

在蛋白質細胞定位預測上，我們發展通用的蛋白質細胞定位 Figure 2. Omics Database for Model and non-Model Organisms.
預測方法稱為UniLoc。此方法利用自然語言處理的技術定

8 9 10 11 12 13 14 15 16 17 18