Page 13 - profile2014.indd
P. 13
生物資訊實驗室
義蛋白質同義字,其為一小段連續的胺基
酸序列,可用來表明該蛋白質在演化的過
程中已發生或可能發生的序列變化;我們
經由分析大量的蛋白質序列,定義許多的
蛋白質同義字。UniLoc可以同時預測原
核與真核生物的蛋白質細胞定位,且有效
率地辨別單一與多重定位的蛋白質,並且
達到很高的準確率,高於目前其他著名的
細胞定位預測方法。
以疾病中心的人類蛋白知識庫:我們蛋白
體學生物資訊研究,最終目標是找到疾病
Figure 1. The Web framework for Integrated Omic Data to reveal the 偵測的生物標記。因此,我們開發一個人
hidden biological regulations and pathways. 類蛋白體知識庫,特別針對人類膜蛋白提供詳細資訊,透過
整合現有的各種資料庫及預測工具,發展視覺化工具,並提
供使用者勾選生物標記篩選條件,找出候選名單。此外,使
分析複雜生物樣本的大規模醣蛋白質譜數據的軟體。其次,
用這個蛋白體知識庫,我們和台灣其他實驗室共同參與國際
由於SWATH的質譜實驗方法,近年被提出並在targeted 蛋
人類蛋白體計畫負責第四號染色體分析。該計畫目前階段共
白體學分析受到重視,我們提出一個名為ProDIA的計算方
同的使命,是找出至今未被實驗偵測出的蛋白質,我們提供
法及系統,從SWATH的質譜數據產出大規模MS/MS圖譜,
未被偵測蛋白質名單給團隊成員,讓他們進行後續實驗找出
進行蛋白質定性分析;結合傳統實驗方法的鑑定,可提升蛋
這些蛋白質。
白體的整體鑑定。此外,在醣蛋白研究過程中,我們發現圖
譜轉成peak list是研究上的瓶頸,現有的轉檔程式無法提供 生物資訊研究是跨領域研究,我們的研究合作夥伴包含本院
電荷資訊或有質量不準確的問題,因此我們正在進行圖譜轉 的化學研究所、生物化學研究所、植物與微生物研究所、細
檔程式的發展。 胞生物與個體生物研究所、生物醫學研究所、生物多樣性中
心、基因體中心,及院外的國衛院、台大生命科學院、台大
近年我們也進行代謝體的高通量質譜分析的研究。由於目前
生物資源暨農學院、台大醫院、陽明大學生命科學院,以及
代謝體的定量與定性工具不多,且有其限制,故此我們發展 美國密西根州立大學醫學院和植物生物學研究所、加州大學
代謝體定量分析的計算方法及軟體,結果顯示具高準確率。
洛杉磯分校醫學院和美國微軟公司等。
同時,我們也完成一套代謝體定性的計算方法,嚴謹地進行
數據資料的叢集,進而透過搜尋代謝體資料庫,進行高準確
率的代謝物定性分析。
蛋白質結構與細胞定位預測:在蛋白質結構預測上,我們特
別針對膜蛋白發展一系列的預測工具,包括:膜蛋白的穿膜
螺旋區塊及其拓樸性質、螺旋間交互作用及接觸點的預測、
穿膜區塊的lipid exposure預測,並建構完成一個已知螺旋
結構間交互作用的知識庫。此外,我們也特別進行訊號胜肽
的預測,因為訊號胜肽容易和穿膜螺旋混淆,且和蛋白質分
泌有關。
在蛋白質細胞定位預測上,我們發展通用的蛋白質細胞定位 Figure 2. Omics Database for Model and non-Model Organisms.
預測方法稱為UniLoc。此方法利用自然語言處理的技術定
13