Page 13 - profile2014.indd
P. 13

生物資訊實驗室










                                                                                  義蛋白質同義字,其為一小段連續的胺基
                                                                                  酸序列,可用來表明該蛋白質在演化的過
                                                                                  程中已發生或可能發生的序列變化;我們
                                                                                  經由分析大量的蛋白質序列,定義許多的
                                                                                  蛋白質同義字。UniLoc可以同時預測原
                                                                                  核與真核生物的蛋白質細胞定位,且有效
                                                                                  率地辨別單一與多重定位的蛋白質,並且
                                                                                  達到很高的準確率,高於目前其他著名的
                                                                                  細胞定位預測方法。

                                                                                  以疾病中心的人類蛋白知識庫:我們蛋白
                                                                                  體學生物資訊研究,最終目標是找到疾病
               Figure 1. The Web framework for Integrated Omic Data to reveal the   偵測的生物標記。因此,我們開發一個人
               hidden biological regulations and pathways.          類蛋白體知識庫,特別針對人類膜蛋白提供詳細資訊,透過
                                                                    整合現有的各種資料庫及預測工具,發展視覺化工具,並提
                                                                    供使用者勾選生物標記篩選條件,找出候選名單。此外,使
               分析複雜生物樣本的大規模醣蛋白質譜數據的軟體。其次,
                                                                    用這個蛋白體知識庫,我們和台灣其他實驗室共同參與國際
               由於SWATH的質譜實驗方法,近年被提出並在targeted  蛋
                                                                   人類蛋白體計畫負責第四號染色體分析。該計畫目前階段共
               白體學分析受到重視,我們提出一個名為ProDIA的計算方
                                                                    同的使命,是找出至今未被實驗偵測出的蛋白質,我們提供
               法及系統,從SWATH的質譜數據產出大規模MS/MS圖譜,
                                                                    未被偵測蛋白質名單給團隊成員,讓他們進行後續實驗找出
               進行蛋白質定性分析;結合傳統實驗方法的鑑定,可提升蛋
                                                                    這些蛋白質。
               白體的整體鑑定。此外,在醣蛋白研究過程中,我們發現圖
               譜轉成peak  list是研究上的瓶頸,現有的轉檔程式無法提供                     生物資訊研究是跨領域研究,我們的研究合作夥伴包含本院
               電荷資訊或有質量不準確的問題,因此我們正在進行圖譜轉                           的化學研究所、生物化學研究所、植物與微生物研究所、細
               檔程式的發展。                                              胞生物與個體生物研究所、生物醫學研究所、生物多樣性中
                                                                    心、基因體中心,及院外的國衛院、台大生命科學院、台大
               近年我們也進行代謝體的高通量質譜分析的研究。由於目前
                                                                    生物資源暨農學院、台大醫院、陽明大學生命科學院,以及
               代謝體的定量與定性工具不多,且有其限制,故此我們發展                           美國密西根州立大學醫學院和植物生物學研究所、加州大學
               代謝體定量分析的計算方法及軟體,結果顯示具高準確率。
                                                                    洛杉磯分校醫學院和美國微軟公司等。
               同時,我們也完成一套代謝體定性的計算方法,嚴謹地進行
               數據資料的叢集,進而透過搜尋代謝體資料庫,進行高準確
               率的代謝物定性分析。

               蛋白質結構與細胞定位預測:在蛋白質結構預測上,我們特
               別針對膜蛋白發展一系列的預測工具,包括:膜蛋白的穿膜
               螺旋區塊及其拓樸性質、螺旋間交互作用及接觸點的預測、
               穿膜區塊的lipid  exposure預測,並建構完成一個已知螺旋
               結構間交互作用的知識庫。此外,我們也特別進行訊號胜肽
               的預測,因為訊號胜肽容易和穿膜螺旋混淆,且和蛋白質分
               泌有關。

               在蛋白質細胞定位預測上,我們發展通用的蛋白質細胞定位                             Figure 2. Omics Database for Model and non-Model Organisms.
               預測方法稱為UniLoc。此方法利用自然語言處理的技術定





                                                                                                                     13
   8   9   10   11   12   13   14   15   16   17   18