Page 29 - 2017 Brochure
P. 29
前進,以針對常用字串「搜尋」為概念,發展中英文「快打」輸入法。未來,除 研究人員
了文本處理外也將發展口語處理技術以支援不同的應用系統。
許聞廉 Wen-Lian Hsu
1. 情感分析與意見探勘
主觀資訊的分析是自然語言處理中最具應用性的研究領域之一,且相關技術需 Distinguished Research Fellow
深入理解文本內容及特定領域知識。我們在新聞、部落格、網路論壇、評論、
讀者回應、對話及短訊文本中研究意見、情感、主觀性、表情、情緒、觀點等 王新民 Hsin-Min Wang
資訊,並同時為中文及英文文件,研發分析主觀資訊的資源與技術。資源方面,
我們建立了中文情感分析最完整的套件 CSentiPackage,其中包含辭典、語料、 Research Fellow
計分工具,與深度學習的社群網路文本分析演算法 UTCNN;技術方面,我們不
僅發展統計機率模型,更開發深度學習的情感分析技術,建立了網路貼文的情 古倫維 Lun-Wei Ku
感與意見視覺化系統 Feelit 與 WordForce、臉書短訊情感偵測之手機應用程式
EmotionPush、協助母語為中文之英語學習者以英文表達情感的寫作輔助系統 Associate Research Fellow
RESOLVE、以及學習混淆字的例句推薦系統 GiveMeExample,這些系統都達到
相當好的效能。我們將基於過去所發展的各項技術、持續提升深度情感分析之 馬偉雲 Wei-Yun Ma
效能並將情感分析技術帶入人類生活的各種情境中。
Assistant Research Fellow
2. 語意導向式的機器翻譯
我們採用語法深層結構,然後在每個詞上附著其詞意,並在樹狀結構的每個節 蘇克毅 Ken-Yih Su
點上標註其語意格位。我們使用一個整合式的統計模型找出最佳之語法深層結
構、詞意,及語意格位的組合。在得到源始端的語意正規型式後,我們利用在 Research Fellow
最佳路徑上自動學習的參數及模版,產生對應的目標端語意正規型式及最後的
句子。除此之外,對每一個無法產生對應結構之句子,我們將生成一個在搜 27
尋柱內之替代路徑,使其具有最大之指定函數值(基於 BLEU 分數及可能機率
值)。

3. 機器閱讀
我們將用之前所建立之不同分析模組(如中文分詞、句法剖析、語意角色標註、
邏輯型式轉換等),來建立一個中文自然語言理解系統。我們會首先為這個長
期的研究計劃建立一個中文機器閱讀程式,使本計劃可以用閱讀測驗來評估。
我們將從國小課本開始,然後再進一步到中學課本,最後到專業智慧型問答系
統。

4. 口語處理
我們目前的研究課題包括說話人辨識、口語語言辨識、語音轉換和語音文件檢
索 / 摘要。最近的成果包括基於局部線性嵌入的語音轉換和後置濾波方法,用
於語音 / 說話人辨識的鑑別式自動編碼器,以及用於語音文件檢索 / 摘要的段
落 嵌 入 學 習 方 法。 實 驗
室成員陳冠宇博士以發
表 在 COLING2016 的 語
音文件摘要論文獲得科
技部 105 年度博士後研
究 人 員 學 術 著 作 獎。 進
行中的研究包括用於口
語 / 方言 / 口音辨識的子
空間神經網路,多對一 /
非 並 行 語 音 轉 換, 以 及
基於神經網絡的語音文
件檢索 / 摘要。
   24   25   26   27   28   29   30   31   32   33   34