資料科學與智慧網路組目前研究現況包含利用大數據處理平台ELK (ElasticSearch, Logstash, Kibana) 及機器學習技術所建構的網路防護技術、資料隱私及社群網路、以資料為中心之物聯網通信、認知神經機器人學及利用深度學習技術讓機器人聽懂人類的語言。
透過數據分析平台所收集的網路資料、這些資料包含網路設備所計錄的日誌檔、透過軟體定義無線電 (SDN) 設備或網路功能虛擬化 (NFV) 所收集的高維度超資料 (metadata)、透過資料分析技巧及機器學習、深度學習技術等技術來建立網路自動防護技術來保障資訊安全。
巨量資料的產生、傳送以及處理是物聯網的特徵與重要研究議題,為了更有效使用有限的通信資源(如頻寬、時間與功率)來傳送物聯網的巨量資料,我們提出以「資料為中心」的物聯網通信技術。與傳統以「裝置為中心」的通信技術不同,以「資料為中心」的通信技術以提升整體資料的品質而非以提升個別裝置的服務品質 (QoS) 為優先目標。舉例而言,以「資料為中心」的通信資源分配技術能利用個別物聯裝置的資料彼此具有相關的特性,在結合資料壓縮、估測與重建等資料處理技術後,僅需分配通信資源給少部分的物聯裝置進行資料傳送即可達到整體物聯網應用所需的資料品質,因而大大節省通信資源的使用。我們的研究發現,在各網路通信層協定包括資源分配、傳輸排程、與網路分群,以「資料為中心」的通信技術不管在理論的效能增益或是實際的物聯網應用都比傳統的通信技術具有明顯的優勢。
認知神經機器人學目標為發展以認知神經科學及bio-inspired且physiologically plausible之演算法為基礎的對話機器人。進行中的研究為整合過去對於聽覺系統及空間聽覺注意的人類神經科學研究, 應用神經科學模擬軟體Nengo (Neural ENGineering Objects) 2.0, 模擬中文語音訊號經由外耳、 中耳、 內耳, 以及聽覺路徑(auditory pathway, 聲音定向的主要區域)的過程, 並切割訊號為字詞,供後續對話分析及回應之用。目前兩項新研究, 包括讓機器人經由與人類或其他機器人語音對話, 協助學習建立空間記憶與知識,以及讓所發展的Nengo程式在晶片SpiNNaker的軟體模擬器上執行, 未來希望能夠以SpiNNaker晶片即時計算, 提高認知神經機器人的實用性。
在這個大數據的時代,多媒體資訊在網路上產生的速度遠超過人類可以瀏覽、吸收的速度,我們的目標是以深度學習技術讓機器可以理解多媒體資訊中的語音訊號,並為人類抽取出有用的資訊。在 2016 年我們有如下成果:我們讓機器去回答托福聽力測驗的問題,機器可以達到將近 50% 的正確率;我們以深度強化式學習技術增進互動式語音內容檢索的效能;我們嘗試讓機器聽了大量有聲書後,在沒有人類教導的情況下學習人類語言。