美國國防部高級研究計劃局(DARPA)正在開發一系列技術,旨在提升對人類語言的理解。該技術不僅有助於分析演講或文本資源,還能在發現潛在有用的信息時提醒情報分析人員註意。
當提及處理分析自然語言的人工智能系統時,人們不免會想到一些巨頭企業,如谷歌、微軟、雅虎等。現在,有一個狠角色也加入到這一領域之中,它就是美國國防部高級研究計劃局,簡稱DARPA。目前,DARPA正在開發一個名為“文本深度探索及過濾(Deep Exploration and Filtering of Text)”的項目,旨在分析一些人類無法處理的龐大文本數據。
該項目於2012年中期啟動,預計整個項目的完成時間為四年半。DARPA的官網對DEFT項目的目標介紹如下:
“對於那些人類無法處理的海量文本信息,自動化深度自然語言處理(NLP)技術可以提供一個解決方案。除瞭能夠更高效地處理文本信息,該技術還可以理解上下文之間的聯系。DARPA“文本深度探索及過濾”項目的目的是提升自然語言的處理能力。自然語言處理技術具備人工智能屬性,並且已有一定實用經驗,可以幫助國防分析人員大幅提升海量文檔調查的工作效率,並從中發現一些表達隱晦、可能付諸行動的信息。”
本質上,DARPA希望這種技術能夠幫助情報分析人員掃描更多的文本文檔和語音文件,並從中發現一些關鍵信息,比如人物、事件、地點、時間等。另外,DARPA還希望該技術能夠辨別出一些模糊或是暗示性信息。一旦系統分析出新的數據源,分析師就會收到提示,其中包括可疑信息(比如內容、任務、地點等)和相關文檔。
這並非DARPA首次涉足自然語言處理領域。他們希望全新的深度學習方法可從語義上理解文檔信息。除瞭分析文本內容並發送提示外,DARPA還希望能夠創建一個數據庫,把文檔中的相關問題和實體聯系在一起:
“還希望DEFT能夠將個體因素整合進更大的數據模型裡,這樣就可以對信息進行處理,以支持分析人員進行評估、計劃和預測,甚至還能完成一份報告的初稿。如果這個數據庫真的完成瞭,DEFT 就能讓分析人員從海量數據中抽身出來,轉移到更加細微、更具戰略意義的信息探索工作之中。.”
另據推測,使用DEFT技術,可讓美國國防部分析各種信息源,比如YouTube視頻、互聯網論壇發帖,甚至是通過間諜軟件攔截到的消息。為瞭進一步提升DEFT的功能,DARPA正在尋求多所大學的幫助,其中包括斯坦福大學、哥倫比亞大學、卡內基梅隆大學,這些大學都得到過DARPA的資助。
2012年,奧巴馬政府表示要推動大數據技術發展。作為總統計劃的一部分,美國國防部啟動瞭2500萬美元的XDATA項目。此外,他們還研究瞭許多其他機器學習方法,目的是組織、歸納、分析國防部獲取的海量數據。這些方法包括圖譜分析、時間序列關聯、高級可視化技術等。
VIA gigaom
相關內容
DARPA新項目:讓假肢開始有觸覺