大連理工大學軟件學院成果破解程序語義表示難題
  2019年7月11日  来源:大連理工大學

  程序語義表示是長期困擾軟件工程領域的基礎性難題,對于解決代碼搜索、應用程序接口學習、缺陷定位等智能化軟件工程任務具有重要意義。近年來,衆多研究者持續關注程序語義表示問題,但現有技術很難對自然語言與代碼元素進行統一表示,難以度量兩者間的語義關系。近期我校在軟件工程國際期刊IEEE Transactions on Software Engineering(TSE)發表研究成果,爲破解程序語義表示難題提供了一種高效快速的解決方案。

  在這一成果中,研究人員創新性地提出一種基于詞嵌入的程序語義表示方法。該方法首先通過自然語言處理與程序分析手段自動分析開源軟件平台上1300萬余個源代碼文件,結合分析結果建立自然語言與軟件代碼的語義序列模式,並采用詞嵌入技術在GPU集群上對超過1億條語義序列模式進行高效分析,最終獲得自然語言單詞和軟件代碼元素的統一向量表示。基于該表示方法,研究人員進一步解決智能化軟件工程核心任務。研究成果表明,基于詞嵌入的程序語義表示可以高質量輔助軟件從業人員完成代碼搜索、應用程序接口學習等軟件開發活動,並將相關任務的准確率提升到80%以上。

  该项研究成果由大連理工大學软件学院江贺教授团队牵头完成。我校博士生李晓晨作为论文第一作者,江贺教授担任论文通讯作者,日本九州大学Yasutaka Kamei教授和杭州电子科技大学陈信博士参与完成。

  本研究得到國家自然科學基金優秀青年科學基金資助。
 關于大連理工大學更多的相關文章請點擊查看 

特別說明:由于各方面情況的不斷調整與變化,華禹教育網(Www.Huaue.Com)所提供的信息爲非商業性的教育和科研之目的,並不意味著贊同其觀點或證實其內容的真實性,僅供參考,相關信息敬請以權威部門公布的正式信息爲准。