麻省理工學院(MIT)的研究者開發了一套人工智能系統,按照操作人員給出的新知識點,自動把維基百科中帶有這部份信息的文字更新,還能保持人工編輯的語法和風格。研究人員在人工智能發展協會(AAAI)的會議上展示了他們的成果。

維基百科現在已累積了幾百萬個文章需要持續維護,包括增加內容、重新編輯,以及對大量的數字、時間、姓名、地點這類事實信息持續更新。目前這些工作依靠世界各地的志願者完成。

這套系統只需操作人員從一個界面輸入更新的信息點,無需考慮語法和編輯風格,系統將搜尋維基百科中含有這個信息點的頁面,按照人類的語法將這些信息組織成文,把頁面更新。目前實驗階段,研究人員下載了一些頁面數據集進行實驗,沒有直接編輯網頁。

研究者介紹說,這個系統主要分三步工作。先由「事實檢查分類器」(fact-checking classifier)檢查目標文件內容是不是和最新的信息相符,分別給出「相符」、「不相符」,和非是非否的「中性」三種結果。

再使用「中性掩蔽器」(neutrality masker)在目標文檔內標註出最可能導致「不相符」結果的文字,用記號0標註需要刪掉的內容,用記號1標註需要保留的內容。

最後使用一種新創的「編碼-解碼」引擎,把更新的信息推送到目標文檔中被標記刪除的部份,完成編輯。

在一項測試中,邀請編輯人員為系統的編輯效果按不同的考慮指標用1~5分級評分,結果這個系統在事實更新方面平均得4分;在語法相融度方面平均得3.85分。

研究人員說,未來更理想的目標是,系統能夠自動在網上得知最新的信息,自動完成更新。◇