微軟(Microsoft)上周公布新人工智能(AI)模型VASA-1,只要上載肖像硬照及錄音,AI就可合成影片,讓相中人「說話」。並以名畫蒙娜麗莎作示範,讓畫中蒙娜麗莎說唱起來,效果相當驚艷搞笑。但搞笑聲過後,坊間普遍憂慮會被濫用冒充真人,加劇網絡騙案,假資訊氾濫。微軟亦坦承的確有濫用疑慮,故VASA-1目前不打算將新模型開放公眾使用。

微軟(新人工智能(AI)VASA-1讓畫中蒙娜麗莎說唱起來,效果相當驚艷搞笑。(網上截圖)
微軟(新人工智能(AI)VASA-1讓畫中蒙娜麗莎說唱起來,效果相當驚艷搞笑。(網上截圖)

微軟表示,開發此項最新的虛擬人像技術VASA-1原意希望用於教育、協助有溝通障礙的人,創造出虛擬的 AI 角色讓他們練習交談,甚至為人類創造虛擬伙伴。VASA-1只要使用一張照片以及一段語音音訊,就能夠產生精確的人臉對嘴說話影像,甚至可展現自然的表情和頭部動作。

另一段女士講話,亦是VASA-1以照片加聲音生成影片。(網上截圖
另一段女士講話,亦是VASA-1以照片加聲音生成影片。(網上截圖

微軟指,VASA-1是以 VoxCeleb2 資料集為基礎進行訓練,有關資料集收集了YouTube 影片中超過6,112位名人的100萬個語音片段,以大量人類說話的面部動作影片訓練新AI模型,包括人類表情、嘴唇動作、眼神及眨眼等,令生成影片更逼真。微軟指VASA-1現時能即時生成每秒最多40幀的512×512影像,適合虛擬形象的即時互動用例。除了真人照片,畫作如蒙娜麗莎或動畫人物,跟要配上文字或音檔便可合成影片。不過研究團隊強調,該技術主要用於研究,而非實際產品或 API 發布。

蒙娜麗莎說唱以及一系列VASA-1生成的影片發布後,引來不少掌聲,指「看不出來,厲害!」但其逼真度亦同時引起不少網民憂慮,認為VASA-1會加劇網絡騙案:「這個要道德監管了吧隨便一張照片就可以弄出沒講過的話」、「完全沒有抵抗力,真的會相信」、「如果沒有事先講AI生成,應該看不出來」,「我有一個大膽的想法⋯⋯」,更有網民直言,「有片有真相」這句話將不再言之有理了。@

------------------

📰支持大紀元,購買日報:
https://www.epochtimeshk.org/stores
📊InfoG:
https://bit.ly/EpochTimesHK_InfoG
✒️名家專欄:
https://bit.ly/EpochTimesHK_Column