亞馬遜(Amazon)在用人工智能(AI)開發語音助理Alexa的新型演講風格,包括以新聞播音員的聲音說話。Alexa繼續學習聲音新技巧,最近已學會以「新聞播音員風格」的聲音來廣播,幾周後將啟用。雖然這種智能語音還是有別於人聲,但它聽起來確實抑揚頓挫,像是一位播音員。

據亞馬遜自己調查,用戶更喜歡Alexa用常規風格來說話,雖然用智能音箱聽新聞還有很多其它問題。亞馬遜表示,新發音方式是由其「神經文本到語音」的技術或NTTS實現的。這是下一代語音合成方式,用機器更快地學習富有表現力的聲音。目前,Alexa使用串聯語音合成,這種方法已經存在了幾十年。這涉及將語音樣本分解成不同的聲音或稱音素,然後再將其拼接在一起以形成新的單詞和句子。

去年10月,谷歌Google為其智能助理推出了一種新形式的語音合成,採用其倫敦智能實驗室AI lab DeepMind開發的機器學習技術。

值得注意的是,亞馬遜說只花幾小時就向Alexa傳授了新聞播音員的語音,這表明未來可以很輕易地融入各種其它風格。

截至目前,亞馬遜已為Alexa添加了一個耳語模式,未來幾周內升級到NTTS後,至2019年大概一整套聲音將會推出。◇