四年前iPhone的智能語音助手Siri,第一次讓人們體驗(yàn)到通過和手機(jī)對話就能完成過去很多不方便的操作。2014年底,亞馬遜發(fā)布Echo智能音箱,Echo依靠語音命令激活,可以作為智能家居的控制裝置,播放在線音樂,還可以提供各種在線信息和提醒功能。預(yù)計到今年年
四年前iPhone的智能語音助手Siri,**次讓人們體驗(yàn)到通過和手機(jī)對話就能完成過去很多不方便的操作。2014年底,亞馬遜發(fā)布Echo智能音箱,Echo依靠語音命令激活,可以作為智能家居的控制裝置,播放在線音樂,還可以提供各種在線信息和提醒功能。預(yù)計到今年年底,亞馬遜Echo總銷量將超過2200萬臺,雖然還沒有進(jìn)入中國市場,但這個數(shù)字**亮眼。2017年國內(nèi)外各大互聯(lián)網(wǎng)公司都開始研發(fā)自己的智能音箱。智能音箱到底有沒有價值?這到底是風(fēng)口還是曇花一現(xiàn)?小新今天就來聊一聊這個話題。
2015年3月,京東與科大訊飛聯(lián)合成立了靈隆科技,5月20號推出了智能音箱叮咚。
石家莊網(wǎng)絡(luò)優(yōu)化消息2016年10月,谷歌在秋季發(fā)布會上正式推出智能音箱Google Home。而今年成了智能音箱發(fā)布大年。6月蘋果公布了智能音箱Homepod,7月5號,阿里推出智能音箱天貓精靈X1,26號小米發(fā)布智能音箱小愛同學(xué)。有消息說騰訊將于8月份推出智能音箱。而百度也在先前發(fā)布了語音識別開放平臺DuerOS。他們這么爭先恐后的推出自己的音箱產(chǎn)品,無非是要把音箱作為語音交互和智能家居的入口,搶奪入口建立生態(tài)從來是中國互聯(lián)網(wǎng)公司的傳統(tǒng)優(yōu)勢項(xiàng)目。
1963年,美國科學(xué)家恩格爾巴特用木頭和小鐵輪制成了**個鼠標(biāo),這為后來windows的圖形界面奠定了基礎(chǔ)。移動互聯(lián)網(wǎng)時代,喬布斯和iPhone開創(chuàng)了手勢觸屏和Siri。首先我們明確的一點(diǎn)是,鼠標(biāo)鍵盤和手勢交互將可能在未來一段時間被語音交互替代。自然語言理解雖然還有很長路要走,但是張張嘴就能操控智能終端的使用場景,在可預(yù)見的時間內(nèi)就會到來。交互場景的變革又會帶來方法論的一系列重大變化。語音交互可以增加互動速度和效率,提高個人生產(chǎn)力,大大解放用戶跟交互界面的關(guān)系,這是一場人機(jī)交互的革命。
其實(shí),智能音箱*核心的門檻,并不是wifi芯片,也不是音箱硬件的生產(chǎn),而是語音識別的云服務(wù)平臺。比如你問Echo音箱今天天氣怎么樣?音箱會把你的語音信息編碼打包上傳到亞馬遜云服務(wù)器上,服務(wù)器會進(jìn)行語音識別、語義理解、服務(wù)調(diào)用,也就是調(diào)用氣象信息的數(shù)據(jù)庫,再反饋給音箱,音箱才能播報出來今天天氣的情況。看起來你在跟音箱對話,實(shí)際上服務(wù)你的是千里之外的云服務(wù)器。
我們知道人工智能需要三個基礎(chǔ)條件。首先是大數(shù)據(jù),它就像是做面包的面粉,大量數(shù)據(jù)是人工智能的基礎(chǔ)原料。其次是大數(shù)據(jù)計算中心,通俗說它就是計算能力超強(qiáng)的服務(wù)器,就像面包的烤箱一樣,計算中心就是人工智能的物理承載。百度在山西陽泉,阿里在張家口張北縣,騰訊在貴州省,分別布局了能力強(qiáng)大的計算中心。**就是算法,BAT三家公司都擁有上千人的人工智能科學(xué)家團(tuán)隊,甚至在硅谷擁有實(shí)驗(yàn)室,他們就像是做面包的面點(diǎn)師。所以人工智能的概念看起來很好,但**是互聯(lián)網(wǎng)巨頭的游戲。那些中小企業(yè)開發(fā)的智能音箱只有兩種情況,一種是接入了巨頭的云計算能力,另外一種就是功能雞肋的噱頭產(chǎn)品。
小新認(rèn)為,通過智能音箱可以把語音交互作為未來互聯(lián)網(wǎng)的入口,成為重要的物理節(jié)點(diǎn),但是智能音箱不是終點(diǎn),語音交互應(yīng)該實(shí)現(xiàn)在每一個物聯(lián)網(wǎng)的場景里。
首先,人機(jī)交互的形式不會只局限在語音流媒體上,AI的圖像識別能力也在進(jìn)步。視頻是優(yōu)于音頻的富媒體,媒介介質(zhì)的豐富能帶來智能終端更多的玩法。一個可視化的交互終端,似乎能比音箱實(shí)現(xiàn)更多功能。
石家莊網(wǎng)站建設(shè)消息今年5月,亞馬遜推出了Echo Show,那就是一個能視頻通話,播放流媒體的小電視。可以圖像識別、語音交互的智能電視前景必然大于音箱。
其次,語音交互的實(shí)現(xiàn)形式不一定是音箱,也不一定在室內(nèi)。比如,手機(jī)、汽車、家用電器、可穿戴設(shè)備,只要有互聯(lián)網(wǎng)接入都可以使用。音箱只是家庭環(huán)境的一種特定場景,還有很多場景是沒有語音交互覆蓋的。
第三,智能音箱顯然被設(shè)計成了智能家居的一個中心,但是誰規(guī)定智能家居必須得有一個中心呢?如果各種物聯(lián)網(wǎng)設(shè)備都是帶著芯片的智能硬件,顯然不需要一個誰管理誰的邏輯從屬關(guān)系,云服務(wù)的特點(diǎn)決定了智能家居是不需要中心入口的。Echo從推出至今已經(jīng)上線了15000款語音控制應(yīng)用,相比之下國內(nèi)智能音箱就有點(diǎn)尷尬。因?yàn)楦鱾€產(chǎn)品接口協(xié)議不兼容,很難實(shí)現(xiàn)音箱管理其他智能家居的場景。
所以,智能音箱可能像當(dāng)年的尋呼機(jī)一樣,更多是一個過度性的角色。石家莊網(wǎng)站優(yōu)化獲悉幾年前智能硬件火了一波,到**發(fā)現(xiàn)大多數(shù)就是偽需求,今天的智能音箱還遠(yuǎn)遠(yuǎn)達(dá)不到成熟,但是它背后的語音交互可以關(guān)注了。百度在7月初發(fā)布了它的語音交互的產(chǎn)品DuerOS,關(guān)注微信公眾號“真像大白”,回復(fù)“AI”可以看到這期內(nèi)容。你還可以訂閱節(jié)目,**時間收看。告別小白,真像大白,我們下次接著聊。