物聯傳媒 旗下網站
登錄 注冊
RFID世界網 >  新聞中心  >  物聯網新聞  >  正文

亞馬遜Alexa連鎖效應:AI語音平臺風口,誰能成為贏家?

作者:本站收錄
來源:楊劍勇
日期:2017-09-22 15:00:16
摘要:在智能語音語義領域,除了百度、阿里、騰訊等巨頭紛紛進入,訊飛、思必馳等專業語音技術企業也占據很多優勢資源,巨頭企業已經開始通過上下游延伸來創造價值,實現更好的實現商業化。

  2017年,從一開年,開發者成為眾多AI巨頭的爭搶對象。

  年初二月,在美國CES上,到處都是Alexa,亞馬遜無疑成為最大贏家,自2015年6月25日宣布開放AI助手Alexa的語音技術以來,一度迎來開發者們高漲的熱情,據悉,目前搭載Alexa的硬件種類已經超過7000種,產品品類覆蓋智能家居、移動設備、機器人、智能車載等領域。

  開發者成為爭奪的重要據點

  巨頭們也沒有放慢追擊的步伐,蘋果公司在WWDC 2016上發布了新的SiriKit,把Siri開放給開發者。IBM的Waston認知技術平臺也逐漸更加受到關注。2017年,接踵而來的開發者大會著實吸引眼球,4月底,Facebook率先拉開了本年度的開發者大會,5月,微軟在西雅圖舉行了Build 2017開發者大會,隨即,谷歌也召開I/O 2017開發者大會。平臺成為巨頭爭奪的新戰場。

  伴隨著國內AI市場日益火爆,智能產品層出不窮,多樣化需求成為痛點,國內的眾多AI企業也開始探索平臺之路。Alexa代表著一種AI進階方向,以語音交互為主要方式,但中英文語音技術的差異為Alexa進擊中文領域帶來沖擊,國內市場稍顯空白,為更多AI企業留下了競爭成長的空間。

  國內AI的發展,以語音技術的應用最為成熟,語音交互也成為智能產品的必備方式。AI語音平臺也成為了典型代表,國內已誕生了近50家AI語音平臺,既有巨頭的侵入,也有新秀崛起。但不可否認,國內的AI語音平臺目前還是處于初期的發展階段,無論是技術研發還是應用都非常的青澀。

  巨頭布局,創業公司垂直進擊

  (一)亞馬遜Alexa

  不同于蘋果Siri有限的語音輔助作用,亞馬遜Alexa是一個具備強大語音技術的“機器人”,對語音識別、語義分析等方面邏輯要求嚴格。亞馬遜的優勢在于技術包袱較小,通過與Echo類產品的緊密結合,探索更多的語音應用可能,產品思維十分靈活。更重要的是Amazon Echo切中遠場交互的市場痛點,Alexa更懂用戶對于遠場語音交互的需求。

  同時Alexa擁有亞馬遜電商先天優勢、AWS的云服務擴展、上萬個Skills的技能庫、Kindle的獨家閱讀資源等等,優勢因素的碰撞產生的了化學效應。

  但是,Alexa的應用具備相應的門檻,它是面向企業和專業/半專業級的開發者的語音開放平臺, 尤其是作為個人開發者而言,需要具備一定的代碼能力,專業性較強。在應用上必須通過aws云端部署等等,這些對中小型企業而言,存在困難。降低開發及應用門檻,成為Alexa要解決的一大問題。

  (二)百度DuerOS

  DuerOS的開放之路始于去年,去年12月末,度秘聯合中信國安廣視推出可以提供語音交互功能的智能高清機頂盒。在今年1月CES上,度秘正式發布DuerOS。在7月5日的百度AI開發者大會上,景鯤明確定義了DuerOS的發展路徑,表示DuerOS是AI時代的安卓系統。為此,它會向外界開放一系列能力。在當前AI熱的背景下,百度AI開發者大會的傳播效應超出景鯤的預期,他坦言“會后至少有幾十家廠商主動找來談合作。

  自陸奇加盟百度以來,百度更加明確了其人工智能大方向,依托百度的技術基因、搜索、大數據等,誕生了DuerOS、無人駕駛、百度大腦等項目,百度基于優秀的搜索引擎基礎,已經開始大刀闊斧的布局人工智能。百度副總裁王海峰在7月5日的AI開發者大會上表示,百度多年打造的完整AI技術平臺將全面開放。百度的AI能力分為4層:在基礎層,是AI算法、大數據、大計算能力;感知層,包括語音、圖像、視頻、AR/VR等技術;認知層,有自然語言處理、知識圖譜及用戶畫像等;在平臺層,基礎層、感知層、認知層的技術會平臺化。

  景鯤表示”百度DuerOS的開發套件數量在最開始預估的時候稍微有點少了,從整個市場環境來看,這種需求特別大,有很多人在新鮮的設備上都想做語音交互,包括跑步機或是按摩椅。對度秘團隊來說,怎樣滿足不同合作伙伴的需求,是當前的工作重點。”

  (三)訊飛AIUI

  科大訊飛無疑是人工智能風潮以來的極大受益者,面向消費者業務,目前也在不斷從To B向To C轉變。2015年,科大訊飛推出了AIUI,它是以語音識別為主,結合圖像、視覺及手勢識別的人機交互產品,自上線以來,在人機交互方面的應用涉及教育、政府、交通等領域。

  今年6月上旬,訊飛舉辦了AIUI開放平臺發布會,相較之前針對智能硬件方向的AIUI,此次AIUI開放平臺,為軟硬件都提供支持,功能亮點主要是多輪對話、個性化語音語義、方言識別、聲紋信息識別等功能,并提供通用技能資源,主要是應用級工具。目前開放的有智能硬件解決方案、移動端,但微信解決方案和WebAPI解決方案仍未開放。訊飛AIUI開放平臺的出現,讓訊飛體系不斷壯大,但正因如此,目前,訊飛開放平臺的服務支持略顯薄弱,為開發者們帶來苦惱,造成流失,如何解決這一問題,對訊飛而言也是一個考驗。

  (四)騰訊云小微

  騰訊云小微硬件開放平臺,通過一個SDK接入硬件,包含騰訊自有音樂及各種有聲讀物、新聞、天氣等內容,開發者也可以自己創建。騰訊旗下的小微服務機器人平臺,是家庭中的陪伴機器人,可以不斷學習和做決策。

  騰訊云小微得益于騰訊自身的數據庫和產品線,可以在各類產品中打通賬號,打破了內容門檻限制。其中,微信數據庫為小微提供了語音語義的學習和完善。技術與產品的結合讓小微的功能十分接地氣,小微的翻譯能力、物體識別能力等等,都得到了騰訊產品最完善功能的加持。

  盡管騰訊云小微在針對語音、語義理解方面做了不錯的優化,但在賦能硬件技術方面仍然不夠。這個局限也會影響騰訊云小微在AI領域的深度發展,畢竟未來的AI是覆蓋生活中全方位的,小到手機、PC里的語音交互,大至車載、家居中的多輪對話,這些都有待于騰訊云小微去摸索進步。

  (五)思必馳DUI開放平臺

  近期,思必馳的一場發布會,讓行業聚焦到了這個語音新秀的身上,據了解,思必馳自2014年轉型物聯網領域以來表現穩步上升,而近期搭載其語音技術的天貓精靈X1、小米AI音箱小愛同學、聯想智能音箱等產品的發布,將其推上風口浪尖。9月7日,思必馳DUI的這場發布會成為行業關注的焦點。

  思必馳DUI平臺分為四個系統,分別為玲瓏系統、天機系統、青囊系統、紫微系統,功能特點主推的是全鏈路定制,以Dialog為核心,結合GUI和VUI,從識別到合成,從語義領域到對話邏輯,從技術模塊到內容資源、交互界面等均可全方位均支持定制。DUI平臺的綜合性、完整性和服務性,是其核心競爭力。思必馳推出了開發者計劃,設立2億元的扶持基金,用以扶持平臺上優秀的開發者、優秀應用案例和創業項目。

  據了解,目前DUI平臺的應用主要在智能車載、智能家居、智能機器人、手機助手領域,從內容端逐漸切入金融、教育、電商、醫療等方向。在這個發展目標里面,不斷擴大應用領域是思必馳DUI要走的很長的一段路。

  平臺占據了絕對的風口位置

  通過以上分析對比,我們不難發現,無論是國內還是國外的公司,都想牢牢的抓住未來互聯網的下一個交互入口。

  截至目前,在智能語音語義領域,除了百度、阿里、騰訊等巨頭紛紛進入,訊飛、思必馳等專業語音技術企業也占據很多優勢資源,巨頭企業已經開始通過上下游延伸來創造價值,實現更好的實現商業化。與此同時,創業公司通過深耕垂直領域和細分賽道,實現自我造血和快速成長,并在AI風口逐漸做大。

  在未來的物聯網時代,智能語音交互作為最為符合應用場景的交互方式,也許會成為每個智能硬件的“標配”。未來的互聯網發展仍是開放的,任何一種技能都有可能被載入硬件的發展,我們也更應該以一種開放的眼光去看待未來的發展方向。

人物訪談