閱讀 | 訂閱
閱讀 | 訂閱
機(jī)器人

雷雄國:機(jī)器人中的人機(jī)交互和后端服務(wù)

星之球激光 來源:新華網(wǎng)2016-05-04 我要評論(0 )   

  4月28日2016年全球移動互聯(lián)網(wǎng)大會在北京如期舉行,本屆GMIC,集結(jié)了一大批來自移動互聯(lián)網(wǎng),人工智能領(lǐng)域的優(yōu)秀企業(yè)代表共同亮相。而思必馳在本屆GMIC可謂是最亮眼的...


  4月28日2016年全球移動互聯(lián)網(wǎng)大會在北京如期舉行,本屆GMIC,集結(jié)了一大批來自移動互聯(lián)網(wǎng),人工智能領(lǐng)域的優(yōu)秀企業(yè)代表共同亮相。而思必馳在本屆GMIC可謂是最亮眼的明星之一,展示的“AISpeechInside”系列智能產(chǎn)品十分豐富,攜上海慶科、大華樂橙、捷渡中國等眾多合作客戶參加,更受邀在多場重量級峰會上分享經(jīng)驗(yàn)。
  在以“阿西莫夫的里程碑”為主題的全球智能機(jī)器人大會上思必馳副總裁雷雄國發(fā)表了題為“機(jī)器人中的人機(jī)交互和后端服務(wù)”的主題演講。演講中,雷雄國詳細(xì)介紹了思必馳在機(jī)器人領(lǐng)域的多項(xiàng)技術(shù)特色,以及自身的定位和未來發(fā)展方向。同時(shí),他還展示了最新的合作產(chǎn)品:即將正式面世的樂橙小樂機(jī)器人。雷雄國表示,現(xiàn)在的思必馳正處在人工智能快速發(fā)展的時(shí)代,挑戰(zhàn)與機(jī)遇并存是這個產(chǎn)業(yè)的主旋律,除了在語音識別和圖像識別技術(shù)上要有所突破外,思必馳還將致力于身份識別、聲源定位以及智能車載等領(lǐng)域產(chǎn)品的研發(fā),力爭達(dá)到業(yè)界領(lǐng)先水平。
  以下為雷雄國演講實(shí)錄:
  對于人工智能這個話題,今天來到現(xiàn)場我特別感慨的是,當(dāng)今是最好的時(shí)代,也是最“壞”的時(shí)代。最好的時(shí)代包括從阿爾法狗,我們現(xiàn)在這么多的創(chuàng)業(yè)者集中在AI智能領(lǐng)域,包括機(jī)器人的創(chuàng)業(yè)浪潮,我們能看到未來在機(jī)器人的時(shí)代,人工智能的時(shí)代,一定是一個正確的大的方向。
  為什么說這是一個最壞的時(shí)代呢?我們發(fā)現(xiàn)確實(shí),有很多我們接觸做機(jī)器人的朋友,他們在聊未來機(jī)器人,包括當(dāng)前機(jī)器人做成什么樣?有什么樣的商業(yè)模式?以及在機(jī)器人產(chǎn)品里面未來的一些核心方向?可能都不是特別清晰。
  在當(dāng)今的時(shí)代,思必馳在人工智能這塊一直在做自己的探索。所以我們也非常高興生活在這個時(shí)代,能夠在人工智能的這條道路上一起努力,去解決在這個道路上面與我們所能遇到的很多技術(shù)上和商業(yè)模式上的,一一系列的困難,推動人工智能走進(jìn)千家萬戶。
  思必馳2007年開始做人工智能,從最初做教育到做移動互聯(lián)網(wǎng),再做車聯(lián)網(wǎng),以及目前的智能方面。我們有幸能夠看到包括國際國內(nèi)已經(jīng)涌現(xiàn)出非常多的,優(yōu)秀的,我們能夠看得到的機(jī)器人產(chǎn)品,我們也在跟一些國內(nèi)比較大的機(jī)器人廠商做深度合作。
  其實(shí)在機(jī)器人這塊,如果從產(chǎn)品的角度來看,剛才我們提到產(chǎn)品的核心定位的需求是非常關(guān)鍵的。從核心的人機(jī)交互的角度來看,語音技術(shù)、圖像識別技術(shù),以及體感等等一系列的多模塊的發(fā)展是非常關(guān)鍵的。我們希望以語音、人臉、圖像等等一系列作為核心的交互手段的這么一些多模態(tài)交互的算法,以及產(chǎn)業(yè)化的進(jìn)方面,我們也在做相關(guān)的努力。
  首先,從人跟人的交互來看,最自然的是語音的交互。我們延伸到人跟機(jī)器的交互,其實(shí)語音也是最自然的入口。比較接地氣的說法是,我們和100多家機(jī)器人廠商交流,他們提出來一個核心的需求,對于語音的交互是非常感性的,我們能夠看到在這里面,語音技術(shù)確確實(shí)實(shí)是一個在這個領(lǐng)域里面非常重要的一點(diǎn)。
  在機(jī)器人的交互方面思必馳有一些具有突破性的進(jìn)展,我們可以演示一下,機(jī)器在說話的過程中,作為一個語音合成的技術(shù)是非常成熟的。傳統(tǒng)的語音合成會比較機(jī)械一些,我們在機(jī)器人的交互里面,機(jī)器人可能首先是個人,在這方面的需求它所發(fā)出的聲音,我們希望它盡量有感情,有韻律。
  其次,從人機(jī)交互的角度來看,核心技術(shù)的推動,以及對于人機(jī)交互更自由的使用場景其實(shí)要求非常高。對于機(jī)器人上面,其實(shí)機(jī)器人往往有可能會動,甚至離你有一定距離的產(chǎn)品,這樣的話它對于語言識別、人機(jī)交互的難度會大大增加。這是第二點(diǎn)在技術(shù)的角度。
  第三,機(jī)器人的交互需要深度的理解他的對話,以及深度理解以后給出一些反饋。
  第四,目前在機(jī)器人行業(yè)里面,大家會發(fā)現(xiàn),每一類的機(jī)器人都會有自己定位準(zhǔn)確的應(yīng)用領(lǐng)域。有的在銀行,有的在商場,還有一些針對小孩,還有一些針對老人。其實(shí)語音識別的定制以及語意的定制還有對話的定制就非常重要的。同時(shí)在定制的過程當(dāng)中,包括有一些喚醒功能的定制也很有必要。
  第五,本地識別。我們很多產(chǎn)品在使用的時(shí)候會受到網(wǎng)絡(luò)的限制,甚至沒有網(wǎng)絡(luò)。我們希望我們的機(jī)器人不至于變成一個“傻”玩具。這里面需要在技術(shù)上提供云端跟本地相結(jié)合的混合引擎。
  第六,為什么很多人認(rèn)為機(jī)器人就是一個加了殼的平板,里面缺靈魂。那么這個機(jī)器人到底能給我?guī)硎裁幢憷窟@里面涉及到一些后端服務(wù)的整合。我們希望打造成一個比較完整的解決方案,這個是在做人工智能的時(shí)候需要去深度研究的事情。
  從人工智能技術(shù)的角度講,這是一個技術(shù)性非常強(qiáng)的行業(yè),我們思必馳在這個領(lǐng)域,對于技術(shù)研發(fā)的投入,包括未來的方向我們有自己的一些看法,核心的幾個點(diǎn),一個在對話交互方面,在對話的交互里面,上下文的理解非常重要。第二是情緒的合成,我們需要一些有情緒,有韻律的機(jī)器人,而不是非常干巴巴的機(jī)器人。

轉(zhuǎn)載請注明出處。

人工智能AI機(jī)器人移動互聯(lián)網(wǎng)
免責(zé)聲明

① 凡本網(wǎng)未注明其他出處的作品,版權(quán)均屬于激光制造網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。獲本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使 用,并注明"來源:激光制造網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)責(zé)任。
② 凡本網(wǎng)注明其他來源的作品及圖片,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本媒贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系我們刪除。
③ 任何單位或個人認(rèn)為本網(wǎng)內(nèi)容可能涉嫌侵犯其合法權(quán)益,請及時(shí)向本網(wǎng)提出書面權(quán)利通知,并提供身份證明、權(quán)屬證明、具體鏈接(URL)及詳細(xì)侵權(quán)情況證明。本網(wǎng)在收到上述法律文件后,將會依法盡快移除相關(guān)涉嫌侵權(quán)的內(nèi)容。

網(wǎng)友點(diǎn)評
0相關(guān)評論
精彩導(dǎo)讀