7月26日下午4:23,名為“小冰”的微軟人工智能機(jī)器人在微信公號中發(fā)出一條消息“我已經(jīng)升級為第六代小冰了?!?/p>
7月26日下午4:23,名為“小冰”的微軟人工智能機(jī)器人在微信公號中發(fā)出一條消息“我已經(jīng)升級為第六代小冰了?!?/span>
同時(shí),微軟全球執(zhí)行副總裁沈向洋在北京正式宣布:第六代小冰上線。這也是2014年微軟小冰誕生以來,歷史上最大規(guī)模的一次升級。不論是底層情感計(jì)算框架,還是外部可交互的3D 外型——一個(gè)新的“小冰”就此展現(xiàn)。
發(fā)布會(huì)上,微軟首次披露了小冰在全球擁有的用戶數(shù)量:6.6億。
除了微信以外,小冰的存在早已蔓延至 Line、QQ、小米生態(tài)鏈、網(wǎng)易云音樂、華為手機(jī)等產(chǎn)品后端,產(chǎn)品形態(tài)涉及對話式人工智能機(jī)器人、智能語音助手、人工智能創(chuàng)造內(nèi)容提供者等垂直領(lǐng)域解決方案,覆蓋全球五個(gè)國家的40余個(gè)平臺(tái)。
回顧小冰四年來的發(fā)展,從2014年誕生時(shí)成為微信群聊助手,提供查天氣、交通、星座等信息搜索服務(wù);到2015年,小冰第三代版本在“說話能力”之上新增“聽力”,同時(shí)有了富有小冰個(gè)性特色的聲音;而在7月,微軟發(fā)布“沙魯小冰模型”計(jì)劃,賦予小冰對人聲的自主學(xué)習(xí)能力。
第六代小冰(右圖)擁有了可交互的全新3D外形。
可以說,從機(jī)械的個(gè)人助手,到富有情感的 AI機(jī)器人,小冰與人的邊界已越來越模糊。
在人工智能領(lǐng)域,NLP(自然語言處理)的通俗解釋為“幫助機(jī)器聽懂人話,并給人以回應(yīng)”。而作為微軟在語音識(shí)別、語義交互等技術(shù)領(lǐng)域的集中呈現(xiàn)產(chǎn)品,小冰自誕生開始,就始終注重讓小冰在學(xué)會(huì)溝通(IQ)之外,還具備情感(EQ)的分析能力。
如今,“情感 AI ”正成為微軟小冰區(qū)別于市面大多智能機(jī)器人的特性。一般來說,AI 公司通過積累語料、標(biāo)注數(shù)據(jù)、搭建知識(shí)圖譜等方式,研發(fā)一個(gè)能自動(dòng)回復(fù)的 AI 機(jī)器人并不難,但要讓機(jī)器人加入情感,模擬人的語氣給用戶提供精準(zhǔn)回復(fù),仍然是人工智能領(lǐng)域亟待解決的挑戰(zhàn)。
微軟 Dual AI 并未將“開放”作為主旨
為了讓 AI 機(jī)器人產(chǎn)生人的反應(yīng),微軟在小冰的聊天、唱歌等分支功能中,都分別建立了相關(guān)的技術(shù)門檻。
從語音交互的方式來看,小冰在去年發(fā)布第五代時(shí),就曾推出新一代語音交互技術(shù):全雙工語音交互感官(Full-duplex Voice Sense)。
以市面上大多智能音箱為例,每一次發(fā)布指令均需要說出喚醒詞,比如用戶使用百度智能音箱時(shí)需要說出:小度小度,幫我放首歌。小度小度,把音量放大。而在使用全雙工技術(shù)后,用戶只需要用喚醒詞首次喚醒設(shè)備后(即只需說一遍“小度小度”),即可實(shí)現(xiàn)連續(xù)對話。
據(jù)微軟表示,用戶和小冰聊天的最長記錄達(dá)到4個(gè)多小時(shí),總共說了1600多句話。
而在發(fā)布會(huì)當(dāng)天,小冰還在現(xiàn)場演繹了騰格爾版本的《隱形的翅膀》,應(yīng)用的則是微軟最新發(fā)布的第四版人工智能歌曲DNN模型。
這個(gè)模型在微軟內(nèi)部又被稱為“沙魯小冰模型”。其中,“沙魯”的名字源于英文Cell,意為可以像細(xì)胞一樣不斷復(fù)制和變異。根據(jù)微軟介紹,使用沙魯小冰模型,小冰可以在自身嗓音中融合人類后天的技巧,比如模仿騰格爾的唱歌特色。
小冰歌聲波段圖,黃圈位置為小冰“氣息聲”
值得注意的是,這套模型不只可以應(yīng)用在唱歌。根據(jù)微軟透露,目前已成立單獨(dú)的小冰工作室,將對人類詩歌、作詞、作曲、繪畫等創(chuàng)造能力進(jìn)行系統(tǒng)性地建模,先期使用深度學(xué)習(xí)技術(shù)對人類的創(chuàng)造力進(jìn)行模仿,最終讓機(jī)器獲取自我創(chuàng)造的能力。
隨著小冰與人的邊界愈發(fā)模糊,有關(guān)用戶隱私的命題被擺在微軟面前,另外,諸如語音模仿等功能在電信詐騙等場景的濫用,也需要微軟在功能開放的決策中保持警惕。
”我們會(huì)把小冰的通用框架模型與商業(yè)化進(jìn)程隔離,同時(shí)會(huì)將一些垂直領(lǐng)域拆分出來,針對不同領(lǐng)域打造符合行業(yè)需求的 AI 機(jī)器人,并進(jìn)行單獨(dú)的商業(yè)化工作?!拔④浫斯ぶ悄苌虡I(yè)事業(yè)部總經(jīng)理曹文韜表示。
為了更好地為這些合作伙伴提供服務(wù),微軟此次還發(fā)布了另一重磅消息:建立Dual AI生態(tài)平臺(tái)。
一般來說,國內(nèi)AI 公司在進(jìn)行平臺(tái)搭建時(shí)會(huì)采用兩種方式:一種是完全的開放賦能,通過對開發(fā)者提供SDK/API的形式來構(gòu)建生態(tài),比如百度就將其底層“百度大腦”的百余種 AI 功能開放出來,讓開發(fā)者在基于 DuerOS 的生態(tài)中結(jié)合自身需求研發(fā)新的應(yīng)用。
今年7月,百度發(fā)布“百度大腦3.0”,對外開放出110項(xiàng)AI 能力。
另一種則是專注于自有的、封閉型平臺(tái),一般以“應(yīng)用商店”的形式構(gòu)建生態(tài),比如App Store,這種中心化的方式很容易導(dǎo)致流量不平衡,也會(huì)限制AI 應(yīng)用自身的快速迭代。
“無論是開放還是封閉,這兩種賦能方式與開發(fā)者的關(guān)系都過于松散,沒有人對最終的產(chǎn)品體驗(yàn)負(fù)責(zé)。”微軟小冰產(chǎn)品負(fù)責(zé)人彭爽談到。另外,由于API和SDK強(qiáng)調(diào)通用性,也就無法把最新的技術(shù)能力與最優(yōu)質(zhì)的數(shù)據(jù)第一時(shí)間應(yīng)用在API上。
因此,和百度 DuerOS 等 AI 平臺(tái)不同,微軟 Dual AI 并未將“開放”作為主旨,開發(fā)者不能像調(diào)用百度的 AI 接口那樣,以 API/SDK 的方式使用微軟在“小冰”等產(chǎn)品上的語音交互、NLP 等能力。
根據(jù)微軟官方透露,Dual AI 戰(zhàn)略具體分為三個(gè)部分:
首先,微軟提供小冰的整體框架能力,幫助合作伙伴平臺(tái)的自有AI。
其次,微軟小冰作為該合作平臺(tái)的輔助AI,融入該平臺(tái)生態(tài)。
第三,微軟通過技術(shù)、產(chǎn)品與運(yùn)營,圍繞該合作平臺(tái)的差異化特點(diǎn),推出合作的應(yīng)用和產(chǎn)品。
“AI 的發(fā)展離不開數(shù)據(jù),但我們既要強(qiáng)調(diào)用戶體驗(yàn),也要強(qiáng)調(diào)數(shù)據(jù)安全,而 Dual AI 就形成了一個(gè)循環(huán)數(shù)據(jù)的生態(tài),引導(dǎo)我們和第三方伙伴去合作?!鄙蛳蜓筮@樣表示。
小冰更高質(zhì)量互動(dòng),為商業(yè)化鋪路
對于 AI 機(jī)器人的 EQ 能力,微軟小冰負(fù)責(zé)人、被稱為“小冰之父”的李笛喜歡對媒體舉這樣一個(gè)例子:有個(gè)同事腳扭了,把腳扭傷的照片發(fā)給小冰,小冰的回復(fù)是,你傷得嚴(yán)重嗎?
這則回復(fù)包含了小冰的兩種能力:一種是圖像識(shí)別。小冰需要具備對人體部位的檢測功能,認(rèn)出圖像里的“腳踝”;另一種是得到聊天對方“受傷”的訊息后,能夠給出和人類相似的關(guān)心、安慰等情感表達(dá)。
這種深層次的情感反饋是李笛理想中的 AI 機(jī)器人形態(tài),在過去的采訪中,李笛曾表達(dá)過對當(dāng)前市面上人工智能產(chǎn)品的不滿。
“如果一個(gè) AI 系統(tǒng)只是在回答問題,完成任務(wù),那用戶為什么不用他們早已習(xí)慣的搜索引擎和手機(jī)App呢?”李笛說。
另一方面,當(dāng)小冰具有更加人情味的問答功能后,她與用戶的互動(dòng)質(zhì)量也會(huì)提升。
李笛談到這樣一個(gè)例子:當(dāng)你對小冰說“幫我訂一份麥當(dāng)勞”時(shí),AI 機(jī)器人一般會(huì)幫你下單外賣,但這個(gè)問題還會(huì)有另一個(gè)答案:就是當(dāng) AI 長期發(fā)現(xiàn)用戶不健康的行為習(xí)慣后,會(huì)拒絕你下單垃圾食品的請求。
微軟小冰負(fù)責(zé)人李笛
盡管被“拒絕”的滋味并不好,但這種人性化的 AI 形態(tài)會(huì)給用戶留下更加深刻的印象,部分用戶也會(huì)因此把小冰當(dāng)作一個(gè)值得信賴的伙伴,與小冰進(jìn)行更高質(zhì)量互動(dòng),這無疑為小冰的商業(yè)化埋下了伏筆。
2017年8月底,日本小冰“凜菜”(Rinna)與羅森便利店合作向用戶發(fā)送優(yōu)惠券,一天之內(nèi)有超過百萬的用戶領(lǐng)券消費(fèi),根據(jù)羅森統(tǒng)計(jì),平均每張優(yōu)惠券能為門店帶來近 20 元的利潤。
“小冰之所以能推銷出這么多的優(yōu)惠券,正因?yàn)樗谂c用戶交互時(shí)更像人?!崩畹言鴮γ襟w表示,通過簡單的聊天,小冰能引導(dǎo)用戶對優(yōu)惠券產(chǎn)生興趣,最終主動(dòng)向小冰索取優(yōu)惠券。
為了讓小冰的商用場景更加系統(tǒng)化的落地。微軟也在7月26日首次公布了小冰如今的四大商用領(lǐng)域:金融、大眾文化、媒體與出版。
其中,在金融領(lǐng)域的小冰金融文本生成技術(shù),與萬得資訊及華爾街見聞合作,已覆蓋國內(nèi)約90%金融機(jī)構(gòu)、75%經(jīng)批準(zhǔn)的合格境外投資機(jī)構(gòu)和約40%的國內(nèi)個(gè)人投資者。
在大眾文化領(lǐng)域,小冰的兒童有聲讀物自動(dòng)生成技術(shù)成果,已獲得超過400萬小時(shí)的收聽量,“小冰姐姐講故事”有聲讀物已覆蓋國內(nèi)90%以上的兒童早教機(jī)器人和80%在線收聽平臺(tái)。
在電視電臺(tái)領(lǐng)域,小冰通過人工智能技術(shù)參與生產(chǎn)與主持的電視電臺(tái)節(jié)目,已達(dá)21檔電視節(jié)目和28檔廣播電臺(tái)節(jié)目。
另外,小冰還與微軟Bing搜索引擎技術(shù)相結(jié)合,推出了針對媒體與出版兩個(gè)垂直行業(yè)的輔助型解決方案,目前已在超過15個(gè)媒體平臺(tái)落地。由小冰提供人工智能技術(shù)支持的媒體及自媒體公眾號已超過60000個(gè)。
該內(nèi)容為非商業(yè)目的的轉(zhuǎn)載分享,不代表本站觀點(diǎn),本文版權(quán)屬其著作權(quán)人所有。若侵犯了您的正當(dāng)權(quán)益,請立即聯(lián)系我們刪除。
閃電配音
免費(fèi)試音
幫我推薦
價(jià)格計(jì)算
在線下單
開具發(fā)票
不招主播
全網(wǎng)全品類皆可配 頂配好聲音
關(guān)注【客服微信】
聽最新案例,新客禮包等你拿!
提交成功
試音顧問將在工作日半小時(shí)內(nèi)聯(lián)系您,請準(zhǔn)備試音文稿或參考音頻加速匹配
你也可以注冊,可自助下單挑選主播,在線接單配音。(7 X 24小時(shí)主播接單)