国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

量子位
+ 關注
2022-07-19 16:32
710次閱讀

不知不覺間,接打快遞、銀行等電話時,遇到AI的情況越來越多了。

目前和這些AI溝通,還得講究一個技巧:

要保持你一句我一句的標準節(jié)奏,不然難免變成“人工智障”。

比如話說一半卡殼停頓了,AI會以為你說完了,對著半句話給出莫名其妙的回復。

如果在一句話中間打斷它,也很少有AI能反應得過來。

要是投訴時情緒比較激動,對著話筒一頓輸出,AI可能只回復了第一句,甚至不聽你的,跟你“搶話”。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

谷歌在今年的I/O大會上終于提到這個問題,給出的初步解決方案演示還獲得滿場掌聲。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

不過,國內(nèi)其實有人關注這個問題比谷歌更早,那就是擁有復雜場景的京東,早就在實際業(yè)務遇到類似的問題。

在京東集團副總裁、IEEE Fellow何曉冬博士看來,這既不屬于語音識別問題,也不屬于語義理解問題,學術研究中往往關注度不高。

只有在落地實踐中,這樣的問題才會暴露出來,進而有機會解決。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

2018年,何曉冬離開工作了十余年的微軟雷蒙德研究院,也是自然語言處理、語言與視覺多模態(tài)智能等領域的領軍人物之一,選擇回國加盟京東。

這其中也是有擁抱場景、離實踐更近方面的考量。

在京東,何曉冬帶領團隊融合聲學、語義、時間等多模態(tài)特征,開發(fā)了一系列人機交互場景的“話語權決策“(Turn taking)技術。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

多模態(tài)融合的話語權決策(Turning Taking)

如今,這套技術在京東智能客服系統(tǒng)上每天有百萬到千萬級的咨詢量,就相當于每天要做上千萬次圖靈測試,已經(jīng)日趨成熟。

而像這樣的問題,何曉冬加入京東以來遇到的還有不少。

在AI發(fā)展的上一個階段首先解決了高頻場景,但用戶多了難免出現(xiàn)邊緣案例(edge case)。

隨著京東言犀在全國業(yè)務的推廣,識別各地方言的需求開始凸顯,遇到情緒有波動的客戶也更多了。

極端情況下,偶爾會遇到用戶咨詢要買一整瓶安眠藥,言語間帶有輕生傾向。

后來京東做了一個生命通道項目,專門檢測識別這樣少見但重大的情況。檢測到之后一方面可以在言語上安撫客戶、通知物流先不發(fā)貨,另一方面聯(lián)系當?shù)氐木交蛏鐓^(qū)人員介入。

從技術上說,除了識別語音,解決這些問題還需要識別用戶意圖、感知用戶情緒以及多輪對話管理。

對此,何曉冬進一步提出“對話的本質(zhì)是推理與決策”,語言只是其中一種表現(xiàn)形式。

圍棋在過去又叫“手談”,代表這種博弈游戲就像是用手去交談對話。如果反過來,對話也是一種推理與決策,你需要了解整個棋局,并能夠完美執(zhí)行。

在京東的智能客服領域,決策推理能力還體現(xiàn)在如果遇到退換貨、或者其他問題,言犀可以結合對業(yè)務場景深度的理解,以及RPA(機器人流程自動化)能力,特別情況下還通過優(yōu)惠券等多種方式來補償客戶,或遇到復雜問題自動轉接給人工客服處理。

通過解決客戶服務實踐中遇到的種種問題,一套語音語義技術被打磨得更實用,也更以人為本。

情感識別上,有業(yè)界首個大規(guī)模商用的情感系統(tǒng),能識別生氣、失望、憤怒、焦慮等7種情緒。

方言識別上,專門開發(fā)口音適配模型和算法,結合語音識別和語義理解聯(lián)合建模保證精確性,已能識別粵語、四川話等多地方言。

另外何曉冬認為,在業(yè)務實踐中除了能打磨完善單個技術,還能促進多技術的融合。不僅可以提升了技術應用的穩(wěn)定性,令其有更好的適應性。例如前端的一個指令,背后往往是一套多協(xié)同的算法在“并肩作戰(zhàn)”。

如從商品文案生成的需求出發(fā),語言模型結合領域知識圖譜的AI算法已實現(xiàn)3000種品類的文案,總計“種草”30億字。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

同時,京東上有著5.8億活躍用戶、1000萬個自營SKU和數(shù)十萬商家,智能客服每天處理1000萬次服務,每月產(chǎn)生200萬小時脫敏通話數(shù)據(jù)。

再加上每年的618、雙11的峰值負載考驗,這一套智能客服技術在工程上也沉淀出了最佳實踐。

現(xiàn)在技術和工程實踐在京東內(nèi)部已經(jīng)跑通,能不能讓它們?nèi)ソ鉀Q更多問題?

何曉冬認為,這樣一套端到端的能力可以開放出來給更多第三方使用。

只不過這些技術在內(nèi)部使用時是高度定制化的,開放出來就需要做解耦出來,在更廣泛的場景做到復用。

在剛剛舉辦的京東云峰會上,何曉冬發(fā)布了全新升級的人工智能應用平臺言犀2.0。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

這一次,言犀2.0特別強調(diào)的關鍵詞是應用平臺,而不是一個開發(fā)平臺。

這是因為AI能力要服務于生產(chǎn)制造、倉儲物流、中小賣家等供應鏈上下游離技術更遠的企業(yè)時,就不能只是做個跑分高的算法模型、提供個API接口了事。

而是需要把技術和最佳實踐一起沉淀到產(chǎn)品里,端到端的交付。

京東零售業(yè)務經(jīng)過19年發(fā)展,已經(jīng)構建起一套完整的供應鏈基礎設施,覆蓋商品的制造、流通、消費和服務的全周期。

進一步,可以把零售行業(yè)的價值鏈分為創(chuàng)意、設計、研發(fā)、制造、定價、營銷、交易、倉儲、配送、售后等十個環(huán)節(jié),這便京東從14年開始提的“十節(jié)甘蔗”理論。

當前,在數(shù)字化升級、智能化轉型的大趨勢下,京東又提出“數(shù)智供應鏈”

也就是將京東在供應鏈上沉淀的技術能力解放出來,服務更多實體產(chǎn)業(yè)。

這里面既是京東在技術服務上的差異化競爭優(yōu)勢,也是不得不做,這是因為——

在AI落地早期階段的特點是“單點應用”,如簡單的問答、人臉識別等。

下一步則是在某些高頻場景的大規(guī)模、全鏈條應用,如零售、金融等場景。

再往后就進入了產(chǎn)業(yè)AI的“深水區(qū)”,不可避免要遇到低頻、長尾場景,新的困難也隨之出現(xiàn)。

這些場景的數(shù)據(jù)樣本少、數(shù)據(jù)分布不均,對技術來說研發(fā)成本更高,同時定制化程度高、難以復制。

要解決這些困難,過去的單點突破則走不通了,那么,接下來又該怎么走?

此前從京東內(nèi)部的經(jīng)驗可以看出,技術必須要在真實場景下實踐才能暴露出問題,多種技術之間也是在真實場景下實踐才能更好的融合。

在供應鏈視角下,這里的多技術已不僅指AI內(nèi)部的各個分支,還要算上云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、5G、區(qū)塊鏈等更廣義的技術。

同時,供應鏈所有環(huán)節(jié)都需要數(shù)智化轉型才能最大化效率,帶來上下游之間的協(xié)同效應。

由此京東云提出,產(chǎn)業(yè)數(shù)字化的下一站便是數(shù)智供應鏈

而京東作為一家既懂技術又懂供應鏈的公司,在這之中要扮演的是用技術連接起產(chǎn)業(yè)互聯(lián)網(wǎng)和消費互聯(lián)網(wǎng),同時在商品的制造、流通、消費和服務環(huán)節(jié)推進數(shù)智化轉型。

而京東本身就是一個復雜、嚴苛的“場景”,對成本、體驗、效率有著極致的要求。

向這些環(huán)節(jié)提供智能服務創(chuàng)造價值的同時,又能通過反饋進一步迭代技術,最終走入正向循環(huán)。

總的來說,就是從京東復雜業(yè)務場景深度解耦出來的AI能力,歷經(jīng)多年的考驗和驗證,平臺技術能力可用性強,復用度高,遷移成本低,可以不斷復制到其他行業(yè)。

這樣就解決了AI規(guī)模化落地的問題,面對一些低頻、長尾的場景,也更容易遷移。

在今年的京東云峰會上,基于言犀2.0應用平臺還發(fā)布了政務、金融、數(shù)字人等技術產(chǎn)品。

政務方面的產(chǎn)品是“京東政務大腦”,以人機交互能力為核心,結合多種技術提供了政務咨詢一網(wǎng)通、疫情防控與排查、智慧養(yǎng)老等一系列解決方案,服務市政民生。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

金融方面則是結合對話、決策能力與金融領域專業(yè)知識,推出金融全鏈路智能營服銷一體化解決方案。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

最后還有言犀多模態(tài)數(shù)字人平臺,與市面上的數(shù)字人相比,京東數(shù)字人更注重產(chǎn)業(yè)服務,同時強調(diào)AI驅動的多模態(tài)交互能力,目前已走進直播帶貨、銀行業(yè)務辦理、政務服務等多個場景。

曾經(jīng),我對著AI客服噴了兩分鐘,它只回復了我的第一句話

數(shù)字人言小希與京東總部合影

為什么首先選擇這幾個領域?

何曉冬也給出了他對數(shù)智供應鏈應如何推進上的思考。

從AI技術公司,到泛互聯(lián)網(wǎng)行業(yè),再到更傳統(tǒng)的行業(yè),離技術越遠則數(shù)智化的需求和機會越大,但同時推進數(shù)智化的難度也更大。

這其中,金融、政務這些行業(yè)數(shù)字化基礎設施已初步建設完善,與大眾關系又緊密。

先從這些領域入手去推進智能化,可以迅速打開局面,再一步步深入滲透進能源、制造業(yè)等更傳統(tǒng)的行業(yè)。

選擇做數(shù)字人平臺也是類似的思路,數(shù)字人當下產(chǎn)業(yè)需求非常龐大,又是人機交互技術最佳的表現(xiàn)載體,可以一邊創(chuàng)造價值,一邊進一步檢驗和完善技術。

本文來自微信公眾號“量子位”(ID:QbitAI),作者:關注前沿科技,36氪經(jīng)授權發(fā)布。

資深作者量子位
0
消息通知
咨詢?nèi)腭v
商務合作