專家團(tuán)|宋星:媒體說(shuō)能給我提供數(shù)據(jù)?到底能提供什么數(shù)據(jù)?
廣告主渴望獲得數(shù)據(jù)。
但是,獲得數(shù)據(jù)的路子似乎越來(lái)越窄,窄到當(dāng)有媒體(或者第三方)跟我們說(shuō),我們能給你提供數(shù)據(jù)的時(shí)候,我們會(huì)覺得異常興奮。
興奮之余,要冷靜。這個(gè)時(shí)候,如同我們?cè)诠ぷ髦谐3?huì)有的好習(xí)慣——那就是,不要模模糊糊,而是要搞清楚,到底是什么情況——就會(huì)對(duì)我們非常有用。
這篇文章,我想快速跟大家聊聊,所謂的提供數(shù)據(jù),到底有哪些方式,又能提供什么樣的數(shù)據(jù)。
全文大綱
1.媒體(或其他第三方)為企業(yè)“提供”數(shù)據(jù)的四種情況
2.第一種方式:Raw Data轉(zhuǎn)移的場(chǎng)景
3.第二種方式:ID匹配后轉(zhuǎn)移命中的個(gè)體級(jí)別屬性或部分屬性的場(chǎng)景
4.第三種方式:ID匹配后提供統(tǒng)計(jì)報(bào)告
5.第四種方式:橫向聯(lián)邦學(xué)習(xí)或者遷移聯(lián)邦學(xué)習(xí)方式
6.總結(jié)
媒體(或其他第三方)為企業(yè)“提供”數(shù)據(jù)的四種情況
上圖:為企業(yè)“提供”數(shù)據(jù)的四種情況。
圖片來(lái)自于“宋星大課堂:《數(shù)字化增長(zhǎng)——以消費(fèi)者為核心的數(shù)字營(yíng)銷的 轉(zhuǎn)型、路徑與落地》”
請(qǐng)注意,就像我在上面的圖中所描述的,媒體(或其他第三方)為企業(yè)提供數(shù)據(jù),是有各種方式的。你所認(rèn)為的數(shù)據(jù)提供,和他們?yōu)槟氵M(jìn)行的“提供”,很可能壓根就有很大的區(qū)別。
這四種數(shù)據(jù)提供的方式,分別是:
第一種:直接把原始數(shù)據(jù)(Raw Data)拷貝給你,數(shù)據(jù)發(fā)生了物理上的轉(zhuǎn)移(復(fù)制、下載等)。所謂Raw Data,是指關(guān)于用戶的一條一條的行為、屬性、興趣等各種原始的記錄。
第二種:不直接拷貝給你Raw Data,但是跟你手中所擁有的用戶進(jìn)行ID的匹配。匹配之后,把能夠匹配命中的ID項(xiàng)下的屬性數(shù)據(jù)(或部分屬性數(shù)據(jù))轉(zhuǎn)移給你。這些數(shù)據(jù)都是按照ID分為一條一條的,所以是個(gè)體級(jí)別的數(shù)據(jù)。ID的匹配,在《個(gè)保法》出臺(tái)之前,大家常常以明文的方式進(jìn)行匹配,而現(xiàn)在則幾乎都是通過加密ID再進(jìn)行匹配的方式,甚至?xí)玫礁甙踩?jí)別的加密ID匹配,即采用隱私計(jì)算中的縱向聯(lián)邦學(xué)習(xí)的方式。
第三種:跟第二種類似,同樣要進(jìn)行ID匹配,只不過匹配之后,不是把命中的ID項(xiàng)下的屬性數(shù)據(jù)給你,而是把所有命中的ID的屬性數(shù)據(jù)進(jìn)行統(tǒng)計(jì)整理,然后把統(tǒng)計(jì)結(jié)果以報(bào)告的形式轉(zhuǎn)移給你。
第四種:是相對(duì)比較燒腦的一種方式,在這種方式下,數(shù)據(jù)不進(jìn)行ID的匹配,而是數(shù)據(jù)提供方(暫且這么叫吧,因?yàn)閴焊蜎]有提供實(shí)際數(shù)據(jù))和廣告主分別計(jì)算模型,并向各自返回模型和計(jì)算結(jié)果。這種方式常常采用聯(lián)邦遷移學(xué)習(xí)的高段位方法,也有采用廣告主和數(shù)據(jù)提供方選取同樣的屬性字段各自計(jì)算模型之后再優(yōu)化模型的橫向聯(lián)邦學(xué)習(xí)的方法的。但總體是一種理論上ok,但實(shí)際操作起來(lái)十分“縹緲”的玩法。各種具體的聯(lián)邦學(xué)習(xí)的方式,大家如果感興趣,我會(huì)在我的“宋星大課堂:《數(shù)字化增長(zhǎng)——以消費(fèi)者為核心的數(shù)字營(yíng)銷的 轉(zhuǎn)型、路徑與落地》”上介紹。
下面,我來(lái)講講各種方式下,常用的數(shù)據(jù)“提供”的場(chǎng)景和價(jià)值。
第一種方式:Raw Data轉(zhuǎn)移的場(chǎng)景
聽說(shuō)用卡車運(yùn)送硬盤,是目前大數(shù)據(jù)量數(shù)據(jù)轉(zhuǎn)移速度最快的方式,能到達(dá)大概每秒100個(gè)G。但這樣的數(shù)據(jù)轉(zhuǎn)移,基本上只可能發(fā)生在企業(yè)內(nèi)部,比如阿里就用過這樣的方法轉(zhuǎn)移他們的數(shù)據(jù)。
不過,用卡車運(yùn),如果萬(wàn)一路上出個(gè)車禍——不敢想,不敢想。
回到我們的場(chǎng)景中。無(wú)論是媒體,還是外部數(shù)據(jù)提供方,現(xiàn)在都不太可能給企業(yè)提供Raw Data。很多年前確實(shí)有這樣的生意,而且很普遍,有些人還因此發(fā)家買了很多套房。但隱私保護(hù)、個(gè)人信息保護(hù)以及數(shù)據(jù)安全的法律逐漸完善起來(lái)之后,這樣的場(chǎng)景基本上沒有了。
不過,只是基本上沒有。如同任何不合法的交易都存在黑市一樣,Raw Data數(shù)據(jù)轉(zhuǎn)移也有黑市。別問我這些黑市在哪兒,我也不知道,而且正經(jīng)企業(yè)不會(huì)問我這個(gè)問題。
第二種方式:ID匹配后轉(zhuǎn)移命中的個(gè)體級(jí)別屬性或部分屬性的場(chǎng)景
當(dāng)你看到我寫出了個(gè)體級(jí)別四個(gè)字,你可能會(huì)認(rèn)為,這種情形應(yīng)該也不存在了——沒有什么媒體還愿意給廣告主個(gè)體級(jí)別的數(shù)據(jù)了。但事實(shí)上,這種數(shù)據(jù)轉(zhuǎn)移仍然是有場(chǎng)景的。
電商平臺(tái)的會(huì)員通,會(huì)跟廣告主的會(huì)員,在進(jìn)行ID匹配(通常是用加密的電話號(hào)碼)之后,提供給廣告主該ID的部分與會(huì)員權(quán)益等相關(guān)的數(shù)據(jù),這些數(shù)據(jù)是個(gè)體級(jí)別的。
微信生態(tài),微信也會(huì)在用戶授權(quán)的情形下,利用OpenID或者UnionID,經(jīng)由API,給廣告主提供個(gè)體級(jí)別用戶的部分行為或?qū)傩詳?shù)據(jù)。
所以,不像第一種方式,第二種方式仍然是常見的數(shù)據(jù)提供的方式。
但是,這種方式顯然有一個(gè)很值得注意的點(diǎn),那就是,提供的個(gè)體級(jí)別的屬性數(shù)據(jù)能包含什么,是由媒體圈定范圍,并由用戶實(shí)際授權(quán)同意之后,才可能發(fā)生的。
所以,通常這些數(shù)據(jù)的類型會(huì)很有限。
第三種方式:ID匹配后提供統(tǒng)計(jì)報(bào)告
這也是一種常見的場(chǎng)景,而且基本上符合法律所規(guī)定的個(gè)人信息保護(hù)的合規(guī)要求。
例如,廣告主將自己CDP中圈選的人群的ID加密后(或縱向聯(lián)邦學(xué)習(xí)的方式),與媒體的DMP中用戶的ID進(jìn)行匹配。匹配后,媒體把這部分人的屬性進(jìn)行統(tǒng)計(jì)整理,以所謂的“人群畫像”的方式提供給廣告主。
這種方式,基本上用于做人群畫像或者人群洞察了。
雖然對(duì)于精細(xì)化運(yùn)營(yíng)每一個(gè)用戶或者每一個(gè)消費(fèi)者并無(wú)直接作用,但是在幫助形成營(yíng)銷策略上,是很有價(jià)值的。
第四種方式:橫向聯(lián)邦學(xué)習(xí)或者遷移聯(lián)邦學(xué)習(xí)方式
在深度利用企業(yè)的CDP方面,需要用到此種方式。
但是,大部分企業(yè)可能都難以擁有這樣的能力。
一個(gè)簡(jiǎn)單的應(yīng)用,以汽車行業(yè)為例。汽車行業(yè)的主機(jī)廠,擁有很多用戶在私域觸點(diǎn)上的各種行為數(shù)據(jù),這些數(shù)據(jù)例如“看了某個(gè)車型介紹的次數(shù)”或者“查看汽車金融的次數(shù)”或是“在某類車型頁(yè)面上的停留時(shí)間”。而媒體也有完全一樣類型的這樣的數(shù)據(jù)(比如騰訊汽車或者懂車帝也有類似的數(shù)據(jù))。然后,二者各自基于這些數(shù)據(jù)類型和一個(gè)通用模型進(jìn)行計(jì)算,并各自得出一個(gè)比通用模型更優(yōu)化的模型,該模型能判斷這些數(shù)據(jù)的值具體是什么情況時(shí),用戶就會(huì)表現(xiàn)出較為明確的愿意“留資(就是有購(gòu)車意向)”的傾向。之后,二者將各自的模型互相傳遞,再基于兩個(gè)優(yōu)化模型得出一個(gè)更新的通用模型,隨之再把這個(gè)新的通用模型給二者,并基于更多的數(shù)據(jù),再做計(jì)算,各自再得出一個(gè)更更優(yōu)化的模型……
這個(gè)過程循環(huán)n次,直到得到一個(gè)滿意的通用模型,兩邊都能拿著用于預(yù)測(cè)各自的用戶是否有購(gòu)車意向。——這就是橫向聯(lián)邦學(xué)習(xí)。
上圖:橫向聯(lián)邦學(xué)習(xí)的示意過程。
圖片來(lái)自于“宋星大課堂:《數(shù)字化增長(zhǎng)——以消費(fèi)者為核心的數(shù)字營(yíng)銷的 轉(zhuǎn)型、路徑與落地》”
聯(lián)邦遷移學(xué)習(xí)則更加“牛”,不過比較復(fù)雜,就大致說(shuō)一下。簡(jiǎn)單說(shuō),就是媒體和廣告主,不僅雙方ID不允許做任何匹配,就連用戶的屬性數(shù)據(jù)類型都不一樣,比如媒體只有“看了某個(gè)車型介紹的次數(shù)”或者“查看汽車金融的次數(shù)”的數(shù)據(jù)類型,而車企只有“在某類車型頁(yè)面上的停留時(shí)間”的數(shù)據(jù)類型。然后二者還是要得到一個(gè)更優(yōu)化的預(yù)測(cè)用戶是否可能留資的模型。
所以,如同我講的車企的例子,第四種方式常常用于預(yù)測(cè)和人工智能判斷。通常無(wú)論是廣告主還是媒體,都需要相當(dāng)大體量且類型豐富的數(shù)據(jù)。
因此,這種方式,聽起來(lái)就已經(jīng)很“玄學(xué)”,落地實(shí)現(xiàn)起來(lái)就更加困難了。也不是沒有企業(yè)這么做,但是,真的很少。
總結(jié)
現(xiàn)在,你再看看你的媒體跟你承諾的,要提供給你數(shù)據(jù),是什么情況?
大部分,我相信,都是第二種和第三種。尤其是第三種,特別多。
你所期待的,全量的Raw Data的提供(也就是第一種),在今天恐怕越來(lái)越難以實(shí)現(xiàn)。
本文來(lái)自微信公眾號(hào)“宋星的數(shù)字觀”(ID:chinawebanalytics),作者:宋星,36氪經(jīng)授權(quán)發(fā)布。
