6月初,阿里巴巴的菜鳥網絡與順豐快遞之間出現數據斷接。這只是大數據相關事件透露出來的表象,數據孤島現象又開始出現,龔才春說。 龔才春是一位創業者,2008年從中科院計算所博士畢業,研究自然語言處理,從2011年開始,特別關注大數據行業,畢業后去淘寶
6月初,阿里巴巴的菜鳥網絡與順豐快遞之間出現數據斷接。這只是大數據相關事件透露出來的表象,“數據孤島現象又開始出現,”龔才春說。
龔才春是一位創業者,2008年從中科院計算所博士畢業,研究自然語言處理,從2011年開始,特別關注大數據行業,畢業后去淘寶工作了3年時間,出來創業做職品匯項目,通過對職場大數據挖掘和整理,開展職場報告等系列商業活動。
現在,他對前途感到擔憂。2014年,“雙創”活動如火如荼之時,**興建了很多大數據交易中心和大數據交易所。當時,主要目的就是讓數據可交易、可交換,消除數據孤島。
但是,6月1日《網絡安全法》正式實施一個多月來,發生了一系列事件,“數據孤島現象又開始嚴峻起來。”龔才春說。
石家莊網絡優化獲悉《網絡安全法》正式實施前后,像一場寒流,席卷了整個大數據行業。首先,3萬多家做數據接口的公司可能直接關門。其次,新三板上市的數據堂公司,另外還有14家數據型的公司,被介入查封。再次,2017年5月20號左右,**人民法院和**人民檢察院出臺了一個《關于打擊倒賣公民隱私數據的辦法》,此辦法將讓很多做大數據營銷的公司在法律上出現一些障礙。
數據行業進入整肅期,而新的規則尚沒有頭緒。
對數據行業感到憂慮的不僅僅是龔才春,他的朋友張函同樣如此。
張函在數據公司寧芙科技工作,這家公司由*早的數據公司百分點公司分化而來。通過一些技術手段,寧芙科技隱去了一些數據中關鍵信息,比如應用虛擬電話號碼。這種做法讓其避免了5月底的一場磨難。
長久以來,網絡上個人信息的泄露事件頻頻發生,引發網民擔憂,去年11月,主管部門《中華人民共和國網絡安全法》針對性地應運而生。經過半年多時間征詢、探討和修改,今年6月正式實施。這個法律的實施,帶來的*直觀改變是數據中心安全性在加強,數據中心加強了機房安全設備,增加一些防火墻,解決個裸機和網上裸奔狀態。
但是,整個數據交易市場卻迅速顯現休克狀態?!毒W絡安全法》實施一個月以來,數據交易層面,因為上游主管部門的重拳出擊,15家數據公司被查,有的是被帶去問話,有些被要求交待問題,比如數據堂、聚信立等公司高管被帶去問話,整個公司業務呈收縮狀態。
隨之而起,下游數據需求方感到客戶開發受到嚴重影響。一位在天貓、京東做數碼產品營銷的人告訴騰訊科技,“電商營銷**一個人得打幾百個電話,這些電話怎么來?以前可以從工商局等地方拿到針對性數據,現在根本就拿不到。”數據和隱私泄露問題得到一定程度遏制。
影響*嚴重的是一些正在融資的數據公司。《網絡安全法》實施前后,有一家數據公司估值從20多個億直接掉到了7個億。這些代表著資本市場對于現在大數據業務的熱情在猛烈降溫。
當然,《網絡安全法》并未對泛濫流動的數據實現一刀切。仔細研讀《網絡安全法》,它給數據交易留了一個口子。數據一般不能直接交易,涉及到個人隱私時,需要經過**,不可還原。只有達到這樣條件,方可被交易。
盡管如此,龔才春感受到的是諸種不便。“我創業是在人力資源行業,尤其是征信項目,我們確實需要很多數據,包括公安、法院、銀行、證券和運營商等,我們對這些數據接口存在一定依賴性??墒乾F在,這些接口很多都是斷裂的。”
下一步具體該怎么辦?怎么引導數據有效地流通起來?數據只有流通起來,才會有更大用處。但是,如何有序地、安全地讓流通起來,發揮更大作用,目前沒人知道該如何入手。
很多細節需要探討。目前,交易*活躍的數據在征信、電商、營銷等幾個行業。但是,《網絡安全法》出來之后,這些行業的數據都可以定位到個人,比如通過手機號、地址,或者設備號。如果嚴格守法,這些都有可能被追究。
關于這一點,不同主管單位之間也存在矛盾。5月底,阿里巴巴的菜鳥網絡和順豐之間出現一個數據斷接,引起大探討。實情是,順豐的數據給了阿里巴巴,阿里巴巴沒有把利益給到順豐。在順豐想做電商的時候,客戶的相關數據就成為雙方爭奪的資源。
石家莊網絡建設消息從《網絡安全法》來看,“順豐把數據給阿里巴巴,按照法律規定,這是違法的,里面有公民隱私數據。”龔才春分析道。但是,緊接著,6月初,**郵政局又出面稱,順豐要和阿里巴巴打通數據,否則在淘寶上**很多用戶看不到自己物流的狀況。“產生沖突了,公安部和郵政局在打架。”龔才春說。
管理有待理順
大數據隨著人工智能的風口而更加火熱,但是,具體到大數據采集、分析、流通、交易環節,國內許多未理順的環節讓人不得不生出疑問,人工智能就執行層面而言,在中國還是非常遙遠之事。
《網絡安全法》實施,掀起整治風暴之前,數據交易以一種粗獷、地下方式存在著,有很多不規范之處。數據產生于公安、法院、銀行、證券和運營商等等。國內大數據交易中心所交易的數據都是上述機構所產生數據。這次被官方查處一些數據公司,主要問題是私下交易上述數據而沒有得到當事人的授權。
操作手法并不復雜。一般是數據公司找到數據接口提供方,開通數據接口API服務,可能每條花費兩毛錢,轉手加一毛售出。據業內人士稱,“有些公司一年能賺幾十個億。”
一方面,來自于公共服務部門的數據占據主體。這些數據通過一些官方認可、擁有資質的公司,比如國政通進行售賣,屬合法合規,如果有人接過數據再加工處理售賣,是否違法解釋權規主管部門。
另一方面,一些民營企業和互聯網公司自身擁有的數據,都很好地保護起來,成為公司核心資產,很少流出來。比如招聘網站上面的簡歷,很難成批收集。
這兩種原因導致上游數據資源相對匱乏,進而影響到中間交易環節中數據交易中心形同虛設。國內“呼聲**的,雷打得*響”的貴陽大數據交易中心,業務并不活躍。國內其它數據中心,遍布廣東、福建、湖北、山東、浙江等地,收費模式不外乎吸收會員收取會員費,或者是靠撮合交易提成傭金,都活得很艱苦。有些數據中心干脆做些培訓業務。“真正掌握很多數據的是大公司,像電信運營商、大銀行和互聯網巨頭們,它們之間是很難合作。”龔才春判斷,原因是容易在某個領域產生競爭。
以美國來說,用于公共事務的數據和個人隱私數據分開。大規模的數據治理起源于20世紀以來的政府信息化管理。比如1929年由胡佛倡導,在美國建立的非電子化犯罪信息記錄系統。20世紀60年代,美國開始建立**統一的犯罪信息系統,這些數據的用途超出了犯罪記錄查詢,對勞動力市場甄選工作、福利計劃執行都有巨大幫助,從面成為政府治理手段的基石。
龔才春認為國內的遺憾在于數據管理遠遠未跟上時代發展步伐。“國外有一些大的機構和政府現在會設置一個崗位叫首席隱私官。”首席隱私官會從數據產生的源頭,數據流通的各個環節,包括**數據形成的報告或者是形成的產品,從各個環節把控數據隱私,保障各個環節泄露出去都不會定位到個人,保護個人隱私。做到了這些,“反而加速數據流動”。
現實問題是,如果數據沒有流暢的通道流通,畸形發展的結果是*終變成信息孤島。
如果有數據的流通,很多行業會發展的更健康。眼下一個實例是直播,經過去年的熱火之后,行業萎靡非???。去年代表性公司映客,已經到了與公關公司合并發展的地步。石家莊網絡優化表面上看,直播走向萎靡,是失寵于資本,真正原因是 2015年至今,直播行業限入同質化競爭,未能拿到有效的大數據進行耕細化運作。
直播概念興起,捧紅了一部分主播,但是后來跟進者眾多,如何進行個性化精細運作就成為關鍵。以往的客戶導流,在經歷過*初的大水漫灌之后,“沒有大數據支撐,用戶沒有根據年齡、地域、性別和愛好等區分,就是一個粗獷數據導量。”
但是,美國的Facebook和谷歌(微博)并不是這么做的。這兩家公司把直播和用戶數據匹配,力爭讓用戶接觸到自己喜歡的內容。
作為創業型公司,寧芙科技應對之策是通過一些激勵手段吸引C端用戶,授權允許寧芙獲得數據后進行加工處理。另一方面,寧芙科技將數據挖掘和整理朝汽車行業深耕,想通過數據方面的服務解決汽車廠商的問題。
龔才春則認為,從人力資源領域切入大數據非常有價值,一個人的職場數據是其*重要的也*有價值的數據,對于個人征信、金融風控、企業招聘都有非常重要的參考價值。為了保證數據的安全,防止隱私數據泄露,龔才春還購買了若干服務器放在辦公室,讓隱私數據實現與外網的物理隔離。
很多人沒有注意到,《網絡安全法》第十八條也要求大家促進公共數據資源開放,但由于“不作為”或不惹事意識,《網絡安全法》正式實施后實際上關閉了很多公共數據資源,使真正合法的公共數據資源的獲取更困難。龔才春擔心經過此輪整肅,大數據有可能會像當年網格計算一樣不再成為一個行業主流熱點,又或者像O2O一樣,火過一陣后,實際上并沒有留下什么。