對于第三方數據公司來說,仿佛一夜入冬了。 近期,數據圈接連傳出重磅消息。先是魔蝎科技、新顏科技被爆遭到調查,然后公信寶運營主體杭州存信數據科技有限公司(下稱存信數據)也被杭州市公安局西湖分局古蕩派出所查封。 而且這可能只是開始,本次監管部門
對于第三方數據公司來說,仿佛一夜入冬了。
近期,“數據圈”接連傳出重磅消息。先是魔蝎科技、新顏科技被爆遭到調查,然后公信寶運營主體——杭州存信數據科技有限公司(下稱“存信數據“)也被杭州市公安局西湖分局古蕩派出所查封。
而且這可能只是開始,本次監管部門對打擊違法獲取和使用信息的大數據公司的決心很大。北京一家數據科技公司研發部負責人劉毅(化名)告訴《華夏時報》記者:“公司已經放假了,何時上班十一后等通知。其他一些公司也提前放假了,沒放假的也在停工觀望,現在監管部門對提供爬蟲服務的數據公司整治力度空前的大。”
而對于目前“數據圈”存在的亂象,中信集團原監事長、中信銀行原行長朱小黃在“2019中國銀行業發展論壇智慧金融(上海)峰會”上指出,好多數據公司都是“爬”下來的數據,當然成本低,數據公司利用了這個成本低的優勢,迅速的獲得收益。這種建立在侵犯個人、企業數據下形成了一個商業模式使行業產生了異化。
在近年互聯網金融大潮中,大數據服務供應商一直扮演著重要角色。而近期多家公司接連被查,將處于數據風控服務核心的網絡爬蟲技術推到了風口浪尖。
爬蟲作為一種計算機技術,具有技術中立性,爬蟲技術在法律上從來沒有被禁止。爬蟲的發展歷史可以追溯到20年前,搜索引擎、聚合導航、數據分析、人工智能等業務,都需要基于爬蟲技術。但是爬蟲作為獲取數據的技術手段之一,由于部分數據存在敏感性,如果不能甄別哪些數據是可以爬取,就會觸及監管紅線。
“爬蟲技術作為第三方大數據風控服務商的主打產品,也是互聯網金融公司進行大數據風控必不可少的武器。”劉毅對記者說,“不過,目前網絡爬蟲存在著是否經過用戶授權,是否存在過度爬取信息,爬取到的信息使用等問題。隨著同業競爭越來越激烈,一些畸形的爬蟲產品也隨之出現,涉及數據竊取、泄露、濫用和隱私安全等問題。”
一些大數據風控服務商為了在競爭中取得領先地位,需要更**的分析用戶行為,制作用戶畫像,為了獲取海量的數據支撐,電商數據、通信運營商、出行數據,信用卡、人行征信等信用數據,甚至網銀、公積金等金融數據等,都成為爬蟲們的目標。
據劉毅介紹, 市場上曾經有一款專門爬取支付寶數據的產品。只需要用支付寶掃描一下登錄“二維碼”,就可爬取支付寶用戶的真實姓名、手機號、收貨地址、近一年的購物信息、交易記錄等。而一家第三方大數據風控服務商曾在市場上推出的一款“同業爬蟲”產品更厲害,只需要用戶提供其在其他現金貸平臺的賬號和密碼,就可以爬取用戶的所有信息,包括放款額和風控數據。放款機構可以根據這些數據進行評估,實現“秒批”和“秒放”。這個產品相當于直接掠奪同業數據,竊取別人的風控成果。由于過于野蠻粗暴,被業內成為“耍流氓”。
“只要技術好,就沒有爬不到的數據。”劉毅總結道。
“一些第三方大數據風控服務商利用爬蟲技術違法獲取或過度獲取用戶信息并使用的行為,已經成為阻礙行業健康發展的瓶頸。而個別公司打著金融創新的幌子,就是為了突破監管的要求。無論公司發展的規模多大,違規獲取和使用數據的行為都是不可能回避的‘原罪’。”一位不具姓名的金融業人士向本報記者指出。
提高自主風控能力
事實上,對大數據公司獲取和使用用戶信息的行為并非無法可依。
早在2017年6月1日,《網絡安全法》正式施行,比如第四十一條規定,網絡運營者收集、使用個人信息,應當遵循合法、正當、必要的原則,公開收集、使用規則,明示收集、使用信息的目的、方式和范圍,并經被收集者同意;第四十四條規定,任何個人和組織不得竊取或者以其他非法方式獲取個人信息,不得非法出售或者非法向他人提供個人信息。
而在2019年5月28日**互聯網信息辦公室發布的《數據安全管理辦法(征求意見稿)》也明確出現了對網絡爬蟲規制的法律條文。其中第十五條規定,網絡運營者以經營為目的收集重要數據或個人敏感信息的,應向所在地網信部門備案。備案內容包括收集使用規則,收集使用的目的、規模、方式、范圍、類型、期限等,不包括數據內容本身;第二十條表示,網絡運營者保存個人信息不應超出收集使用規則中的保存期限,用戶注銷賬號后應當及時刪除其個人信息;第二十七條指出,網絡運營者向他人提供個人信息前,應當評估可能帶來的安全風險,并征得個人信息主體同意。
目前,隨著“數據圈”亂象整治的深入,一些公司紛紛對業務進行調整。其中,上海一家信息科技公司干脆發公告給合作商戶稱,暫停對外提供用戶授權的運營商爬蟲服務,擁抱監管、加強自律。
公開信息顯示,本次被調查的公司大多是國內較早從事大數據智能解決方案的服務商。主要為銀行、保險、消費金額公司、貸款機構等提供智能風控、風險分析、信用分析、多頭借貸、風控建模等風控技術解決方案,合作機構多達數千家。
上述金融業人士也向本報記者表示,嚴格監管對于行業的長遠發展起到了積極作用。隨著強監管信號的不斷釋放,野蠻生長的大數據收集時代將結束。這對很多風控公司、征信公司以及金融機構都會受到深遠的影響。
那么,對于金融等機構來說,這些民營第三方數據供應商,真的無可替代了嗎?其實,早在2014年初,北京中關村就成立了樹海大數據交易平臺,
石家莊網站建設消息2015年4月****個大數據交易所在貴陽掛牌運營;同年7月底,武漢東湖大數據交易中心開業。此外,江蘇、浙江等省份也籌建了自己的大數據交易中心或交易所。
河南一家城商行的高管告訴本報記者:“這些**性質的數據交易所或交易平臺,受到的**管控較強,其數據確實非常合規,但由于來源渠道受限,對于金融機構來說在實際應用中效果不大。”
不過,對于金融機構來說,在有限的數據下做好風控是未來必須面對的問題。前述金融業人士認為,事實上,此前一些金融機構的風控工作,主要是靠引入數據供應商,反倒是自身的風控水平出現下滑。另外,數據資源太多也不一定是好事,會導致很多金融機構貸前審核不認真,降低了準入門檻,讓很多還款能力弱、還款意愿不強的用戶通過了審核,**金融機構只好通過加大貸后催收力度的辦法迫使其還款,這又衍生出暴力催收的問題。
斷掉第三方數據供應商違規獲取的數據后,金融機構只能扎扎實實地開展貸前審核工作,讓真正**的、有技術能力的企業凸顯出來。
在這次整治數據亂象中,9月17日,第三方智能風控與分析決策服務供應商同盾科技實控人兼CEO 蔣韜在公開信中表示,人工智能及大數據這個行業是個新領域,這個新領域是需要所有從業者一起努力,在競爭的過程中互相學習,共同幫助和配合監管機構,逐步建立起這個行業的**實踐以及規制。
盡管監管部門對數據公司整治力度空前,但不可否認的是,大數據市場未來發展前景仍十分廣闊,是當之無愧的藍海。
國內的大數據產業,眼下已經進入了快速發展時期,政府、通信和金融領域,已經成為了大數據技術落地的重點。其中,銀行、保險、證券與投資,是整個金融領域的重要組成部分。面對日益龐大的金融資金交易量、日益嚴峻的網絡黑客攻擊形勢,金融機構積極轉變思維方式,并嘗試利用大數據、云計算等技術來構建防火墻,進一步提升金融交易的安全性。而居于首要位置的大數據分析技術,在風控、信貸、金融反欺詐等方便有著先天優勢。
具體來說,利用大數據技術,銀行等金融機構的工作人員可以對貸款的目標客戶進行資信評估。通過對某家企業的生產數據、電水消耗、工資水平、訂單數量、投資偏好、研發投入、產品周期等進行***的分析,評估人員能夠較為客觀地了解企業的實際運營狀況,進而決定是否放貸及放貸的金額。
值得一提的是,新技術的產生,往往伴生出新的生產方式和商用模式。大數據在金融領域的應用,不僅對原有的金融交易信息采集方式造成一定的沖擊,也促使出現新型的數據信息收集、整合和分享方式。隨著大數據健康發展,許多行業的用戶開始建立數字化云平臺,以此為企業生產、銷售等信息的統計和匯總提供便利。
咨詢機構IDC**發布的報告預測,2019年,大數據與商業分析解決方案全球市場的整體收益將達到1896.6億美元(約合人民幣13495.1億元),這一數字相比2018年增長12.1%。在2019年—2023年的預測期內,全球大數據市場相關收益將實現13.1%的復合年均增長率,并預計總收益在2023年達到3126.7億美元。
未來5年,由于政策支持以及多方技術融合,中國大數據市場將保持穩定增長。該機構預測,2019年中國大數據市場總體收益將達到96億美元,2019年—2023年預測期內的復合年均增長率為23.5%,增速高于全球平均水平。到2023年,市場規模則將增長至224.9億美元。從技術上看,大數據相關硬件在2019年中國整體大數據市場中占比**,達到45.2%;大數據相關服務支出和軟件收益的占比則分別為32.2%和22.6%。而到2023年,隨著技術的成熟與融合以及數據應用和更多場景的落地,軟件規模占比將逐漸增加,服務相關收益占比保持平穩發展的趨勢,而硬件規模在整體的占比中則逐漸減小。硬件、服務、軟件三者的比例將更為相似,逐漸趨近于各占三分之一的權重。
而從行業上看,2019年中國大數據與商業分析解決方案市場中收益前三的行業依次是金融、政府、通信,三者總和占中國市場總額的50%以上。在金融行業,大數據分析技術賦能于金融反欺詐、風控、信貸業務等業務。