“信而有征”指可驗證其言為信實,或征求、驗證信用。在美國生活了16年的顧凌云了解科技如何給美國金融業(yè)錦上添花,它們的觸角深入到全國各地,服務下沉到各行各業(yè)。帶著在美國知名金融科技公司ZestFinance和Kabbage的創(chuàng)業(yè)和工作經驗,顧凌云回到中國創(chuàng)辦冰鑒科技,他相信美國的經驗在中國同樣適用,“金融本質就是存取匯兌付,無論你在南非開普敦,中國南京,還是美國洛杉磯,任何金融機構都不能避開這五樣?!?/p>
精通金融、大數據和機器學習的計算機博士顧凌云是位對人文歷史哲學有研究的理工男。他給公司取名“冰鑒”——出自曾國藩著述的一部關于相人識人的作品《冰鑒》。在顧凌云看來,曾國藩相人識人的學問和冰鑒科技用大數據搜集小微企業(yè)方方面面的信息并對它們做出信用評估有相似之處。
今天,我們邀請到峰瑞資本互聯網金融領域早期項目負責人趙治遠(zzy@freesvc.com)和顧凌云(gu_lingyun@icekredit.com)來一場AskMeAnything。他們的話題包括美國的金融科技長什么樣、中國大數據征信的創(chuàng)業(yè)機會在哪里,以及如何提升競爭力。
顧凌云
美國金融先行者眼中的中國金融機會
趙治遠:互聯網金融火了好幾年,創(chuàng)業(yè)公司們前仆后繼。你之前是做什么的,對互聯網金融行業(yè)有哪些了解?
顧凌云:我本科在電子科技大學,后在美國卡耐基梅隆大學計算機學院獲得計算機碩士和博士學位。畢業(yè)后我去了華爾街加入半透明資本,做對沖基金中高頻交易的算法工程師。兩年多后,我作為第6名創(chuàng)始成員加入ZestFinance,從零開始搭建模型組團隊,三年里為ZestFinance開發(fā)了六代模型,也幫助它完成三輪共5400萬美元融資。離開ZestFinance后,我在Kabbage做了三四個月的首席數據科學家。Kabbage是美國一家新興的做小微企業(yè)征信和借貸的機構,估值已超過10億美金。
之后我認識了李豐并成為IDG駐場企業(yè)家(EIR),我每個月都在中美往返,在美國看機器學習相關的項目,在中國則看互聯網金融項目。
到2015年6月左右,我觀察了近兩年的中國金融市場,覺得中國征信的氛圍開始形成。我創(chuàng)立冰鑒科技,主攻小微企業(yè)征信。因為小微企業(yè)對個人股東需要征信,所以也包括了部分個人征信業(yè)務。
趙治遠:你在美國的職業(yè)經歷光鮮成功,是什么讓你下決心回國,覺得在中國做互聯網金融創(chuàng)業(yè),尤其在征信方面是有希望的?
顧凌云:先簡單說說中美金融發(fā)展的區(qū)別。在中國,我們叫互聯網金融,到底是互聯網為主金融為輔,還是互聯網作為一個形容詞來修飾金融,有很大的爭論。
但是,在美國沒有InternetFinance這種叫法,而叫Financialtechnology,簡稱Fintech。
顯而易見是把金融作為一種應用,而實際的主體掛靠在科技上。這點對我回國創(chuàng)業(yè)有很大的影響。
我在美國生活了16年,美國的金融服務體系以銀行業(yè)為主導,也有號稱“四大銀行”,花旗、大通、美國銀行和富國銀行,和中國的工農中建四大銀行類似,它們的觸角伸到了全國各地。不同的是,它們的下沉業(yè)務非常多。有數據顯示,在中國,小微企業(yè)在銀行中能夠借貸成功的批準率低于2%,相反美國富國銀行的小微企業(yè)貸款批準率超過了35%,并且壞賬率極低。
此外,美國的金融環(huán)境不限于四大國有銀行,美國還有社區(qū)銀行或村鎮(zhèn)信用社,它們的服務對象甚至包括被傳統(tǒng)銀行業(yè)排斥的人。也恰恰如此,在美國,如果初創(chuàng)公司想在商業(yè)模式為主導的金融領域取得革命性進展幾乎不可能,更多的是基于金融做技術創(chuàng)新。而在中國,傳統(tǒng)金融機構線下服務的人群或者解決方案都遠遠沒有達到令人滿意的程度,也就是說,在中國,純粹金融領域上的創(chuàng)新仍有很大空間。
這是促成我回國的一個原因,整個中國目前金融體系服務對象的寬度不夠,產品的縱深度不夠,這給了我們機會。
第二點更加重要,2008年以后,美國金融體系在收緊,而中國金融在去監(jiān)管化。在一個希望有金融和高科技創(chuàng)新的領域,去監(jiān)管化是個利好。
第三點,中國在慢慢轉型,由商業(yè)模式驅動的企業(yè)后繼乏力,以高科技為驅動的企業(yè)越來越多。且中國的知識產權保護也越來越好,讓我們這些以高科技為驅動的公司更有動力。在中國做一家以高科技為驅動,以商業(yè)模式創(chuàng)新為輔的征信企業(yè)是可行的。
趙治遠:你覺得中美互聯網金融最大的共通性是什么?
顧凌云:金融本質就是存取匯兌付,無論你在南非開普敦,中國南京,還是美國洛杉磯,任何金融機構都不能避開這五樣。
與此同時,金融作為整個社會和經濟發(fā)展最大的驅動力,社會的造血功能由它開始,所以中美兩國的金融在商業(yè)模式上差異不是特別大,發(fā)展大方向上幾乎一樣。所以我們在美國十幾年的金融經驗可以比較完整的移植到中國來。
趙治遠:也就是在美國見過了“豬是怎么跑的”,回到中國來做“風口上的豬”。
互聯網金融領域的BBC模式
趙治遠:冰鑒科技是怎么切互聯網金融的?你們的商業(yè)模式是什么?
顧凌云:用一句話來概括,冰鑒科技以大數據和機器學習算法為驅動,對小微企業(yè)和個人提供征信服務。
我們的商業(yè)模式叫做B2BC,簡稱BBC,不過和英國的BBC廣播電臺沒有半毛錢關系。我們服務金融機構,所以叫toB,再由金融機構來服務小微企業(yè)和個人借貸對象,也就是to小B和toC。
一個完整的小微企業(yè)貸款征信周期,包括對小微企業(yè)的經營數據征信,對小微企業(yè)股東征信,還有小微企業(yè)貸后數據征信。
我們直接服務的金融機構有四類,包括傳統(tǒng)意義上的銀行,P2P平臺,小貸公司以及新興的互聯網金融公司。這些B端在收到小B和C的客戶申請后,會把他們申請表的部分信息和其他信息傳給我們,但是這些信息是有限的。我們用自己的觸角往上爬取,跟其他數據源合作,展開360度數據的搜集,完成數據處理、變量提純、單一和整體模型的建立,提供從黑名單到反欺詐,再到風控的全套解決方案。
趙治遠:到目前為止,你們都服務了哪些客戶?
顧凌云:已經使用產品并付費的用戶有二三十家,包括2家上市股份制銀行,全國Top20的P2P平臺中的七八家,兩三家新興的拿到消費金融牌照的公司。和小貸公司的合作更寬,我們直接跟一個省或直轄市的小貸協(xié)會合作,他們統(tǒng)一把數據交給我們,由我們建模完后給他們批量服務。
趙治遠:中國的商業(yè)銀行對風控的要求是非常嚴的,允許一個第三方公司尤其是初創(chuàng)企業(yè)提供風控服務,是件聽上去很難做到。冰鑒用什么方式打動銀行?
顧凌云:第一,高風控意識的客戶更容易認可我們的技術和模式。在我回到中國之前,我一直非常盲目自信樂觀地認為我們第一批付費客戶應該是在技術實力上遠遠落后于我們、對風控一無所知、急切需要風控解決方案的金融機構。實際上恰恰相反,最先跟我們簽約的是16家股份制銀行中風控做的最好的前幾家。
越是風控把握得好的金融機構越容易跟我們合作,他們更清楚我們的重要性和技術優(yōu)勢在哪里,溝通成本最低。
第二點,這不是一個主觀判斷的行業(yè),而是一個完完全全靠數字說話的行業(yè)。很多金融機構會把他們歷史數據中擁有好壞標簽的關鍵信息隱去,讓我們用剩下的部分數據判斷客戶的好壞,然后客戶拿回去比對。客戶用KS、AUC、precision、recall等客觀量化指標來評估,哪家的技術最好一目了然。在很多實際測評中,我們的模型各項指標第一。
第三點,各級省市政府領導給了我們極大的背書。除了風投,我們還獲得了數量不小的地方政府的支持,對我們做上下游整合,包括數據源都提供了很大幫助。陸家嘴金融管委會從主任到工作人員對我們非常關心,我們在上海的總部已經落戶自貿區(qū),搬入陸家嘴的金融產業(yè)園。我們在常州的公司,接待過江西省四套領導班子的一把手,包括江西省委書記和省長,還有江蘇省的兩套班子,江蘇省委書記和江蘇省長。政府的背書對我們取得銀行信任并簽約提供了巨大幫助。
個人征信不過是小微企業(yè)征信的子集
趙治遠:現在中國市場上做征信的公司都有哪幾類,冰鑒科技和他們有什么區(qū)別?
顧凌云:中國如果有100家公司號稱做征信,實際上有80家公司,也就是80%都是數據的底層提供商。在我看來,這些底層數據提供商不能夠作為核心的征信機構存在,因為任何數據源的擁有者其本身都具有要尋租和變現的需求。而且很多數據源都是國有企業(yè)或和政府關聯的公司的,現在整個中國官方的數據正在連成一片,打破“孤島效應”,本來擁有特殊行政優(yōu)勢的數據源企業(yè)將喪失競爭力,數據源將變成一種commodity,各家只能以價格來取得優(yōu)勢,而不是有本質上的差異。
剩下的20家中又有80%左右即16家在做個人征信。個人模型的變量,我們叫緩變量,就是說隨著人的一生改變,變量數值不會有太大改變。比如婚姻狀況只有四種,已婚、未婚、離婚和喪偶;教育水平只有七種。而且這些信息高度相關,如果我知道你在什么地方畢業(yè),收入多少,我甚至都能判斷出你住的小區(qū)每平米多少錢,在什么類型公司擔任什么職位。所以,個人征信并不難做。
最后會變成比拼肌肉,誰資金更充足,獲得的數據更全面,愿意燒更多錢免費試用,誰就會在市場中活下來。
我們選擇小微企業(yè)征信有以下幾個原因:
第一點,小微企業(yè)征信的數據更加離散,技術門檻高。例如8萬條數據源已經能做出比較好的個人征信模型,但難以做小微企業(yè)模型,因為各行業(yè)間完全不同,數據不能整合,而且小微企業(yè)受創(chuàng)始人或股東影響非常大,如果公司負責人變了,即使完全相關的歷史數據也不能統(tǒng)一建模。所以小微企業(yè)數據天然有離散性和稀疏性,導致在數學建模過程需要更強的技術實力完成。
第二點,小微企業(yè)的數據更加豐富,我們在網上可以獲得更多跟企業(yè)相關的數據,包括宏觀經濟數據,跟產業(yè)相關的數據等等。
第三點,中國法律法規(guī)會對個人征信的監(jiān)管會越來越嚴。在美國不能使用的很多變量現在在中國都可以用,例如農村還是城市戶口,性別是男是女,年齡,種族背景等等。因為全世界金融的互通性,我相信中國的法律法規(guī)對個人征信的監(jiān)管會越來越嚴,隨著監(jiān)管的加強,個人征信的很多信息都將不能使用。但反過來,因為小微企業(yè)的信息本來就該是公開的,所以小微企業(yè)的征信監(jiān)管上要比個人松很多,這點在美國也得到了印證,這會讓我們有更多施展的舞臺。我們能使用技術能力把小微企業(yè)做為切入點,對小微企業(yè)的經營數據、股東、貸后數據進行征信,完成整個小微企業(yè)貸款的生命周期。
最后,我們做小微企業(yè)可以向下兼容個人征信,但是個人征信受技術、數據等限制,無法向上兼容來完成小微企業(yè)征信。
用一句術語來講,個人征信是小微企業(yè)征信的子集,而小微企業(yè)征信是個人征信的超集。
如果順豐也來做征信?
趙治遠:你剛提到征信完全是個靠數字說話的行業(yè),一家大數據征信公司的核心競爭力是在于數據的加工處理能力么,決定這些能力的因素有哪些?
顧凌云:一家以大數據為驅動的互聯網金融企業(yè)的核心競爭力絕不會在某個點上,至少在一個面上。這個面應該包括多個不同的點,在每一個緯度上取得至少20%以上的突破,才能稱自己是領軍性企業(yè)。
這些點包括,第一,對不同數據源的快速判斷。美國有1千多家數據源,傳統(tǒng)方法每一個數據源都要測試三到六個月,還要付費,1000多家數據源可能一輩子也測不完,還有大量的財政花費,我在ZestFinance帶領的團隊技術上能做到對大量數據源快速遴選和判斷,光這一點就贏了很多企業(yè)。
第二點,數據源確定后,你會發(fā)現很多數據源都是不完美的,就涉及到對缺失值的處理。對缺失值的處理包括很多,包括expectationmaximization,叫做EM對數據源的處理,包括GaussianMixtureModel,叫GMM對于數據源的處理,這些都對技術有很高要求。
第三,因為有些變量一個一個單獨放是沒什么用的,只有把有些變量整合在一起,才會變成指向性非常強的變量,這就是所謂的變量的整合和變量的選取。很多企業(yè)都把變量整合完做個單一模型就交差了。我們很多模型都是級聯完成的,有很強的技術、手段要求,包括如何對權重動態(tài)評估,平行級聯還是串行級聯,級聯到多少才符合要求等等。
所有這些都要取得技術突破,整合起來才能達到模型比別人好的效果。
趙治遠:你們的數據源主要有哪些?
顧凌云:很多,但我們不方便明確點出。但從宏觀上來講,對于小微企業(yè)征信,企業(yè)在互聯網上留存的經營信息、企業(yè)涉訴、知識產權、對外投資和招聘信息,輿論對企業(yè)的看法等等,我們都通過自然語言處理的方式對接。同時我們直接跟很多政府部門進行數據源對接,包括銀行交易流水信息、財務、稅務信息等等。我們在數據源上的廣度和深度已經處出于領先地位。
對于個人征信,我們會通過社交記錄,電商存留記錄,出行記錄,法院涉訴信息等對一個人做360度的數據搜集。
我們的經驗和模型表明,社交數據對個人征信幾乎不管用。
我在ZestFinance就職期間曾跟Facebook和LinkedIn合作,進入中國市場以后,我們經過大量的數據統(tǒng)計建模和分析,得到了這個我們認為比較接近于真理的真相,做個人征信的公司不妨花時間在其他數據源上。
趙治遠:冰鑒科技也幫助峰瑞資本的已投公司什馬金融繪制了農民畫像,你們是怎樣在農民信用數據和社交數據匱乏的情況下進行信用分析的?
顧凌云:很多企業(yè)都依賴借貸方提供的數據才能建模,對人行征信報告看得也比較重。但是首先,廣大農民普遍缺乏人行征信報告記錄;即使有,報告中的數據也很蒼白。我們就通過農村天地當中已經存在的信息對農民的信用進行評估,比如他們使用智能手機的信息和惠農卡的數據。
趙治遠:國內的征信市場會如何發(fā)展,什么樣的公司最有可能走出來?
顧凌云:在美國互聯網征信其實比較容易做,美國有FICO和3大征信局,FICO不收集數據,只做征信,而三大征信局只搜集數據,不做征信。所以二者合作得非常好,井水不犯河水,三家征信局把數據給到FICO,FICO收取模型費用跑數據,再把結果返還給三大征信局,三大征信局來面對整個市場。
但是在中國,企業(yè)都希望能貫穿前后端,任何一家征信公司都想把數據源也做了,做數據源的公司也希望能向上做征信。
所以在中國不可能有只做數據或征信的情況,一定會變成一個大型的托拉斯。
我認為中國首先會在各個場景中出現征信公司,比如擁有快遞的順豐能做一家征信公司,電商的京東、阿里各做一家,也許社交的騰訊一家。不過它們向其他領域擴展會很困難,數據互通也有難度。
我們相信在這些場景征信之上一定會誕生五到八家跨場景、透明中立的第三方征信機構存在。冰鑒的目標就是成為其中一家。
對中美互聯網金融和機器學習有深入理解的同時,顧凌云還曾是全國首屆大專辯論賽全國唯一最佳辯手,他在人文歷史哲學方面有很深的積累,冰鑒的命名就是一例。峰瑞資本期待與這種對行業(yè)有深入了解,同時有良好視野和廣大格局的創(chuàng)業(yè)者合作?!w治遠
文章內容轉載自峰瑞資本
版權及免責聲明:凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業(yè)經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀
版權所有:中國產業(yè)經濟信息網京ICP備11041399號-2京公網安備11010502003583