侵權投訴
訂閱
糾錯
加入自媒體

聯邦學習: 統一數據協作和隱私保護的技術解決之道

實際案例講解

通過上面的介紹,我們發(fā)現聯邦學習在以下幾個場景下非常有幫助:? 數據總量不夠? 樣品不夠充分? 數據維度不夠多? 數據隱私/核心價值保護

聯邦學習的優(yōu)點是整個學習訓練過程,沒有傳輸任何原始數據。那么聯邦學可以具體應用在哪些場景中呢?以下兩個案例希望能幫你更好的理解聯邦學習的實際應用。

案例一:醫(yī)療數據聯邦建模。A, B, C 代表三家地方醫(yī)院,各自擁有疾病的診斷數據和診斷結果,但由于病人數目的限制, A, B, C本身的數據大小有限,單獨建立的模型效果不佳;

如果將A, B, C數據的聯合建模,使得模型樣本更加充足。極大的提高疾病預測的準確度,使得智能基本輔助診斷成為可能。

案例二:個人信用風險評估項目。當前金融信貸業(yè)務中往往受限于數據不夠豐富,在數據可解釋性及穩(wěn)定性、風控模型效果、風險策略和獲客成本等層面面臨諸多挑戰(zhàn),借助聯邦建模可以在保護用戶信息不泄露的前提下將來自通信運營商/支付機構等更多維度納入聯合風控模型中,從而構建更精準大數據風控模型用以測算借款自然人。

A是地方性銀行,經營信貸業(yè)務,擁有完整的欺詐標簽和用戶存貸款/部分信用卡消費信息;B是通信運營商/支付機構,擁有相同用戶的定位,網絡瀏覽等信息,能夠在不同維度捕捉用戶特征。聯邦學習可以聚合不同維度的特征在加密的狀態(tài)下聯合建模,從而提高模型的預測能力和穩(wěn)定性,打擊不法欺詐行為。

根據我們已有的實踐效果,發(fā)現經過聯合分析后可實現:? 評分卡模型交叉多方數據,增加模型入模變量,模型 AUC 提升近 3%;? 提升客戶風險定價能力,輔助風險策略額外挖掘 2% 產品目標人群;

總結

聯邦學習是為了解決跨設備、跨機構間的數據融合問題,無論是從隱私安全還是從保證數據格式統一層面,標準的制定對聯邦學習的大規(guī)模落地具備重要意義。

從目前整個數據產業(yè)看,聯邦學習可以增加可用數據的總量,能很好的解決現存數據孤島的問題;對企業(yè)自身而言,使用聯邦學習能簡單、合法且低成本的獲取外部有效的數據信息,快速解決某些因數據量或數據維度不足而導致的困擾,而且也不會造成合作企業(yè)間數據或商業(yè)機密的泄露。

規(guī)范數據使用可以在匯聚更多數據的基礎上迎來數據價值挖掘的下一個爆發(fā)點,帶動 AI 的數據基礎設施進步,隱私計算未來會逐步成為 AI 的基礎設施。

現階段要用到聯邦學習的場景需求是很多的,但大規(guī)模落地還未到來,除了以上提到的政策和標準待完善的問題,還有就是對工程師的技能要求很高,例如使用聯邦學習做隱私建模等技術需要更多的知識普及和經驗積累,但隨著市場需求和技術解決方案的逐步清晰,相信越來越多的企業(yè)參與其中,聯邦學習助力數據流動,讓數據孤島聯結成網,推動人工智能的進一步發(fā)展。

互動交流

Q: 根據您工作經驗,應用聯邦學習的最佳應用場景有哪些?除了隱私數據挖掘以外,還有哪些?您認為目前在實際中應用聯邦學習最大的障礙是什么?缺乏高效的學習模型還是缺乏有利的infra 支持,比如移動端計算資源和網絡通信速率的限制。A: 最佳應用場景包括 1: 缺樣本,需要多方一起補充 2: 缺特征,需要多方補齊。最大的障礙是效率,不僅僅是網絡,也包括算力,需要工程和密碼的共同優(yōu)化。

Q: 多方安全計算和聯邦學習的性能問題沒有提及,這塊會是應用受限的主要困難嗎?A: 在落地的過程中,性能是非常重要的一個限制,這里的性能包括算力,網絡通訊量,qps等,在相同安全性的前提下,提升性能也是我們重點優(yōu)化對象。


<上一頁  1  2  3  4  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    安防 獵頭職位 更多
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號