數(shù)據庫管理(lǐ)人(rén)員(yuán)通(tōng)常★∏≥↔在保證安全和(hé)隐私方面承擔重要(yào)♣© 責任,因此需要(yào)采用(yòng)↕§₩可(kě)以降低(dī)風(fēng)險并幫助π₹§ 确保合規性的(de)一(yī)些(xiē)技(jì)術(shù$®)。

1.加密

提高(gāo)數(shù)據庫安全性最簡單的(de)解決辦  ×法就(jiù)是(shì)加密。現(xiàn)代加密算  ♣Ω(suàn)法采用(yòng)密鑰鎖定數(shù)據,因₩​₹此隻有(yǒu)擁有(yǒu)密鑰的(de)人(÷₹rén)員(yuán)才能(néng)讀(dú)§ €取數(shù)據。許多(duō)數(shù)據庫可(kě)以使用∑±(yòng)AES等标準加密數(shù)據。這(zhè)些(xiē)解決方±‍案能(néng)夠防止硬件(jiàn)丢失而造成的(×Ω♥←de)數(shù)據洩露。如(rú)果沒☆• φ有(yǒu)正确的(de)加密密鑰,數(shù)據将會δ☆ λ(huì)保持安全。

但(dàn)是(shì)如(rú)果網絡攻擊者能(néng)夠潛←®入的(de)話(huà),采用(yòng)對(duì)✘π稱加密算(suàn)法可(kě)以保護運行(xíλ€↕ng)中的(de)計(jì)算(suàn)機(jī)的(§₽de)方法是(shì)比較有(yǒu)限的(de)。網絡攻擊者可(kě) ∞₽以找到(dào)允許數(shù)據庫處理(lǐ)合法操作(zuò ♠)的(de)相(xiàng)同密鑰。許多(duō)數(β₽↓ shù)據庫提供了(le)對(duì)“靜(λ jìng)止”信息進行(xíng)加密的(de)選項。例如(rú),©π©λOracle公司将其選項稱為(wèi)“透明(míng)數(shù)據加™φ≤密”。

2.差異隐私

這(zhè)種技(jì)術(shù)以不(bù)同的(de)方式部署數™↔(shù)學。它并沒有(yǒu)将信息鎖定在數(shù)字保 ₩‍險箱中,而是(shì)添加了(le)精心調整的(de)噪音(yīn)量,以↕☆©使其難以确定哪個(gè)記錄對(duì)應于特定的(de)人(rén)員∞ ∏↑(yuán)。如(rú)果噪聲添加正确,它不(bù)會(huì)扭曲一(yī∞ββ)些(xiē)統計(jì)數(shù)據,例如∏  ₹(rú)平均值。如(rú)果從(cóng)數(shù)據δ♠'≤集中的(de)年(nián)齡中随機(jī)增加或減少(shǎ≠∑Ωo)幾年(nián),其平均年(nián)齡将保持不(b↓™¶αù)變,但(dàn)網絡攻擊者可(kě)∏←♠ε能(néng)很(hěn)難按照(zhào)年(niε₩♣án)齡找到(dào)某個(gè)人(rén)。

其解決方案的(de)效用(yòng)各不(bù)相(xiàng)同。最好¶©≈(hǎo)将數(shù)據集發布給想要(•§β yào)研究數(shù)據但(dàn)不(bù)受信任的(de)合作(zuò)©">夥伴,通(tōng)常是(shì)通(tōng)過計(jì)算(suàn)平均"∏&值和(hé)集群大(dà)小(xiǎo)。∞←λ許多(duō)算(suàn)法在添加噪聲方面做(zuò)得±∏(de)很(hěn)好(hǎo),不(bù)會(hu↑ ì)扭曲收集的(de)統計(jì)數(shù)據。了(le)解哪↕¥≠↓些(xiē)機(jī)器(qì)學習(xí)算(suà∞$≠→n)法可(kě)以很(hěn)好(hǎo)地(dì)處理(lǐ)失真位是(sβ​₹ hì)一(yī)個(gè)比較活躍的(de)研究領域£ε'。

微(wēi)軟公司和(hé)谷歌(gē)公司提供了(le)∞∑δ∞将這(zhè)些(xiē)算(suàn)法與數(shù)€÷據存儲和(hé)機(jī)器(qì)學習(xí)算(su£→àn)法集成的(de)工(gōng)具。例•>≤如(rú),谷歌(gē)公司的(de)Privac♥φy On Beam将噪聲添加機(jī)制(zhì)與Apache¶ © Beam管道(dào)處理(lǐ)相(xiàng)結合。

3.哈希函數(shù)

哈希函數(shù)有(yǒu)時(shí)稱為(wèi)“消息驗證碼”或✔'Ωε“單向函數(shù)”,就(jiù)是(sh &✘₩ì)将大(dà)文(wén)件(jiàn)轉換為(₩←★wèi)較小(xiǎo)的(de)數(shù)字,這(zhè)使得(d☆•e)它們實際上(shàng)無法逆轉。給定一(yī)σ≥個(gè)特定的(de)結果或代碼,找到(dào)将生(sh☆®∏€ēng)成該特定代碼的(de)文(wén)件(jià'↑n)将花(huā)費(fèi)太長(cháng)時(shí)間‍ε(jiān)。

這(zhè)些(xiē)功能(néng)是(shì)σ≈£區(qū)塊鏈的(de)重要(yào)組成部分(fēn),區(qū£ φ​)塊鏈以跟蹤和(hé)識别篡改的(de)方式将其應用(yòΩ'≈←ng)于數(shù)據的(de)所有(yǒ€★•u)更改。它們防止了(le)加密貨币交易中的(de)欺詐行(xíng↔∞®)為(wèi),許多(duō)企業(yè)正在将σ£→♦這(zhè)些(xiē)技(jì)術(shù)應用(yòng)于其他(tφ≈δā)需要(yào)保證數(shù)據一(yī)緻性的(deφ≈β‍)數(shù)據庫。添加這(zhè)些(xiē)功能£×♦™(néng)可(kě)以幫助解決合規性難題。

美(měi)國(guó)國(guó)家(jiā±₩§↑)标準與技(jì)術(shù)研究院(NISTπ∑÷≥)的(de)安全散列算(suàn)法(SHA)是(sh↓÷§ì)廣泛使用(yòng)的(de)标準集合。一(&φyī)些(xiē)早期版本(如(rú)SHA-0和(hé)SHA≈₩÷±-1)具有(yǒu)已知(zhī)的(de)弱點,但 ↓ α(dàn)新版本(如(rú)SHA-2和(hé)SHA-3)被認為(wè✔∞i)非常安全。

4.數(shù)字簽名

像RSA或DSA這(zhè)樣的(de)數(s☆↑hù)字簽名算(suàn)法是(shì)更複雜(z♥$πá)的(de)計(jì)算(suàn)方法,它将散列函數(shù)  δ的(de)篡改檢測特性與認證信息的(de)特∑"定個(gè)人(rén)或機(jī)構相(xiàng)結合。他(tā)們依賴↔ 隻有(yǒu)責任方知(zhī)道(dào)的(de)秘密密鑰。例如(rú→★),加密貨币将财富的(de)所有(yǒu)權與知∑‍ε☆(zhī)道(dào)正确密鑰的(de)人(rén)員(yuán)聯>α★♥系起來(lái)。跟蹤個(gè)人(rén)責任的(de₽§)數(shù)據庫可(kě)以包括驗證特定交易的(de)數(sh₩♥×ù)字簽名。

5.SNARK

簡潔的(de)非交互式知(zhī)識證明(míng) (SNARKσ→₽) 是(shì)一(yī)種更複雜(zá)的(de)數(shù)字簽名版±✘<£本,可(kě)以證明(míng)複雜(zá)δ≤的(de)個(gè)人(rén)信息而不(bù)會(huì)洩露信息。這(≈×βzhè)種技(jì)巧依賴于更複雜(zá)的(de)數(←↓shù)學,有(yǒu)時(shí)被稱為(wèi)“零知(zhī)識≥∑ 證明(míng)”(ZKP)。

包含SNARK和(hé)其他(tā)類似證明(míng)的(deλ ✘)數(shù)據庫可(kě)以保護用(yòng)戶的(de)隐私,‌$♣"同時(shí)确保他(tā)們遵守隐私法規。例如(♠>rú),一(yī)個(gè)非常簡單的(₹®de)例子(zǐ)可(kě)能(néng)是(shì)一(yī)種數(÷♦δ•shù)字駕駛執照(zhào),它可(kě)以證明(mí•σng)某人(rén)是(shì)成年(nián)人(rén)但(dàn)± 不(bù)會(huì)透露出生(shēng)日(★€☆rì)期。還(hái)一(yī)些(xiē)人(rén)正在探索将該技(j♠• ≠ì)術(shù)應用(yòng)于疫苗護照(zhào)。

SNARK 和(hé)其他(tā)非交互式證↓→明(míng)是(shì)一(yī)種活躍的(de)研究領域。使用(y§×òng)各種編程語言的(de)數(shù)十種算(suàn¶÷>")法實現(xiàn)為(wèi)新項目奠定了(le)良好λ÷≈(hǎo)的(de)基礎。

6.同态加密

處理(lǐ)使用(yòng)傳統加密算(s∞™↔¥uàn)法鎖定的(de)數(shù)據的(de)唯一(yī)σβ方法是(shì)對(duì)其進行(xíng)解密'< ,這(zhè)個(gè)過程可(kě)能(néng)将>≠™其暴露給有(yǒu)權訪問(wèn)計(jì)算(suàn)機(jī)進行(x≤ ±‌íng)工(gōng)作(zuò)的(de)任何人(rén)。同态加密算( §αsuàn)法被設計(jì)成可(kě)以在不(bù)解讀(dú)加密>"ש信息的(de)情況下(xià)對(duì)加密信息進行(x♥↑íng)計(jì)算(suàn)。最簡單的(de&✘♣)算(suàn)法允許進行(xíng)一(yī)次算(suàn)術(shù)運  算(suàn),例如(rú)将兩個(gè)加密數&∑↓(shù)字相(xiàng)加。而更複雜(zá)的(d€αe)算(suàn)法可(kě)以進行(xíng)任意計'♦↔(jì)算(suàn),但(dàn)其速β>♥度通(tōng)常要(yào)慢(màn)得(de)多(duō)。而為'♠(wèi)特定問(wèn)題尋找最有(yǒu)效的(de)方δ>≈法是(shì)一(yī)個(gè)活躍的(de)研究€σ 領域。

作(zuò)為(wèi)該領域研究的(de)先驅之一(yī),IBM公司發布α 了(le)一(yī)個(gè)工(gōng)具包,用( ελβyòng)于将其同态加密與适用(yòng)于 iOS和(h ♦♦é)MacOS的(de)應用(yòng)程序集成。

7.聯合處理(lǐ)

一(yī)些(xiē)開(kāi)發人(rén)員(yuán)将他(tā)們÷♥的(de)數(shù)據集拆分(fēn)成更小≈©★(xiǎo)的(de)部分(fēn),然後将它們分(& >↔fēn)發到(dào)許多(duō)獨立運行(xíng)的(de)計(jìδγ✔≈)算(suàn)機(jī)。有(yǒu)時(shí)這(zhè)些∞≤(xiē)數(shù)據會(huì)被打亂,因此無<♠法預測哪台計(jì)算(suàn)機(jī)将保存哪條記錄。≤<這(zhè)些(xiē)解決方案通(tōng)常δγ<建立在軟件(jiàn)包之上(shàng),這(zhè)些(xiē)軟 ™≠£件(jiàn)包旨在通(tōng)過并行(xíng)運行(∞↔σ↕xíng)搜索或分(fēn)析算(suàn)法來 ±(lái)加速處理(lǐ)所謂的(de)大(dà)數(shù)據。最初λ★的(de)目的(de)是(shì)提高(gāo)速度,而增‍÷¶₹加對(duì)網絡攻擊彈性可(kě)能(néng)♥&是(shì)一(yī)個(gè)附加作(zuò)用(yòng)。™♥&♣

8.全分(fēn)布式數(shù)據庫

如(rú)果将一(yī)個(gè)數(shù)據集拆分☆©(fēn)成幾塊可(kě)以保護隐私,為(wèi)什(shén)麽不≥ ​‍(bù)将它拆分(fēn)成更多(duō)塊呢(ne)?更常見(jiàn←÷)的(de)解決方案是(shì)将數(shù)φ∞✘≈據直接存儲在創建和(hé)使用(yòng)的(de)位置。用(yòn©© λg)戶的(de)智能(néng)手機(jī)通(tōng)常★∞具有(yǒu)大(dà)量額外(wài)的(de)‌δ計(jì)算(suàn)能(néng)力和(hé)存儲Ωπ空(kōng)間(jiān)。如(rú)果不(bù)需要(yào)集δ‍中分(fēn)析和(hé)處理(lǐ),那(nà)麽避免将數(shù)據傳送±♥到(dào)雲平台中的(de)服務器(qì)将會(hu×♠‌ì)更快(kuài)、更具成本效益。

例如(rú),許多(duō)浏覽器(qì)支♠₹'持複雜(zá)數(shù)據結構的(de)本地(dì)存儲。W3C标準包♣ ≈‌括用(yòng)于具有(yǒu)鍵和(hé)值的(de)文(wén)→♥Ω"檔樣式模型的(de)本地(dì)存儲以及用(<σyòng)于更多(duō)關系模型的(de)索引版本。

9.合成數(shù)據

一(yī)些(xiē)研究人(rén)員(yuán)正在創♦↔建完全合成的(de)數(shù)據集,這(zhè)&←♥些(xiē)數(shù)據集是(shì)通(tōn®σπ<g)過随機(jī)生(shēng)成新的(de)值來(lái)構建的(de),♠δ但(dàn)其方式遵循相(xiàng)同的(de)模式,并且在統計(jì)上♥ (shàng)基本相(xiàng)同。例如(♦≤÷€rú),一(yī)個(gè)名為(wèi)RTI的(de)研究智囊團創建∏£了(le)2010年(nián)美(měi)國(guó)人(rén)‌©¶口普查數(shù)據的(de)一(yī)個(gè)版本,其中包含•★$了(le)居住在随機(jī)地(dì)址的(de)人(ré≤§n)員(yuán)。而這(zhè)些(x™'iē)人(rén)完全是(shì)虛構的(σ≈de),但(dàn)是(shì)他(tā)們的(de)家(✔Ω​✘jiā)庭住址和(hé)個(gè)人(rén)信息被選擇為(§♦wèi)與真實值具有(yǒu)相(xiàng)同的©€β✘(de)基本統計(jì)特征。而在許多(duō)情況下(xià),研究人( δrén)員(yuán)可(kě)以測試算(suàn)法γ♦$并生(shēng)成與處理(lǐ)真實數(shù)據一(yī)樣精确的(± γde)解決方案。

10.中間(jiān)人(rén)和(hé)代理(lǐ)人( ♦₽rén)

一(yī)些(xiē)研究人(rén)員(yuán)↔↓↑正在構建限制(zhì)數(shù)據收集的(dΩδ"e)工(gōng)具,并在存儲數(shù)據之前對(duì)數(s  hù)據進行(xíng)預處理(lǐ)。例如(rú),Mozilla公"§σ§司的(de)Rally追蹤那(nà)些(xiē)希望研究互聯網信息流的(d₽₩®e)研究人(rén)員(yuán)的(deσδ )浏覽習(xí)慣。它會(huì)在調查期間(jiān)安裝一(yī)個($↔∑gè)特殊的(de)附加組件(jiàn),然後在調查結束時(shí)将其删除。®β≠該工(gōng)具将關系形式化(huà)并強制(z∞λhì)執行(xíng)有(yǒu)關收集和(hé)聚合的(de)規則。♥≥

11.無數(shù)據

無狀态計(jì)算(suàn)是(shì)大(dà)部分(fēn'¶​)網絡的(de)基礎,許多(duō)提高(gāo)效☆‍≥∏率的(de)驅動程序在以盡可(kě)能(néng)少(shǎo)的(d©∞•e)記錄保存方式重新構想工(gōng)作(zuò)時(∑↑shí)取得(de)了(le)成功。在某些(xiē)極端情況下(xià♠±€),當合規性成為(wèi)可(kě)能(néng)并且用(yòng)戶願意♦↑←&接受較少(shǎo)個(gè)性化(huà₽™γλ)的(de)服務時(shí),删除數(shù)$λ據庫可(kě)以最大(dà)限度地(dì)∑™保護隐私。