Enkripsi Kontekstual untuk LLM dan Saluran Paip Pangkalan Data Vektor
Platform AI perusahaan memerlukan ciri-ciri berkuasa LLM (sembang, carian, analisis dokumen) sambil memastikan data sensitif โ PII, rekod kewangan, maklumat penjagaan kesihatan โ kekal disulitkan sepanjang saluran paip, termasuk apabila disimpan sebagai pembenaman vektor dalam pangkalan data vektor.
Bincangkan Projek Anda
Cabaran
Penggunaan LLM dan pangkalan data vektor dengan data sensitif memperkenalkan risiko keselamatan baharu:
- Serangan Pembalikan Pembenaman โ Penyelidikan menunjukkan bahawa pembenaman vektor boleh direka bentuk semula untuk membina semula teks asal, mendedahkan PII yang disimpan dalam DB vektor
- Kebocoran Konteks LLM โ Data sensitif yang dihantar kepada LLM boleh muncul dalam respons kepada pengguna lain jika tidak diasingkan dengan betul
- Keperluan Pematuhan โ GDPR, HIPAA, dan SOC2 menuntut penyulitan pada penyimpanan (at rest) dan semasa penghantaran (in transit), tetapi pangkalan data vektor menyimpan representasi matematik, bukan medan teks tradisional
- Fungsi Carian โ Menyulitkan teks sebelum pembenaman memusnahkan makna semantik, menjadikan carian kesamaan tidak berguna
- Pengurusan Kunci โ Kunci penyulitan setiap penyewa memerlukan putaran tanpa pembenaman semula keseluruhan set data
- Jejak Audit โ Setiap akses kepada data sensitif yang dinyahsulit perlu dicatat untuk pematuhan
Penyelesaian Kami
Kami melaksanakan seni bina penyulitan kontekstual yang secara selektif menyulitkan medan sensitif sebelum penyimpanan sambil memelihara kebolehpaparan semantik melalui pendekatan berlapis โ menyulitkan PII dalam metadata sambil mengekalkan kandungan bersih yang tidak sensitif tersedia untuk pembenaman.
Seni Bina
- Enjin Penyulitan: AES-256-GCM dengan kunci penyulitan setiap penyewa
- Pengurusan Kunci: AWS KMS untuk penjanaan kunci, putaran, dan kawalan akses
- Pengesanan PII: Pengelas PII berasaskan NER (Named Entity Recognition)
- Pangkalan Data Vektor: Milvus untuk carian kesamaan pada pembenaman bersih
- Lapisan LLM: Konteks bersih dihantar kepada LLM, medan sensitif disuntik semula selepas penjanaan
- Sistem Audit: Setiap peristiwa penyahsulitan dicatat dengan pengguna, cap masa, dan tujuan
- Pangkalan Data: PostgreSQL untuk metadata yang disulitkan
Strategi Enkripsi Kontekstual
Klasifikasi Data
Sebelum sebarang data memasuki saluran paip, pengelas PII mengkategorikan setiap medan mengikut tahap sensitiviti:
- Sangat Sensitif (cth., ID kerajaan, nombor akaun kewangan, ID perubatan) โ Disulitkan, tidak pernah dibenamkan, tidak pernah dihantar kepada LLM
- PII Sensitif (cth., nama penuh, alamat e-mel, nombor telefon) โ Disulitkan semasa penyimpanan (at rest), diganti dengan penanda tempat (placeholder) sebelum pembenaman
- Kontekstual (cth., jawatan, nama syarikat) โ Disulitkan semasa penyimpanan (at rest), tersedia untuk pembenaman dengan persetujuan
- Tidak Sensitif (cth., penerangan produk, maklumat awam) โ Disimpan dan dibenamkan seperti sedia ada
Lapisan Enkripsi
Lapisan 1: Enkripsi Tahap Medan semasa PenyimpananMedan sensitif disulitkan dengan AES-256-GCM sebelum penyimpanan. Setiap penyewa mendapat kunci penyulitan data (DEK) khusus yang diuruskan melalui hierarki kunci via AWS KMS. Medan bayangan menyimpan hash yang boleh dicari untuk carian padanan tepat tanpa memerlukan penyahsulitan.
Lapisan 2: Pembersihan Sebelum PembenamanPII dikesan dan digantikan dengan penanda tempat yang mengekalkan jenis sebelum teks dihantar ke model pembenaman. Ini mengekalkan makna semantik untuk carian kesamaan sambil membuang maklumat yang boleh dikenal pasti. Pemetaan asal-ke-penanda tempat disimpan disulitkan bersama rekod vektor.
Lapisan 3: Suntikan Konteks Selepas Penjanaan LLMLLM menerima konteks yang telah dibersihkan dengan penanda tempat untuk menjana respons. Selepas penjanaan, sistem menyuntik semula nilai sebenar daripada penyimpanan yang disulitkan ke dalam respons. Ini menghalang data sensitif daripada memasuki data latihan LLM atau disimpan dalam cache oleh pembekal.
Keselamatan Pangkalan Data Vektor
Reka Bentuk Koleksi
Koleksi vektor menyimpan pembenaman bersih bersama metadata asal yang disulitkan. Pengasingan penyewa dikuatkuasakan melalui kunci partition, dengan metadata setiap penyewa disulitkan menggunakan kunci mereka sendiri. Lapisan API mengesahkan pemilikan penyewa sebelum sebarang operasi penyahsulitan.
Pengurusan & Putaran Kunci
Hierarki Kunci
Hierarki kunci berbilang peringkat digunakan: kunci induk dalam AWS KMS menyelubungi kunci penyulitan kunci setiap penyewa, yang seterusnya menyelubungi kunci penyulitan data setiap penyewa yang digunakan untuk penyulitan tahap medan. Ini membolehkan putaran kunci yang cekap tanpa menyulitkan semula keseluruhan rantai kunci.
Proses Putaran Kunci
- DEK Baharu Dijana โ Kunci penyulitan data baharu dicipta di bawah kunci penyulitan kunci sedia ada
- Penulisan Baharu โ Semua data baharu disulitkan dengan kunci baharu; kunci lama kekal sah untuk pembacaan
- Penyulitan Semula Latar Belakang โ Kerja kelompok menyulitkan semula rekod sedia ada dengan kunci baharu
- Penamatan DEK Lama โ Setelah semua rekod dipindahkan, kunci lama ditandakan tidak aktif
- Log Audit โ Peristiwa putaran dicatat dengan cap masa dan bilangan rekod yang terjejas
Audit & Pematuhan
Log Audit Penyahsulitan
Setiap peristiwa penyahsulitan merekodkan siapa yang memintanya, apa yang dinyahsulitkan, bila, mengapa (konteks permintaan), dan kunci mana yang digunakan โ menyediakan jejak pematuhan yang lengkap.
Hak GDPR untuk Dipadamkan
Sistem ini menyokong penghapusan data penuh merentasi kedua-dua pangkalan data hubungan dan pangkalan data vektor, dengan putaran kunci pilihan untuk memastikan tiada akses sisa secara kriptografi. Semua operasi penghapusan dicatat dalam jejak audit GDPR.
Ciri-ciri Utama
- Enkripsi Tahap Medan โ AES-256-GCM pada medan sensitif, bukan keseluruhan rekod
- Pembersihan PII โ Penanda tempat mengekalkan makna semantik untuk pembenaman
- Penyuntikan Semula Pasca-LLM โ Data sensitif tidak pernah dihantar kepada pembekal LLM
- Kunci Setiap Penyewa โ Kunci penyulitan terasing dengan pengurusan AWS KMS
- Putaran Kunci โ Putaran tanpa henti dengan penyulitan semula latar belakang
- Keselamatan Pembenaman โ Pembenaman bersih mencegah serangan pembalikan pada PII
- Jejak Audit โ Setiap penyahsulitan dicatat untuk pelaporan pematuhan
- Pematuhan GDPR โ Pemadaman automatik merentasi stor yang disulitkan dan DB vektor
Keputusan
Timbunan Teknologi
caseStudyDetail.more Kajian Kes
Terokai lebih banyak pelaksanaan teknikal kami
Pemprosesan Invois Berkuasa AI dengan OCR dan Integrasi QuickBooks
Sebuah perniagaan bersaiz sederhana yang memproses ratusan invois vendor setiap bulan perlu menghapuskan kemasukan data manual dengan mengekstrak data invois secara automatik menggunakan AI/OCR dan menyegerakkannya terus ke dalam QuickBooks untuk tujuan simpan kira dan penjejakan pembayaran.
Penyisipan Iklan Sisi Klien (CSAI) dengan Penghuraian Penanda SCTE-35 & Integrasi Pemain Berbilang Platform
Sebuah platform penstriman video perlu melaksanakan Client-Side Ad Insertion (CSAI) merentasi aplikasi web, mudah alih, dan TV bersambung โ membolehkan pengalaman iklan yang diperibadikan pada peringkat peranti dengan sokongan interaksi iklan penuh (lapisan tindanan boleh klik, sepanduk pendamping, butang langkau) yang tidak dapat disediakan oleh penyisipan sisi pelayan.
Bersedia untuk Mentransformasi Perniagaan Anda?
Mari bincangkan bagaimana kami boleh mengaplikasikan penyelesaian serupa untuk cabaran anda.