Question 1

コンテキスト暗号化は、LLMが有用な応答を生成することを可能にしつつ、機密データをどのように保護するのでしょうか？

Accepted Answer

MicrocosmWorksは、LLMが意味のある情報検索と生成のために必要とする周囲のセマンティックコンテキストを保持しつつ、ドキュメントがvector databaseに入る前に、名前、口座番号、健康データなどの機密性の高いエンティティを特定して暗号化する選択的暗号化パイプラインを開発しました。クエリ時において、システムは要求しているユーザーのアクセスレベルに限定された、応答に必要な特定のエンティティのみを復号化するため、LLMは公開が許可されていない生の機密データを決して見ることはありません。

Question 2

ベクトルデータベースにおいてデータを暗号化することは、セマンティック検索の類似性を損ないますか？また、それをどのように回避しますか？

Accepted Answer

MicrocosmWorksは、元の暗号化されていないテキスト上でembeddingsを計算しながら、機密性の高いエンティティをトークンレベルで暗号化し、その暗号化されたテキストをセマンティックベクトルとともにベクトルデータベースに保存することで、この問題を解決しました。これにより、検索は高品質のembeddingsを用いてセマンティックに関連性の高いチャンクを取得し、decryption layerは認証されたユーザーにのみ元のコンテンツを再構築します。結果として、data at restを保護しながらも、検索品質を完全に維持することが可能となります。

Question 3

LLMパイプライン向けコンテキスト暗号化は、どのようなコンプライアンスフレームワークの要件を満たすのに役立ちますか？

Accepted Answer

MicrocosmWorksは、個人識別情報と保護医療情報がベクターストアで保存時に暗号化され、認可されたクエリ処理中のみメモリ内で復号化されることを保証することで、HIPAA、SOC 2、GDPR、およびCCPAにおける特定の要件に対応するために、コンテキスト暗号化アプローチを設計しました。このシステムは、すべての復号化イベントの改ざん防止監査ログを生成し、これはこれらのコンプライアンスフレームワークに共通するアクセス監視と説明責任の要件を満たします。

Question 4

コンテキスト暗号化は、ドキュメントコーパス全体を再インデックス化せずに、既存のRAGパイプラインに後付けできますか？

Accepted Answer

MicrocosmWorksは、既存のベクターデータベースコレクションを段階的に処理し、保存されているドキュメントチャンク内の機密エンティティを暗号化しながら、そのベクター埋め込みを保持する移行ユーティリティを構築しました。そのため、コーパス全体の埋め込みを再計算する必要はありません。この移行は一時停止および再開が可能なバックグラウンドプロセスとして実行され、移行期間中はクエリパイプラインが暗号化されたチャンクと未移行のチャンクの両方をシームレスに処理します。

Question 5

RAGクエリのレイテンシに対するコンテキスト暗号化のパフォーマンスのオーバーヘッドはどれくらいですか？

Accepted Answer

MicrocosmWorksは暗号化および復号化の操作を最適化しました。これにより、クエリあたり約15-30msのオーバーヘッドが追加されますが、これは一般的なLLMの生成時間である500ms〜2sと比較すると無視できるレベルです。取り込み時のエンティティ検出と暗号化は、ドキュメントチャンクあたり約100msを追加しますが、取り込みは通常バッチプロセスであるため、これも最小限です。システムは、ハードウェアアクセラレーションされたAES操作を使用し、復号化キーをメモリにキャッシュすることで、暗号化のオーバーヘッドを最小限に抑えています。

LLMとベクトルデータベースパイプラインのためのコンテキストに応じた暗号化

課題

私たちのソリューション

アーキテクチャ

コンテキストに応じた暗号化戦略

データ分類

暗号化レイヤー

ベクトルデータベースのセキュリティ

コレクション設計

鍵管理とローテーション

鍵階層

鍵ローテーションプロセス

監査とコンプライアンス

復号化監査ログ

GDPR消去権

主要機能

成果

技術スタック

caseStudyDetail.more ケーススタディ

Kickly: AIを活用したスタートアップ向けプロジェクトプラットフォーム

AIを活用したOCRによる請求書処理とQuickBooks連携

よくある質問

ビジネスの変革の準備はできていますか？

SCTE-35マーカー解析とマルチプラットフォームプレイヤー統合によるクライアントサイド広告挿入 (CSAI)