Foxit Smart Redact
安全性概觀

Foxit Smart Redact 是由 Foxit 提供的 AI 技術輔助工具,可以自動偵測和移除姓名、地址和 ID 等敏感資料。它可以協助使用者高效安全地完成校訂工作流程,保護敏感資訊免受未經授權的存取,並遵循全球資料隱私權法規。Foxit 透過端對端加密傳輸、對敏感資訊的加密儲存、高層資料中心和謹慎的資料保留原則來優先考慮資料安全性。此外,其開發流程遵循安全性開發生命週期 (SDL)。這種多層方法為個人和企業提供了一種高效、安全的敏感資料探索和校訂解決方案。

關於 Foxit Smart Redact

Foxit Smart Redact 利用經過訓練的 AI 模型來遵循全球資料隱私權法規 (例如 GDPR、HIPAA),從而能夠智慧識別敏感資訊。它使用最佳化工作流程來提高校訂速度和準確性。此外,它還提供面向企業的解決方案,協助企業和組織大規模偵測和校訂文件中的敏感資訊。
Foxit Smart Redact 包括

  • PDF 編輯器的 Smart Redact Plugin,內建於 Foxit PDF Editor 中,可實現無縫、安全的校訂。
  • Smart Redact Server 是一種企業級解決方案,可批量掃描文件存放庫以偵測和標記敏感資訊,以便使用者能夠根據需要高效地審閱和校訂。

可以偵測到哪些類型的資料?

Smart Redact 會偵測現代資料法規定義的個人識別資訊 (PII)受保護的健康資訊 (PHI),包括歐盟 GDPR、經 CPRA 修訂的《加州消費者隱私法案》(CCPA) 和 HIPAA。這包括個人姓名、身份證號碼、信用卡號碼、駕照號碼、病歷和診斷碼等資料元素。目前,偵測僅支援英文文件。
如需支援類別的詳細清單,請參閱附錄 A

Smart Redact 是如何運作的?

本節詳細介紹了適用於 PDF 編輯器的 Smart Redact Plugin 和 Smart Redact Server 的工作流程和關鍵資料流程,協助使用者根據自己的需求選擇適合的解決方案。

Smart Redact Plugin 的工作流程

使用 Smart Redact Plugin 時,使用者可以安全地執行校訂而無需切換工具,從而節省時間,保護文件完整性,並在無縫的工作區內保持合規性。

Foxit AI Assistant 服務架構

上圖說明了使用 Smart Redact Plugin 進行校訂期間的主要參與者及其相應的資料流程。工作流程的參與者如下:

  • PDF 編輯器:在使用者裝置本機執行。它負責擷取文件資訊和執行校訂。這是使用者互動的主要介面。
  • SRP (Smart Redact Plugin) 服務:管理存取控制和業務邏輯處理。它充當 PDF 編輯器和 AI 服務之間的中介。
  • 內部多模型 AI 系統:託管於 AWS 上。它會分析文件以偵測敏感資訊,並將結果傳回給 SRP 服務。
  • Azure AI 語言服務:用於識別敏感資訊並與 SRP 服務互動以提供偵測結果的外部 AI 服務。

後續步驟概述了 PDF 編輯器的 Smart Redact Plugin 偵測和校訂敏感資訊的主要工作流程。

  • 文件準備:使用者開啟文件。如果文件是掃描檔案或包含內嵌影像,文字辨識功能將從文件中擷取文字。
  • 起始 Smart Redact:使用者啟用 Smart Redact,選取選項 (例如區域、敏感類別),並起始掃描。
  • 本機文字擷取:PDF 編輯器擷取所有文字內容 (包括原生內容和 OCR 產生的內容),並將其與使用者定義的參數一起傳送至 SRP 服務。
  • AI 導向型敏感資訊偵測:
    • a) AI 分析:SRP 使用多個模型 (Azure AI 語言和內部多模型 AI 系統) 分別偵測文字內容。
    • b) 模型集合和投票整合:SRP 服務使用模型集合方法彙總兩個 AI 系統的輸出,從而套用多數投票法來合併結果。這種共識驅動的方法產生了一個統一的敏感資訊清單,顯著提高了偵測準確性。
  • 使用者審閱與確認:PDF 編輯器向使用者顯示偵測到的敏感資訊。使用者審閱並確認要校訂哪些項目。
  • 確認後執行校訂:PDF 編輯器僅在使用者明確確認後執行校訂,以確保遵循隱私權政策。

Smart Redact Plugin 可協助使用者智慧識別和校訂敏感資訊,以簡化校訂流程。探索和校訂動作僅在使用者確認後執行,以確保使用者對流程保持完全控制,並且所有動作皆符合資料隱私權要求。

Smart Redact Server 的工作流程

Smart Redact Server (SRS) 高效地自動執行敏感資訊偵測和檔案移轉。例如,它可以掃描 AWS S3 貯體中的 10,000 個客戶合約,並套用預設原則以自動處理校訂和移轉工作。

Foxit AI Assistant 服務架構

該圖說明了使用 Smart Redact Server 進行校訂期間的主要參與者及其相應的資料流程。工作流程的參與者如下:

  • 雲端儲存:使用者的雲端儲存平台 (例如 OneDrive、AWS S3) 充當文件資料來源。
  • SRS (Smart Redact Server) 服務:一款獨立的 Web 應用程式,用於管理存取控制、業務邏輯、使用者驗證、工作流程協調和使用者介面。
  • 內部多模型 AI 系統
  • Azure AI 語言服務
  • Azure AI-Vision OCR 服務:它從掃描的文件或影像中擷取文字內容,為敏感資訊偵測提供輸入。

後續步驟概述了 Smart Redact Server (SRS) 偵測和校訂敏感資訊的主要工作流程。

  • 建立專案
    • a) 選取/建立原則:定義要偵測的敏感資料類型。
    • b) 選取/連線資料來源:連結雲端儲存 (例如,AWS S3、OneDrive)。SRS 遵循每個雲端儲存供應商的資料連線和存取安全指導方針,例如使用基於 Token 的驗證而不是密碼儲存。
    • c) 設定掃描範圍和排程:
      • i. 指定要掃描的根資料夾和文件類型。
      • ii. 設定掃描排程 (每日/每週/每月或手動觸發)。
    • d) 定義檔案移轉原則:對於包含敏感資料的文件,選擇將其複製或移動到指定路徑。
  • 批次文件處理工作流程:SRS 根據排程定期處理文件。它透過比較檔案名稱、修改時間和歷史記錄來確定是否需要重新掃描。
  • 單一文件處理步驟:
    • a) 下載文件:將檔案從資料來源擷取到 SRS 伺服器。
    • b) 文字擷取:使用 Azure AI-Vision OCR 從文件中擷取文字內容。
    • c) AI 導向型敏感資訊偵測:這遵循以集合為基礎的模型工作流程 (針對 Smart Redact Plugin 進行描述),此處不再贅述。
    • d) 記錄儲存:將掃描記錄、日誌和偵測到的敏感資訊儲存至資料庫。所有資料已進行加密。
    • e) 檔案移轉:根據使用者定義的組態複製或移動敏感文件。
    • f) 清理:從 SRS 伺服器中刪除暫存檔案複本。
  • 使用者後處理:使用者可以在 SRS 平台上審閱掃描記錄,並執行校訂、移動或複製操作。

當使用者使用 Smart Redact Server 偵測和校訂敏感資訊時,SRS 會根據使用者原則處理使用者指定的雲端儲存中的文件。SRS 不保留原始或中繼文件。但是,敏感資訊以加密形式儲存,以便執行審閱和隨訪動作。

Smart Redact 如何保護資料安全

保護傳輸中資料的安全

  • 所有 Web API 均透過 HTTPS 呼叫,包括對 Foxit Smart Redact 服務 API 和 Azure AI 服務 API 的呼叫。這將確保安全傳輸文件和使用者資料。此外,HTTPS 版本和加密套件選取項目會定期進行審閱和更新,以符合業界最佳做法。
  • 當 Smart Redact Server 存取雲端儲存服務時,會根據雲端儲存的推薦指導方針執行所有請求,以確保存取安全性。

保護靜態資料的安全

Foxit 實作多種措施來確保靜態資料的安全,其關鍵措施如下。

  • 加密敏感資訊:使用 256 位元進階加密標準 (AES) 對敏感資訊進行加密和儲存。
  • 資料中心安全性:透過利用 AWS 的第 4 層資料中心,Foxit 可確保強大的存取控制、環境保護和限制存取僅限於維吉尼亞州、法蘭克福和蒙特利爾的授權人員。
  • 資料隱私權:資料庫受防火牆保護且不可公開存取,僅限授權人員出於商業或法律目的存取。
  • 離網作業:為了滿足高安全性需求,Foxit 提供了一種「離網」模式,允許 Smart Redact Server 在沒有雲端存取的情況下運作。

謹慎的資料保留

  • 當使用者使用 PDF 編輯器的 Smart Redact Plugin 偵測和校訂文件中的敏感資訊時,Smart Redact 會遵循零保留原則。當工作完成後,所有原始和中繼文件以及結果都會立即刪除。
  • 使用 Smart Redact Server (SRS) 進行文件處理時,SRS 不會保留原始或中繼文件。偵測到的敏感資訊以加密形式進行儲存。刪除專案將一併永久刪除所有關聯的探索結果。

保護開發做法的安全

Foxit 遵循產業標準的安全性開發生命週期 (SDL),以確保 Smart Redact 的安全性和可靠性。關鍵措施包括:

  • 安全設計:提前進行威脅建模以識別風險,並在設計階段內嵌安全性控制。
  • 安全編碼:遵循嚴格的編碼標準可防止常見漏洞。
  • 代碼稽核和漏洞測試:定期稽核和測試可確保代碼完整性。
  • 安全性測試:組合使用自動和手動測試以驗證系統安全性。
  • 安全發佈:在部署前進行嚴格的安全審閱可確保合規性。

此外,Foxit 還優先考慮安全訓練,以提高開發人員的專業知識。這些做法加強了 Foxit 對提供安全可靠的 Smart Redact 解決方案的承諾。

隱私權和指導方針

您對 Foxit Smart Redact 解決方案的使用受 Foxit 使用者授權合約 (Foxit EULA) 和 Foxit 通用服務條款的約束。該指導方針反映了 Foxit 致力於遵循適用的法律法規,維護公司的價值觀,並促進 AI 技術的道德使用。

Foxit 使用一些 Azure AI 服務技術來提供 Smart Redact 解決方案。Smart Redact 使用的每個 Azure AI 服務都遵循自己的安全性與隱私權標準。如需詳細資料,請參閱:

結論

Foxit 提供一流的安全性,以滿足各個產業的使用者和組織的多樣化需求。我們承認您的資訊和工作流程的敏感性,並致力於以最高級別的保護來保護它們。選擇 Foxit,您就擁有了值得信賴的廠商,因為 Foxit 不僅致力於提供不妥協的 PDF 軟體,還根據業界最佳做法確保其各個方面的安全性。
如需有關 Foxit 安全性的詳細資訊,請造訪 Foxit 安全中心

附錄 A

Smart Redact 支援的詳細類別清單

代碼名稱 國家/地區 備註
人員 全部 (PII)
組織 全部 (PII)
人員類型 全部 (PII)
地址 全部 (PII)
郵遞區號 全部 (PII) 郵遞區號的前三位數字
位置 全部 (PII) 位置「全部」包括城市、國家/地區、州、人造建築等名稱,以及河流、海洋和沙漠等地理位置。
電子郵件 全部 (PII)
傳真號碼 全部 (PII)
日期時間 全部 (PII)
溫度 全部 (PII)
貨幣 全部 (PII)
年齡 全部 (PII)
百分比 全部 (PII)
信用卡號碼 全部 (PII)
國際銀行帳戶號碼 全部 (PII) 國際銀行帳戶號碼
性別 全部 (PII) 顯露主體性別的術語,例如男性、女性、婦女、紳士或女士。
SWIFT 代碼 全部
社交媒體 URL 全部 (PII) 它支援社交媒體帳戶偵測:
*Twitter 使用者名稱
* Facebook 使用者名稱
* YouTube 帳戶
* Vimeo 帳戶
* Instagram 使用者名稱
* LinkedIn URL
* Pinterest 使用者名稱
種族 全部 (PII) 範例:「非洲人」、「亞洲人」、「歐洲人」、「美洲原住民」、「大洋洲人」
宗教信仰 全部 (PII) 範例:「猶太教」、「天主教」
性偏好 全部 (PII) 範例:「雙性戀」、「同性戀」、「異性戀」
PoliticalAffiliation 全部 (PII) 範例:「美國民主黨」或「美國共和黨」
CountryCode 全部 (PII) 範例:+591、+886
Language 全部 (PII) 範例:英文、法文
Occupation 全部 (PII) 範例:科學家、醫生
BloodType 全部 (PII) 例如,A、B、AB、O
MaritalStatus 全部 (PII) 例如,已婚、單身、離異
IP 全部 (PII) 網路 IPv4 和 IPv6 位址。範例:168.131.1.1 和 21DA:D3:0:2F3B:2AA:FF:FE28:9C5A
ABA 路由號碼 美國 (PII)
美國電話號碼 美國 (PII)
美國個人納稅人識別 美國 (PII)
美國身份證號碼 美國 (PII)
美國駕照號碼 美國 (PII)
美國和英國護照號碼 美國和英國 (PII) 情境感知認知。需要在數字周圍加上護照號碼文字。
美國銀行帳戶號碼 美國 (PII)
自動清算所路由號碼 美國 (PII) 自動清算所號碼
保險提供者 美國 (PII)
參保人員 ID 美國 (PII) 參保人員 ID 號碼
集團號碼 美國 保險集團號碼
澳洲駕照 澳洲 (PII) 保險集團號碼
澳洲護照號碼 澳洲 (PII) 保險集團號碼
澳洲商業號碼 澳洲 (PII) 澳洲商業號碼
銀行分行代碼 澳洲 (PII) 銀行分行代碼
澳洲電話號碼 澳洲 (PII)
CustomerReferenceNumber 澳洲 (PII) CRN 由 9 個數字組成,並以字母結尾。例如:123 456 789A。
稅務檔案號碼 澳洲 (PII) 稅務檔案號碼 (TFN) 是免費的,用於識別使用者的稅務和退休金用途。
英國駕照號碼 英國 (PII) 英國駕照號碼
社區健康指數 英國 (PII) 社區健康指數 (CHI) 號碼,例如 0911640250
英國國民保健制度號碼 英國 (PII) 國民保健制度 (NHS) 號碼
英國國民保險號碼 英國 (PII) 國民保險號碼
英國國民保健制度號碼 英國 (PII) 國民保健制度號碼
英國電話號碼 英國 (PII) 英國電話號碼
檢查名稱 全部 檢查 (PHI);診斷程序和測試,包括生命徵象和身體測量
診斷 全部 診斷 (PHI);疾病、症候群、中毒
SymptomOrSign 全部 症狀 (PHI);疾病或其他診斷的主觀或客觀證據
TreatmentName 全部 治療 (PHI);治療程序
Allergen 全部 過敏原 (PHI);引發過敏反應的抗原
療程 全部 療程 (PHI);描述另一個實體在一段時間內的變化,例如病情進展、治療過程或藥物療程
測量值 全部 測量值 (PHI);與檢查或醫療狀況測量相關的值
變體 全部 變體 (PHI);所有提及的基因變異和突變
基因或蛋白質 全部 基因/蛋白質 (PHI);所有提及的人類基因、染色體、染色體部分和蛋白質的名稱和符號
突變類型 全部 突變類型 (PHI);突變的描述,包括其類型、作用和位置
表現 全部 表現 (PHI);基因表現水平
行政活動 全部 行政活動 (PHI);與醫療保健系統相關但具有行政/半行政性質的活動
護理環境 全部 護理環境 (PHI);病人接受護理的環境或地點
條件限定詞 全部 條件限定詞 (PHI);用於描述醫療狀況的定性術語
藥物名稱 全部 藥物名稱 (PHI);藥物提及,包括受版權保護的品牌名稱和非品牌名稱
劑量 全部 劑量 (PHI);訂購的藥物數量
家庭關係 全部 家庭關係 (PHI);提及受試者的家庭親屬
身體結構 全部 身體結構 (PHI);身體系統、解剖位置或區域以及身體部位
方向 全部 方向 (PHI);可能與身體結構、醫療狀況、檢查或治療相關的定向術語
頻率 全部 頻率 (PHI);描述醫療狀況、檢查、治療或藥物治療已發生、實際發生或應該發生的頻率
時間 全部 時間 (PHI);與醫療狀況、檢查、治療、藥物或行政活動的開始和/或時長 (持續時間) 相關的時間術語
測量單位 全部 測量值 (PHI);與檢查或醫療狀況測量相關的值
關係運算子 全部 關係運算子 (PHI);表達實體和一些附加資訊之間定量關係的片語
醫療保健專業 全部 醫療保健專業 (PHI);有執照或無執照的醫療從業人員
狀況量表 全部 狀況量表 (PHI);定性術語,透過尺度 (有限的有序值清單) 描述狀況
藥物類別 全部 藥物類別 (PHI);一組具有相似作用機制、相關作用方式、相似化學結構和/或用於治療同一疾病的藥物
劑型 全部 劑型 (PHI);用藥形式
用藥途徑 全部 用藥途徑 (PHI);給藥方法