Foxit Smart Redact
安全性概觀
Foxit Smart Redact 是由 Foxit 提供的 AI 技術輔助工具,可以自動偵測和移除姓名、地址和 ID 等敏感資料。它可以協助使用者高效安全地完成校訂工作流程,保護敏感資訊免受未經授權的存取,並遵循全球資料隱私權法規。Foxit 透過端對端加密傳輸、對敏感資訊的加密儲存、高層資料中心和謹慎的資料保留原則來優先考慮資料安全性。此外,其開發流程遵循安全性開發生命週期 (SDL)。這種多層方法為個人和企業提供了一種高效、安全的敏感資料探索和校訂解決方案。
關於 Foxit Smart Redact
Foxit Smart Redact 利用經過訓練的 AI 模型來遵循全球資料隱私權法規 (例如 GDPR、HIPAA),從而能夠智慧識別敏感資訊。它使用最佳化工作流程來提高校訂速度和準確性。此外,它還提供面向企業的解決方案,協助企業和組織大規模偵測和校訂文件中的敏感資訊。
Foxit Smart Redact 包括
- PDF 編輯器的 Smart Redact Plugin,內建於 Foxit PDF Editor 中,可實現無縫、安全的校訂。
- Smart Redact Server 是一種企業級解決方案,可批量掃描文件存放庫以偵測和標記敏感資訊,以便使用者能夠根據需要高效地審閱和校訂。
可以偵測到哪些類型的資料?
Smart Redact 會偵測現代資料法規定義的個人識別資訊 (PII) 和受保護的健康資訊 (PHI),包括歐盟 GDPR、經 CPRA 修訂的《加州消費者隱私法案》(CCPA) 和 HIPAA。這包括個人姓名、身份證號碼、信用卡號碼、駕照號碼、病歷和診斷碼等資料元素。目前,偵測僅支援英文文件。
如需支援類別的詳細清單,請參閱附錄 A。
Smart Redact 是如何運作的?
本節詳細介紹了適用於 PDF 編輯器的 Smart Redact Plugin 和 Smart Redact Server 的工作流程和關鍵資料流程,協助使用者根據自己的需求選擇適合的解決方案。
Smart Redact Plugin 的工作流程
使用 Smart Redact Plugin 時,使用者可以安全地執行校訂而無需切換工具,從而節省時間,保護文件完整性,並在無縫的工作區內保持合規性。

上圖說明了使用 Smart Redact Plugin 進行校訂期間的主要參與者及其相應的資料流程。工作流程的參與者如下:
- PDF 編輯器:在使用者裝置本機執行。它負責擷取文件資訊和執行校訂。這是使用者互動的主要介面。
- SRP (Smart Redact Plugin) 服務:管理存取控制和業務邏輯處理。它充當 PDF 編輯器和 AI 服務之間的中介。
- 內部多模型 AI 系統:託管於 AWS 上。它會分析文件以偵測敏感資訊,並將結果傳回給 SRP 服務。
- Azure AI 語言服務:用於識別敏感資訊並與 SRP 服務互動以提供偵測結果的外部 AI 服務。
後續步驟概述了 PDF 編輯器的 Smart Redact Plugin 偵測和校訂敏感資訊的主要工作流程。
- 文件準備:使用者開啟文件。如果文件是掃描檔案或包含內嵌影像,文字辨識功能將從文件中擷取文字。
- 起始 Smart Redact:使用者啟用 Smart Redact,選取選項 (例如區域、敏感類別),並起始掃描。
- 本機文字擷取:PDF 編輯器擷取所有文字內容 (包括原生內容和 OCR 產生的內容),並將其與使用者定義的參數一起傳送至 SRP 服務。
- AI 導向型敏感資訊偵測:
- a) AI 分析:SRP 使用多個模型 (Azure AI 語言和內部多模型 AI 系統) 分別偵測文字內容。
- b) 模型集合和投票整合:SRP 服務使用模型集合方法彙總兩個 AI 系統的輸出,從而套用多數投票法來合併結果。這種共識驅動的方法產生了一個統一的敏感資訊清單,顯著提高了偵測準確性。
- 使用者審閱與確認:PDF 編輯器向使用者顯示偵測到的敏感資訊。使用者審閱並確認要校訂哪些項目。
- 確認後執行校訂:PDF 編輯器僅在使用者明確確認後執行校訂,以確保遵循隱私權政策。
Smart Redact Plugin 可協助使用者智慧識別和校訂敏感資訊,以簡化校訂流程。探索和校訂動作僅在使用者確認後執行,以確保使用者對流程保持完全控制,並且所有動作皆符合資料隱私權要求。
Smart Redact Server 的工作流程
Smart Redact Server (SRS) 高效地自動執行敏感資訊偵測和檔案移轉。例如,它可以掃描 AWS S3 貯體中的 10,000 個客戶合約,並套用預設原則以自動處理校訂和移轉工作。

該圖說明了使用 Smart Redact Server 進行校訂期間的主要參與者及其相應的資料流程。工作流程的參與者如下:
- 雲端儲存:使用者的雲端儲存平台 (例如 OneDrive、AWS S3) 充當文件資料來源。
- SRS (Smart Redact Server) 服務:一款獨立的 Web 應用程式,用於管理存取控制、業務邏輯、使用者驗證、工作流程協調和使用者介面。
- 內部多模型 AI 系統
- Azure AI 語言服務
- Azure AI-Vision OCR 服務:它從掃描的文件或影像中擷取文字內容,為敏感資訊偵測提供輸入。
後續步驟概述了 Smart Redact Server (SRS) 偵測和校訂敏感資訊的主要工作流程。
- 建立專案
- a) 選取/建立原則:定義要偵測的敏感資料類型。
- b) 選取/連線資料來源:連結雲端儲存 (例如,AWS S3、OneDrive)。SRS 遵循每個雲端儲存供應商的資料連線和存取安全指導方針,例如使用基於 Token 的驗證而不是密碼儲存。
- c) 設定掃描範圍和排程:
- i. 指定要掃描的根資料夾和文件類型。
- ii. 設定掃描排程 (每日/每週/每月或手動觸發)。
- d) 定義檔案移轉原則:對於包含敏感資料的文件,選擇將其複製或移動到指定路徑。
- 批次文件處理工作流程:SRS 根據排程定期處理文件。它透過比較檔案名稱、修改時間和歷史記錄來確定是否需要重新掃描。
- 單一文件處理步驟:
- a) 下載文件:將檔案從資料來源擷取到 SRS 伺服器。
- b) 文字擷取:使用 Azure AI-Vision OCR 從文件中擷取文字內容。
- c) AI 導向型敏感資訊偵測:這遵循以集合為基礎的模型工作流程 (針對 Smart Redact Plugin 進行描述),此處不再贅述。
- d) 記錄儲存:將掃描記錄、日誌和偵測到的敏感資訊儲存至資料庫。所有資料已進行加密。
- e) 檔案移轉:根據使用者定義的組態複製或移動敏感文件。
- f) 清理:從 SRS 伺服器中刪除暫存檔案複本。
- 使用者後處理:使用者可以在 SRS 平台上審閱掃描記錄,並執行校訂、移動或複製操作。
當使用者使用 Smart Redact Server 偵測和校訂敏感資訊時,SRS 會根據使用者原則處理使用者指定的雲端儲存中的文件。SRS 不保留原始或中繼文件。但是,敏感資訊以加密形式儲存,以便執行審閱和隨訪動作。
Smart Redact 如何保護資料安全?
保護傳輸中資料的安全
- 所有 Web API 均透過 HTTPS 呼叫,包括對 Foxit Smart Redact 服務 API 和 Azure AI 服務 API 的呼叫。這將確保安全傳輸文件和使用者資料。此外,HTTPS 版本和加密套件選取項目會定期進行審閱和更新,以符合業界最佳做法。
- 當 Smart Redact Server 存取雲端儲存服務時,會根據雲端儲存的推薦指導方針執行所有請求,以確保存取安全性。
保護靜態資料的安全
Foxit 實作多種措施來確保靜態資料的安全,其關鍵措施如下。
- 加密敏感資訊:使用 256 位元進階加密標準 (AES) 對敏感資訊進行加密和儲存。
- 資料中心安全性:透過利用 AWS 的第 4 層資料中心,Foxit 可確保強大的存取控制、環境保護和限制存取僅限於維吉尼亞州、法蘭克福和蒙特利爾的授權人員。
- 資料隱私權:資料庫受防火牆保護且不可公開存取,僅限授權人員出於商業或法律目的存取。
- 離網作業:為了滿足高安全性需求,Foxit 提供了一種「離網」模式,允許 Smart Redact Server 在沒有雲端存取的情況下運作。
謹慎的資料保留
- 當使用者使用 PDF 編輯器的 Smart Redact Plugin 偵測和校訂文件中的敏感資訊時,Smart Redact 會遵循零保留原則。當工作完成後,所有原始和中繼文件以及結果都會立即刪除。
- 使用 Smart Redact Server (SRS) 進行文件處理時,SRS 不會保留原始或中繼文件。偵測到的敏感資訊以加密形式進行儲存。刪除專案將一併永久刪除所有關聯的探索結果。
保護開發做法的安全
Foxit 遵循產業標準的安全性開發生命週期 (SDL),以確保 Smart Redact 的安全性和可靠性。關鍵措施包括:
- 安全設計:提前進行威脅建模以識別風險,並在設計階段內嵌安全性控制。
- 安全編碼:遵循嚴格的編碼標準可防止常見漏洞。
- 代碼稽核和漏洞測試:定期稽核和測試可確保代碼完整性。
- 安全性測試:組合使用自動和手動測試以驗證系統安全性。
- 安全發佈:在部署前進行嚴格的安全審閱可確保合規性。
此外,Foxit 還優先考慮安全訓練,以提高開發人員的專業知識。這些做法加強了 Foxit 對提供安全可靠的 Smart Redact 解決方案的承諾。
隱私權和指導方針
您對 Foxit Smart Redact 解決方案的使用受 Foxit 使用者授權合約 (Foxit EULA) 和 Foxit 通用服務條款的約束。該指導方針反映了 Foxit 致力於遵循適用的法律法規,維護公司的價值觀,並促進 AI 技術的道德使用。
Foxit 使用一些 Azure AI 服務技術來提供 Smart Redact 解決方案。Smart Redact 使用的每個 Azure AI 服務都遵循自己的安全性與隱私權標準。如需詳細資料,請參閱:
結論
Foxit 提供一流的安全性,以滿足各個產業的使用者和組織的多樣化需求。我們承認您的資訊和工作流程的敏感性,並致力於以最高級別的保護來保護它們。選擇 Foxit,您就擁有了值得信賴的廠商,因為 Foxit 不僅致力於提供不妥協的 PDF 軟體,還根據業界最佳做法確保其各個方面的安全性。
如需有關 Foxit 安全性的詳細資訊,請造訪 Foxit 安全中心。
附錄 A
Smart Redact 支援的詳細類別清單
代碼名稱 | 國家/地區 | 備註 |
人員 | 全部 | (PII) |
組織 | 全部 | (PII) |
人員類型 | 全部 | (PII) |
地址 | 全部 | (PII) |
郵遞區號 | 全部 | (PII) 郵遞區號的前三位數字 |
位置 | 全部 | (PII) 位置「全部」包括城市、國家/地區、州、人造建築等名稱,以及河流、海洋和沙漠等地理位置。 |
電子郵件 | 全部 | (PII) |
傳真號碼 | 全部 | (PII) |
日期時間 | 全部 | (PII) |
溫度 | 全部 | (PII) |
貨幣 | 全部 | (PII) |
年齡 | 全部 | (PII) |
百分比 | 全部 | (PII) |
信用卡號碼 | 全部 | (PII) |
國際銀行帳戶號碼 | 全部 | (PII) 國際銀行帳戶號碼 |
性別 | 全部 | (PII) 顯露主體性別的術語,例如男性、女性、婦女、紳士或女士。 |
SWIFT 代碼 | 全部 | |
社交媒體 URL | 全部 | (PII) 它支援社交媒體帳戶偵測: *Twitter 使用者名稱 * Facebook 使用者名稱 * YouTube 帳戶 * Vimeo 帳戶 * Instagram 使用者名稱 * LinkedIn URL * Pinterest 使用者名稱 |
種族 | 全部 | (PII) 範例:「非洲人」、「亞洲人」、「歐洲人」、「美洲原住民」、「大洋洲人」 |
宗教信仰 | 全部 | (PII) 範例:「猶太教」、「天主教」 |
性偏好 | 全部 | (PII) 範例:「雙性戀」、「同性戀」、「異性戀」 |
PoliticalAffiliation | 全部 | (PII) 範例:「美國民主黨」或「美國共和黨」 |
CountryCode | 全部 | (PII) 範例:+591、+886 |
Language | 全部 | (PII) 範例:英文、法文 |
Occupation | 全部 | (PII) 範例:科學家、醫生 |
BloodType | 全部 | (PII) 例如,A、B、AB、O |
MaritalStatus | 全部 | (PII) 例如,已婚、單身、離異 |
IP | 全部 | (PII) 網路 IPv4 和 IPv6 位址。範例:168.131.1.1 和 21DA:D3:0:2F3B:2AA:FF:FE28:9C5A |
ABA 路由號碼 | 美國 | (PII) |
美國電話號碼 | 美國 | (PII) |
美國個人納稅人識別 | 美國 | (PII) |
美國身份證號碼 | 美國 | (PII) |
美國駕照號碼 | 美國 | (PII) |
美國和英國護照號碼 | 美國和英國 | (PII) 情境感知認知。需要在數字周圍加上護照號碼文字。 |
美國銀行帳戶號碼 | 美國 | (PII) |
自動清算所路由號碼 | 美國 | (PII) 自動清算所號碼 |
保險提供者 | 美國 | (PII) |
參保人員 ID | 美國 | (PII) 參保人員 ID 號碼 |
集團號碼 | 美國 | 保險集團號碼 |
澳洲駕照 | 澳洲 | (PII) 保險集團號碼 |
澳洲護照號碼 | 澳洲 | (PII) 保險集團號碼 |
澳洲商業號碼 | 澳洲 | (PII) 澳洲商業號碼 |
銀行分行代碼 | 澳洲 | (PII) 銀行分行代碼 |
澳洲電話號碼 | 澳洲 | (PII) |
CustomerReferenceNumber | 澳洲 | (PII) CRN 由 9 個數字組成,並以字母結尾。例如:123 456 789A。 |
稅務檔案號碼 | 澳洲 | (PII) 稅務檔案號碼 (TFN) 是免費的,用於識別使用者的稅務和退休金用途。 |
英國駕照號碼 | 英國 | (PII) 英國駕照號碼 |
社區健康指數 | 英國 | (PII) 社區健康指數 (CHI) 號碼,例如 0911640250 |
英國國民保健制度號碼 | 英國 | (PII) 國民保健制度 (NHS) 號碼 |
英國國民保險號碼 | 英國 | (PII) 國民保險號碼 |
英國國民保健制度號碼 | 英國 | (PII) 國民保健制度號碼 |
英國電話號碼 | 英國 | (PII) 英國電話號碼 |
檢查名稱 | 全部 | 檢查 (PHI);診斷程序和測試,包括生命徵象和身體測量 |
診斷 | 全部 | 診斷 (PHI);疾病、症候群、中毒 |
SymptomOrSign | 全部 | 症狀 (PHI);疾病或其他診斷的主觀或客觀證據 |
TreatmentName | 全部 | 治療 (PHI);治療程序 |
Allergen | 全部 | 過敏原 (PHI);引發過敏反應的抗原 |
療程 | 全部 | 療程 (PHI);描述另一個實體在一段時間內的變化,例如病情進展、治療過程或藥物療程 |
測量值 | 全部 | 測量值 (PHI);與檢查或醫療狀況測量相關的值 |
變體 | 全部 | 變體 (PHI);所有提及的基因變異和突變 |
基因或蛋白質 | 全部 | 基因/蛋白質 (PHI);所有提及的人類基因、染色體、染色體部分和蛋白質的名稱和符號 |
突變類型 | 全部 | 突變類型 (PHI);突變的描述,包括其類型、作用和位置 |
表現 | 全部 | 表現 (PHI);基因表現水平 |
行政活動 | 全部 | 行政活動 (PHI);與醫療保健系統相關但具有行政/半行政性質的活動 |
護理環境 | 全部 | 護理環境 (PHI);病人接受護理的環境或地點 |
條件限定詞 | 全部 | 條件限定詞 (PHI);用於描述醫療狀況的定性術語 |
藥物名稱 | 全部 | 藥物名稱 (PHI);藥物提及,包括受版權保護的品牌名稱和非品牌名稱 |
劑量 | 全部 | 劑量 (PHI);訂購的藥物數量 |
家庭關係 | 全部 | 家庭關係 (PHI);提及受試者的家庭親屬 |
身體結構 | 全部 | 身體結構 (PHI);身體系統、解剖位置或區域以及身體部位 |
方向 | 全部 | 方向 (PHI);可能與身體結構、醫療狀況、檢查或治療相關的定向術語 |
頻率 | 全部 | 頻率 (PHI);描述醫療狀況、檢查、治療或藥物治療已發生、實際發生或應該發生的頻率 |
時間 | 全部 | 時間 (PHI);與醫療狀況、檢查、治療、藥物或行政活動的開始和/或時長 (持續時間) 相關的時間術語 |
測量單位 | 全部 | 測量值 (PHI);與檢查或醫療狀況測量相關的值 |
關係運算子 | 全部 | 關係運算子 (PHI);表達實體和一些附加資訊之間定量關係的片語 |
醫療保健專業 | 全部 | 醫療保健專業 (PHI);有執照或無執照的醫療從業人員 |
狀況量表 | 全部 | 狀況量表 (PHI);定性術語,透過尺度 (有限的有序值清單) 描述狀況 |
藥物類別 | 全部 | 藥物類別 (PHI);一組具有相似作用機制、相關作用方式、相似化學結構和/或用於治療同一疾病的藥物 |
劑型 | 全部 | 劑型 (PHI);用藥形式 |
用藥途徑 | 全部 | 用藥途徑 (PHI);給藥方法 |