Visão geral de segurança do
Foxit Smart Redact

O Foxit Smart Redact é uma ferramenta com tecnologia de IA oferecida pela Foxit que detecta e remove automaticamente dados confidenciais, como nomes, endereços e IDs. Ele ajuda os usuários a concluir fluxos de trabalho de edição de forma eficiente e segura, proteger informações confidenciais contra acesso não autorizado e cumprir as regulamentações globais de privacidade de dados. A Foxit prioriza a segurança de dados por meio de transmissão criptografada de ponta a ponta, armazenamento criptografado de informações confidenciais, data centers de alto nível e políticas prudentes de retenção de dados. Além disso, seu processo de desenvolvimento segue o Ciclo de Vida do Desenvolvimento de Segurança (SDL). Essa abordagem multicamadas fornece a pessoas e empresas uma solução eficiente e segura de descoberta e edição de dados confidenciais.

Sobre o Foxit Smart Redact

O Foxit Smart Redact utiliza modelos de IA treinados para cumprir as regulamentações globais de privacidade de dados (como GDPR, HIPAA), permitindo a identificação inteligente de informações confidenciais. Ele usa fluxos de trabalho otimizados para aumentar a velocidade e a precisão da edição. Além disso, oferece soluções corporativas para ajudar empresas e organizações a detectar e editar informações confidenciais em documentos em larga escala.
O Foxit Smart Redact inclui o

  • Smart Redact Plugin do PDF Editor, integrado no Foxit PDF Editor para uma edição segura e descomplicada.
  • O Smart Redact Server, uma solução de nível empresarial que verifica repositórios de documentos em massa para detectar e marcar informações confidenciais, permite que os usuários revisem e editem com eficiência, conforme necessário.

Que tipos de dados podem ser detectados?

O Smart Redact detecta informações de Identificação Pessoal (PII) e Informações de Saúde Protegidas (PHI) conforme definidas pelas regulamentações de dados modernas, incluindo o GDPR da UE, a Lei de Privacidade do Consumidor da Califórnia (CCPA) conforme alterada pela CPRA e a HIPAA. Isso inclui elementos de dados como nomes pessoais, números de CPF, números de cartão de crédito, números de carteira de habilitação, prontuários médicos e códigos de diagnóstico. No momento, a detecção ocorre apenas em documentos em inglês.
Para obter uma lista detalhada das categorias disponíveis, consulte o Apêndice A.

Como o Smart Redact funciona?

Esta seção detalha os fluxos de trabalho e os principais fluxos de dados do Smart Redact Plugin para o PDF Editor e o Smart Redact Server, ajudando os usuários a escolher a solução certa com base nas suas necessidades.

Fluxo de trabalho do Smart Redact Plugin

Ao usar o Smart Redact Plugin, os usuários podem fazer a edição com segurança sem precisar trocar de ferramenta, o que economiza tempo, protege a integridade do documento e mantém a conformidade em um ambiente de trabalho integrado.

Arquitetura do serviço do Assistente de IA Foxit

O diagrama acima ilustra os principais participantes e seus respectivos fluxos de dados durante a edição usando o Smart Redact Plugin. Os participantes do fluxo de trabalho são os seguintes:

  • PDF Editor: É executado localmente no dispositivo do usuário. É responsável por extrair informações do documento e realizar a edição. Esta é a principal interface com a qual os usuários interagem.
  • Serviço SRP (Smart Redact Plugin): Gerencia o controle de acesso e o processamento da lógica do negócio. Atua como intermediário entre o PDF Editor e os serviços de IA.
  • Sistema Interno de IA Multimodal: Hospedado na AWS. Analisa documentos para detectar informações confidenciais e retorna os resultados para o Serviço SRP.
  • Serviço de Linguagem do Azure AI: Um serviço externo de IA usado para identificar informações confidenciais e interagir com o Serviço SRP para fornecer resultados de detecção.

As etapas a seguir descrevem o fluxo de trabalho principal do Smart Redact Plugin do PDF Editor para detectar e editar informações confidenciais.

  • Preparação do documento: O usuário abre o documento. Se o documento for um arquivo digitalizado ou contiver imagens incorporadas, o reconhecimento de texto extrairá o texto do documento.
  • Inicie o Smart Redact: O usuário ativa o Smart Redact, seleciona as opções (ex.: regiões, categorias confidenciais) e inicia a digitalização.
  • Extração de texto local: O PDF Editor extrai todo o conteúdo de texto nativo e gerado por OCR e o envia para o Serviço SRP, juntamente com os parâmetros definidos pelo usuário.
  • Detecção de informações confidenciais orientada por IA:
    • A) Análise da IA: O SRP utiliza vários modelos (Linguagem do Azure AI e Sistema Interno de IA Multimodal) para detectar o conteúdo do texto separadamente.
    • B) Integração de conjunto de modelos e votação: O Serviço SRP agrega as saídas dos dois sistemas de IA usando uma abordagem de conjunto de modelos, aplicando votação majoritária para consolidar os resultados. Esse método orientado por consenso gera uma lista unificada de informações confidenciais, aumentando significativamente a precisão da detecção.
  • Revisão e confirmação do usuário: O PDF Editor exibe ao usuário as informações confidenciais detectadas. O usuário revisa e confirma quais itens devem ser editados.
  • Inicie a edição após a confirmação: O PDF Editor inicia a edição somente após a confirmação explícita do usuário, garantindo a conformidade com as políticas de privacidade.

O Smart Redact Plugin ajuda os usuários a identificar e editar informações confidenciais de forma inteligente, agilizando o processo de edição. As ações de descoberta e edição são executadas somente após a confirmação do usuário; isso garante que os usuários mantenham controle total sobre o processo e que todas as ações estejam em conformidade com os requisitos de privacidade de dados.

Fluxo de trabalho do Smart Redact Server

O Smart Redact Server (SRS) automatiza com eficiência a detecção de informações confidenciais e a migração de arquivos. Por exemplo, ele pode escanear 10 mil contratos de clientes em um bucket AWS S3 e aplicar políticas predefinidas para lidar com tarefas de edição e migração automaticamente.

Arquitetura do serviço do Assistente de IA Foxit

A figura ilustra os principais participantes e seus respectivos fluxos de dados durante a edição usando o Smart Redact Server. Os participantes do fluxo de trabalho são os seguintes:

  • Armazenamento na Nuvem: As plataformas de armazenamento em nuvem do usuário (ex.: OneDrive, AWS S3) servem como fonte de dados do documento.
  • Serviço SRS (Smart Redact Server): Um aplicativo da web autônomo que gerencia o controle de acesso, a lógica de negócios, a autenticação dos usuários, a orquestração do fluxo de trabalho e a interface do usuário.
  • Sistema Interno de IA Multimodal
  • Serviço de Linguagem do Azure AI
  • Serviço de OCR do Azure AI-Vision: Extrai conteúdo de texto de documentos ou imagens digitalizados para fornecer informações para a detecção de informações confidenciais.

As etapas a seguir descrevem o fluxo de trabalho principal do Smart Redact Server (SRS) para detectar e editar informações confidenciais.

  • Criar um projeto
    • a) Selecionar/criar política: Defina os tipos de dados confidenciais a serem detectados.
    • b) Selecionar/conectar fonte de dados: Vincule o armazenamento em nuvem (ex.: AWS S3, OneDrive). O SRS segue as diretrizes de segurança de cada provedor de armazenamento em nuvem para conexão e acesso a dados, como o uso de autenticação baseada em token, em vez de armazenamento por senha.
    • c) Configurar o escopo e o cronograma de digitalização:
      • i. Especifique a pasta raiz e os tipos de documentos a serem digitalizados.
      • ii. Defina o cronograma de digitalização (diária/semanal/mensal ou acionamento manual).
    • d) Defina a política de migração de arquivos: Para documentos que contêm dados confidenciais, opte por copiá-los ou transferi-los para os caminhos designados.
  • Fluxo de trabalho de processamento de documentos em lote: O SRS processa documentos periodicamente com base no cronograma. Ele determina se uma nova digitalização é necessária comparando nomes de arquivos, horários de modificação e registros históricos.
  • Etapas de processamento de documentos únicos:
    • a) Download do documento: Buscar arquivos da fonte de dados para o servidor SRS.
    • b) Extração de texto: Usa o OCR do Azure AI-Vision para extrair conteúdos de texto do documento.
    • c) Detecção de informações confidenciais orientada por IA: Segue o fluxo de trabalho do modelo baseado em conjunto, descrito para o Smart Redact Plugin e não reiterado aqui.
    • d) Armazenamento de registros: Salve registros de digitalização, logs e informações confidenciais detectadas no banco de dados. Todos os dados são criptografados.
    • e) Migração de arquivos: Copie ou transfira documentos confidenciais de acordo com a configuração definida pelo usuário.
    • f) Limpeza: Exclua cópias de arquivos temporárias do servidor SRS.
  • Pós-processamento para usuários: Os usuários podem revisar registros de digitalização na plataforma SRS e realizar operações de edição, transferência ou cópia.

Quando os usuários usam o Smart Redact Server para detectar e editar informações confidenciais, o SRS processa os documentos no armazenamento na nuvem designado pelo usuário, de acordo com a política do usuário. O SRS não retém documentos originais ou intermediários. No entanto, informações confidenciais são armazenadas criptografadas para revisão e acompanhamento.

Como o Smart Redact mantém os dados protegidos?

Dados protegidos em trânsito

  • Todas as APIs da Web são chamadas via HTTPS, incluindo chamadas para a API de serviços do Foxit Smart Redact e a API de Serviços do Azure AI. Isso garante a transmissão segura de documentos e dados do usuário. Além disso, as versões HTTPS e as seleções de conjuntos de criptografia são revisadas e atualizadas regularmente para se adequarem às boas práticas do setor.
  • Quando o Smart Redact Server acessa serviços de armazenamento em nuvem, todas as solicitações são realizadas de acordo com as diretrizes recomendadas do armazenamento em nuvem para garantir a segurança do acesso.

Dados protegidos em repouso

A Foxit implementa uma variedade de medidas para garantir a segurança dos dados em repouso, sendo as principais medidas as seguintes:

  • Criptografia de informações confidenciais: As informações confidenciais são criptografadas e armazenadas usando o padrão de criptografia avançada (AES) de 256 bits.
  • Segurança do data center: Ao utilizar os data centers de nível 4 da AWS, a Foxit garante controles de acesso robustos, proteções ambientais e acesso restrito, limitado a pessoal autorizado na Virgínia, em Frankfurt e em Montreal.
  • Privacidade de dados: Os bancos de dados são protegidos por firewall e não podem ser acessados publicamente; o acesso é restrito a pessoal autorizado e apenas para fins profissionais ou jurídicos.
  • Operação Off-grid (desconectado): Para necessidades de alta segurança, a Foxit oferece um modo "off-grid", permitindo a operação do Smart Redact Server sem acesso à nuvem.

Retenção de dados prudente

  • Quando os usuários usam o Smart Redact Plugin do PDF Editor para detectar e editar informações confidenciais em documentos, o Smart Redact segue uma política de retenção zero. Após a conclusão da tarefa, todos os documentos originais e intermediários, juntamente com os resultados, são excluídos instantaneamente.
  • Ao usar o Smart Redact Server (SRS) para processamento de documentos, o SRS não retém os documentos originais nem os intermediários. As informações confidenciais detectadas são armazenadas de forma criptografada. A exclusão de um projeto também exclui permanentemente todos os resultados de descoberta associados.

Práticas de desenvolvimento seguras

A Foxit segue o Ciclo de Vida de Desenvolvimento de Segurança (SDL) padrão do setor para garantir a segurança e a confiabilidade do Smart Redact. As principais medidas incluem:

  • Design seguro: A modelagem de ameaças é realizada no início, para identificar riscos; controles de segurança são incorporados na fase de design.
  • Codificação segura: O cumprimento de padrões rigorosos de codificação previne vulnerabilidades comuns.
  • Auditorias de código e testes de vulnerabilidade: Auditorias e testes regulares garantem a integridade do código.
  • Testes de segurança: Uma combinação de testes automatizados e manuais é usada para validar a segurança do sistema.
  • Lançamento seguro: Revisões rigorosas de segurança garantem a conformidade antes da implementação.

Além disso, a Foxit prioriza o treinamento em segurança para aprimorar a experiência dos desenvolvedores. Essas práticas reforçam o compromisso da Foxit em fornecer uma solução Smart Redact segura e confiável.

Privacidade e Diretrizes

O uso das soluções Foxit Smart Redact é regido pelo Contrato de Licença para o Usuário Final da Foxit (Foxit EULA) e pelos Termos Gerais de Serviço da Foxit. As Diretrizes refletem o compromisso da Foxit em cumprir as leis e regulamentações aplicáveis, defender os valores da empresa e promover o uso ético das tecnologias de IA.

A Foxit usa algumas das tecnologias do Serviço Azure AI para fornecer a solução Smart Redact. Cada serviço do Azure AI usado pelo Smart Redact segue seus próprios padrões de segurança e privacidade. Para obter detalhes, consulte:

Conclusão

A Foxit oferece um nível de segurança rigoroso, adaptado às diversas necessidades de usuários e organizações em todos os setores. Reconhecemos a confidencialidade das suas informações e fluxos de trabalho e estamos comprometidos em protegê-los com o mais alto nível de proteção. Com a Foxit, você ganha uma fornecedora confiável, comprometida não apenas em fornecer software de PDF robusto, mas também em garantir sua segurança em todas as facetas, de acordo com as práticas recomendadas do setor.
Para mais informações sobre a segurança da Foxit, acesse a Central de Segurança da Foxit.

Apêndice A

Uma lista detalhada das categorias compatíveis com o Smart Redact

Nome do código País Observação
Pessoa Todas (PII)
Organização Todas (PII)
Tipo de pessoa Todas (PII)
Endereço Todas (PII)
CEP Todas (PII) Os primeiros três dígitos de um CEP
Localização Todas (PII) Localização - Tudo inclui nomes como cidades, países, regiões, estados, estruturas artificiais e localizações geográficas, como rios, mares e desertos.
E-mail Todas (PII)
Fax Todas (PII)
Data/Hora Todas (PII)
Temperatura Todas (PII)
Moeda Todas (PII)
Idade Todas (PII)
Porcentagem Todas (PII)
Número do Cartão de Crédito Todas (PII)
Número de Conta Bancária Internacional Todas (PII) IBAN
Gênero Todas (PII) Termos que revelam o gênero da pessoa, por exemplo, masculino, feminino, mulher, senhor ou senhora.
Código SWIFT Todas
URL de Mídia Social Todas (PII) Oferece suporte à detecção de contas de redes sociais:
* Nome de usuário do Twitter
* Nome de usuário do Facebook
* Conta do YouTube
* Conta do Vimeo
* Nome de usuário do Instagram
* URL do LinkedIn
* Nome de usuário do Pinterest
Etnia Todas (PII) Exemplos: "Africano", "Asiático", "Europeu", "Nativo Americano", "Nativo da Oceania"
Religião Todas (PII) Exemplo: "Judeu", "Católico"
Orientação sexual Todas (PII) Exemplo: "bissexual", "homossexual", "heterossexual"
Afiliação política Todas (PII) Exemplo: "Partido Democrata (Estados Unidos)" ou "Partido Republicano (Estados Unidos)"
Código do país Todas (PII) Exemplo: +591, +886
Idioma Todas (PII) Exemplo: Inglês, francês
Ocupação Todas (PII) Exemplo: Cientista, Médico
Tipo sanguíneo Todas (PII) p. ex.: A, B, AB, O
Estado civil Todas (PII) p. ex.: Casado(a), Solteiro(a), Divorciado(a)
IP Todas (PII) Endereços de rede IPv4 e IPv6. Exemplo: 168.131.1.1 e 21DA:D3:0:2F3B:2AA:FF:FE28:9C5A
Número de Roteamento ABA EUA (PII)
Número de Telefone nos EUA EUA (PII)
Número de Identificação do Contribuinte Individual dos EUA EUA (PII)
Número de Seguro Social dos EUA EUA (PII)
Número da Carteira de Habilitação dos EUA EUA (PII)
Número do Passaporte dos EUA/Reino Unido EUA e Reino Unido (PII) Cognição sensível ao contexto. Requer texto do número do passaporte em torno dos números.
Número da Conta Bancária nos EUA EUA (PII)
N.° de Roteamento ACH EUA (PII) Número da Câmara de Liquidação Automática
Seguradora EUA (PII)
ID de Membro EUA (PII) Número de ID do segurado
ID de Grupo EUA Número do grupo de seguro
N.° da Carteira de Habilitação Australiana Austrália (PII) Número do grupo de seguro
Número do Passaporte Australiano Austrália (PII) Número do grupo de seguro
N.° Comercial Australiano Austrália (PII) Número Comercial Australiano
Código da Agência Bancária da Austrália Austrália (PII) Código da Agência Bancária Estadual
N.° de telefone AUSTRÁLIA Austrália (PII)
N.° de Ref. do Cliente Austrália (PII) Um CRN tem 9 números e termina com uma letra. Por exemplo: 123 456 789A.
N.° de Arquivo de Imposto Austrália (PII) O número de arquivo de imposto (TFN) é gratuito e identifica o usuário para fins fiscais e de aposentadoria.
N.° da Carteira de Habilitação do Reino Unido Reino Unido (PII) Número da Carteira de Habilitação do Reino Unido
N.° do Índice de Saúde Comunitária Reino Unido (PII) Número do Índice de Saúde Comunitária (CHI), por exemplo, 0911640250
Número de Identificação do Sistema de Saúde do Reino Unido Reino Unido (PII) Número do Sistema de Saúde do Reino Unido (NHS)
N.° do seguro Nacional Reino Unido (PII) Número do Seguro Nacional
Número de Identificação do Sistema de Saúde do Reino Unido Reino Unido (PII) Número do Sistema de Saúde do Reino Unido
N° de Telefone do Reino Unido Reino Unido (PII) Número de Telefone do Reino Unido
N.° do Exame Todas Exame (PHI); procedimentos e testes diagnósticos, incluindo sinais vitais e medidas corporais
Diagnóstico Todas Diagnóstico (PHI); doença, síndrome, envenenamento
Sintoma ou Sinais Todas Sintoma (PHI); evidência subjetiva ou objetiva de doença ou outros diagnósticos
Nome do Tratamento Todas Tratamento (PHI); procedimentos terapêuticos
Alérgeno Todas Alérgeno (PHI); um antígeno que desencadeia uma reação alérgica
Curso Todas Curso (PHI); descrição de uma mudança em outra entidade ao longo do tempo, como progressão de uma condição, um curso de tratamento ou medicação
Valor de Medição Todas Valor de medição (PHI); o valor relacionado a um exame ou a uma medição de condição médica
Variante Todas Variante (PHI); todas as menções a variações e mutações genéticas
Gene Ou Proteína Todas Gene/Proteína (PHI); todas as menções a nomes e símbolos de genes humanos, bem como cromossomos e partes de cromossomos e proteínas
Tipo de Mutação Todas Tipo de mutação (PHI); descrição da mutação, incluindo seu tipo, efeito e localização
Expressão Todas Expressão (PHI); nível de expressão gênica
Evento Administrativo Todas Evento Administrativo (PHI); eventos relacionados ao sistema de saúde, mas de natureza administrativa/semiadministrativa
Ambiente de Cuidado Todas Ambiente de cuidado (PHI); um ambiente ou local onde os pacientes recebem cuidados
Qualificador de Condição Todas Qualificador de condição (PHI); termos qualitativos usados para descrever uma condição médica
Nome do Medicamento Todas Nome do medicamento (PHI); menções a medicamentos, incluindo nomes de marcas protegidas por direitos autorais e nomes não comerciais
Posologia Todas Posologia (PHI); quantidade de medicamento prescrito
Relação Familiar Todas Relação familiar (PHI); menções de parentes da pessoa
Estrutura Corporal Todas Estrutura corporal (PHI); sistemas corporais, localizações ou regiões anatômicas e partes do corpo
Direção Todas Direção (PHI); termos direcionais que podem estar relacionados a uma estrutura corporal, condição médica, exame ou tratamento
Frequência Todas Frequência (PHI); descreve com que frequência uma condição médica, exame, tratamento ou medicamento ocorreu, ocorre ou deveria ocorrer
Hora Todas Hora (PHI); termos temporais relacionados ao início e/ou à duração de uma condição médica, exame, tratamento, medicamento ou evento administrativo
Unidade de Medição Todas Valor de medição (PHI); o valor relacionado a um exame ou a uma medição de condição médica
Operador Relacional Todas Operador relacional (PHI); frases que expressam a relação quantitativa entre uma entidade e alguma informação adicional
Profissional da Saúde Todas Profissional da saúde (PHI); um profissional de saúde licenciado ou não
Escala de Condição Todas Escala de condição (PHI); termos qualitativos que caracterizam a condição por meio de uma escala, que é uma lista ordenada finita de valores
Classe de Medicação Todas Classe de medicação (PHI); um conjunto de medicamentos com mecanismo de ação semelhante, modo de ação relacionado, estrutura química semelhante e/ou que são usados para tratar a mesma doença
Forma da Medicação Todas Forma da medicação (PHI); a forma do medicamento
Via da Medicação Todas Via medicamentosa (PHI); o método de administração do medicamento