MINISTÉRIO DO DESENVOLVIMENTO, INDÚSTRIA E COMÉRCIO EXTERIOR INSTITUTO NACIONAL DA PROPRIEDADE INDUSTRIAL DIRETORIA DE PATENTES, PROGRAMAS DE COMPUTADOR E TOPOGRAFIAS DE CIRCUITOS INTEGRADOS - DIRPA Saneamento da base de dados de Patentes do INPI Relatório Executivo Grupo de trabalho de saneamento da base de patentes Instituído pelas Portarias INPI/PR nº 112/17 de 07 de julho de 2017; INPI/PR nº 185/17 de 13 de outubro de 2017 e INPI/PR nº 190/17 de 25 de outubro de 2017 Maio de 2018 Instituto Nacional da Propriedade Industrial – INPI Presidente: Luiz Otávio Pimentel Membros do Grupo de Trabalho Membro do GT/SANEA Alexandre Gomes Ciâncio Andre Felippe Severino Evanildo Vieira dos Santos Flávia Romano Villa Verde Leandro da Silva Rodrigues Jaime Neiva Miranda Souza Priscila Rohem dos Santos Marcus Vinicius da Motta Vieira Ricardo Neves da Motta Lotação DIRPA/Gab CEPIT/DIESP CGDI/ACAD/BIBLI CEPIT/DIDOC CGPCT/DNPCT CGTI/DIAPE CEPIT/DIESP CGT/DISIS CEPIT/DISAP Inclusão no GT Portaria INPI/PR nº 112 de 07 de julho de 2017 Portaria INPI/PR nº 185 de 13 de outubro de 2017 Portaria INPI/PR nº 185 de 13 de outubro de 2017 Portaria INPI/PR nº 112 de 07 de julho de 2017 Portaria INPI/PR nº 185 de 13 de outubro de 2017 Portaria INPI/PR nº 112 de 07 de julho de 2017 e Portaria INPI/PR nº 190 de 25 de outubro 2017 Portaria INPI/PR nº 112 de 07 de julho de 2017 Portaria INPI/PR nº 185 de 13 de outubro de 2017 Portaria INPI/PR nº 112 de 07 de julho de 2017 i Instituto Nacional da Propriedade Industrial – INPI Presidente: Luiz Otávio Pimentel Assinatura dos membros do Grupo de Trabalho ii Agradecimentos pelo auxílio nas ações do GT Alexandre Godinho Silva (Verificação reclassificação automática) Alexandre Lopes Lourenço (CEPIT) Alexandre Dantas Rodrigues (Verificação reclassificação automática) Bernardo Henrique Todt Seelig (Verificação reclassificação automática) Bruna dos Santos Soares (Digitalização das RPIs) Camilo Braga Gomes (Classificação) Carlos Augusto Miranda Pereira (Pedidos divididos) Carlos Henrique de Castro Ribeiro (Auditoria – cadastro automático) Catia Valdman (Ação - Classificação) Cristina D’urso de Souza Mendes Santos (CEPIT) Daniel Marques Golodne (Verificação reclassificação automática) Daniel Osmidio Souza Martins (Retificação dos pedidos com carta patente já emitida) Debora Shimba Carneiro Varela (Verificação reclassificação automática) Edson Braga (Análise de imagens e escolha do que será ocultado no SINPI) Elias Lawrence Marques (Verificação reclassificação automática) Fernando Cavalcante Pinheiro da CGOF (Financeiro - cadastro automático) Flavia Elias Trigueiro (Verificação reclassificação automática) Gilson da Silva (Verificação reclassificação automática) José Carlos Messias (Revista Eletrônica da Propriedade Industrial) Juliana Samara da S. Paes (Planilha dos microfilmes) Júlio Cesar Castelo Branco Reis Moreira (DIRPA) Katia Cristina Pinheiro Lima (Financeiro – cadastro automático) Lúcia Aparecida Mendonça (Verificação reclassificação automática) Moacir José Diniz (Análise de imagens e escolha do que será ocultado no SINPI) Núbia Gabriela Benicio Chedid (Verificação reclassificação automática) Oscar Paulo Bueno (Retificação dos pedidos com carta patente já emitida) Paulo Cesar Vianna (Análise de imagens e escolha do que será ocultado no SINPI) Paulo Roberto Secundino Peixoto (Cadastro protocolo) Paulo Silva (Microfilmes) Pedro Jose de Oliveira Lagedo (CEPIT) Hauan Fernandes de Lima (Preparo das RPIs para digitalização) Rafael Nunes (CGTI) Raquel Soares Magnago da Mata (Controle de qualidade das RPIs) Renata Maria de Lima Rodrigues (Análise da lista com divergência: WO PCT) Ricardo Iorio Garcia (Verificação reclassificação automática) Roberto Elídio Pacheco (Digitação de nosso numero) Romi Lamb Machado (Verificação reclassificação automática) Rômulo Rangel (FlexDoc – Digitalização RPIs) Sabrina da Silva Santos Gandara (Análise PCT e pipelines) Sandra Toshico Tahara (CDs de listagem de sequências) Sérgio Bernardo (Verificação reclassificação automática) Sheila Kilins Ghert (Publicação antecipada) Simone Carvalho Rufino (Verificação reclassificação automática) Thompson Fernandes dos Santos (Análise da lista com divergência: WO PCT) Tiana Gonçalves (Análise da lista com divergência WO PCT) Ulisses da Silva Martins da CGLI (Cadastro automático) Victor Emanuel S. de Almeida (Planilha dos microfilmes) Victor Genu Faria (Verificação reclassificação automática) Viviane Gomes Almeida (Verificação reclassificação automática) Vivianne Cardoso Banasiak (Verificação reclassificação automática) iii Sumário 1 Introdução.................................................................................................................................. 1 2 Planejamento: Determinar as Ações Corretivas ........................................................................ 2 3 Execução das Ações Corretivas .................................................................................................. 3 3.1 Correções associadas ao saneamento de imagens (Caso 1) .............................................. 3 3.2 Correções no Campo classificação (Caso 2) ....................................................................... 8 3.3 Correções necessárias no Campo numeração PCT e numeração WO (Caso 3) ............... 12 3.4 Digitalização das RPIs (Caso 4) ......................................................................................... 15 3.5 Pedidos Pipeline (Caso 5) ................................................................................................. 17 3.6 Pedidos Divididos (Caso 6) ............................................................................................... 19 3.7 Elaboração de regras para publicação antecipada: despacho 3.2 (Caso 7) ..................... 22 3.8 Pedidos sem título (Caso 8).............................................................................................. 23 3.9 Microfilmes (Caso 9)......................................................................................................... 24 3.10 CDs com listagem de sequências (caso 10)...................................................................... 24 3.11 Inserção na base de dados de pedidos no período 1972 – 1982 (caso 11) ..................... 25 4 Apêndice 1: Cadastro automático do PAG............................................................................... 26 5 Apêndice 2: Pedidos pipeline ................................................................................................... 51 6 Apêndice 3: Pedidos divididos.................................................................................................. 53 iv 1 Introdução O grupo de trabalho de saneamento (GT) foi estabelecido pela Portaria INPI/PR nº 112 de 07 de julho de 2017. O GT foi inicialmente composto por Flávia Romano Villa Verde (coordenadora), Priscila Rohem dos Santos, Jaime Neiva Miranda Souza, Ricardo Neves da Motta e Alexandre Gomes Ciâncio. Esta equipe reuniu-se pela primeira vez formalmente em 12 de julho de 2017, após a publicação da portaria no Boletim de Pessoal. Nesta reunião foram definidas as primeiras ações a serem executadas no projeto de saneamento. Alguns dos pontos elencados decorrem de resultados encontrados pelo primeiro grupo de trabalho, encerrado em 05 de maio de 2017, do qual participavam alguns dos membros deste grupo. O GT teve ainda portaria adicional (INPI/PR nº 185) para adição de membros em 13 de outubro de 2017, a qual teve o adendo na Portaria INPI/PR nº 190 de 25 de outubro 2017 e que formalizou a inclusão dos demais membros deste GT, André Felippe Severino, Evanildo Vieira dos Santos, Leandro da Silva Rodrigues e Marcus Vinicius da Motta Vieira. Foi definido na ocasião da primeira reunião que o primeiro documento do GT conteria uma proposta de cronograma e distribuição de tarefas entre os membros do grupo na forma de termo de abertura de projeto e que a comunicação entre os membros seria por e-mail e caso houvesse necessidade de formalização, esta seria feita por meio de e-mails e/ou memorandos às áreas externas ao GT. O objetivo do trabalho deste Grupo é elaborar e executar projeto de saneamento do banco de patentes do INPI. As ações corretivas que dependam de apoio de outras áreas da DIRPA deverão ser a estas comunicadas pelo GT. O saneamento das bases de dados patentes consiste na análise de campos de indexação da base de patentes, tanto para dados cadastrais como também para as imagens de um pedido, de forma a identificar regras para realizar correções em lote. Além das correções; as análises feitas pelo GT pretendem identificar as fontes causadoras das divergências nos sistemas do INPI, evitando o cadastramento de dados em formatos que estão em desacordo com os padrões estabelecidos, garantindo a disponibilização das informações (dados cadastrais e imagens). O GT busca identificar formas de correção em lote para os pontos analisados. A verificação manual é mantida apenas para uma amostragem para que se demonstre a viabilidade de aplicação das regras em escala. Eventuais falhas cometidas pela execução em lote poderão ser corrigidas, uma vez que as informações não serão removidas da base. Cabe ressaltar que o GT coordena a digitalização e geração de OCR (Optical Character Recognition) das RPIs disponíveis apenas em papel. Todos os arquivos e tabelas gerados utilizados nas verificações e consultas foram salvos em pasta de rede e estão disponibilizados como documentação final deste GT. 1 2 Planejamento: Determinar as Ações Corretivas O GT desmembrou suas ações de saneamento em casos para facilitar o entendimento das análises executadas e do tipo de problema resolvido.  Caso 1: Disponibilizar imagens vinculadas a publicações e/ou petições de um pedido na base de BuscaWeb o Imagens de publicação não exibidas por falta de informações no seu cadastro no SINPI o Imagens em duplicidade o Imagens sem protocolo PAG  Cadastro das GRPIs no sistema PAG  Necessidade de digitação manual do “nosso número” a partir da guia  Aviso de recebimento (AR) – envio postal  Guias via SIAFI  Conversão de Folheto em formato TIFF para PDF com OCR  Caso 2: Campo classificação o Símbolos de classificação não reconhecidos (antigos ou inválidos) ou não cadastrados no SINPI o Reclassificações em lote (informações da Derwent)  Caso 3: Campos numeração PCT e numeração WO o Formatação das numerações o Campos: Datas PCT e WO  Caso 4: Digitalização das RPIs  Caso 5: Pedidos Pipeline  Caso 6: Pedidos Divididos o Identificar os despachos do pedido mãe o Correção das informações trazidas em consulta a pedidos divididos pelo SINPI  Caso 7: Regras de negócio para publicação antecipada  Caso 8: Pedidos sem título e pedidos que não constavam na base  Caso 9: Microfilmes o Inventário das caixas de microfilme  Caso 10: Pedidos cadastrados no Sisbiolist  Caso 11: Inserção na base de dados de pedidos no período 1972 – 1982 2 3 Execução das Ações Corretivas Nessa seção estão detalhadas as ações realizadas pelo GT, como também são apontadas sugestões para ações de saneamento futuras. 3.1 Correções associadas ao saneamento de imagens (Caso 1) Problema Foram identificadas diferentes situações para a não disponibilização de imagens no portal. As razões residem, por exemplo, na existência de mais de uma imagem para uma publicação/petição, na falta de indexação no SINPI de informações pertinentes a imagem decorrentes de publicações, e do não cadastramento de protocolo no sistema PAG para imagens de petições. Objetivo Buscar soluções que devem ser aplicadas em lote para os casos em que os requisitos mínimos para exibição das imagens no portal não são atendidos, minimizando a necessidade de nova digitalização. Solução Proposta O saneamento das imagens foi desmembrado em seis consultas, sendo quatro pertinentes às imagens de publicações e duas a imagens de petições:  Consulta 1 - erro ou falta de indexação de informações associadas a uma publicação;  Consulta 2 - imagem não é exibida quando há mais de um despacho por RPI para um pedido;  Consulta 3 - imagens de petição em duplicidade;  Consulta 4 - imagens de publicação em duplicidade;  Consulta 5 - imagens de petições sem protocolo no sistema PAG; e  Consulta 6 - imagens de folhetos não são carregadas por completo para visualização no portal. Consulta 1: Erro ou falta de indexação de informações associadas a uma imagem de publicação Para exibição de imagens referentes a publicações no BuscaWeb, foram corrigidos aproximadamente 7.000 pareceres, cujo tipo de imagem estava indexado como um arquivo com a denominação “patente” e não como “parecer_patente”, condição necessária para disponibilização da imagem. Além disso, o preenchimento de código de despacho referente a 24.917 imagens de pareceres, cuja informação não estava cadastrada na tabela de imagens. Situação: Finalizado. 3 Consulta 2: Imagem não é exibida quando da existência de mais de um despacho por RPI para um mesmo pedido e existe apenas única imagem vinculada aos despachos Foram encontradas 797 imagens, cujo código de despacho teve de ser identificado manualmente, pois, havia mais de um despacho para uma única imagem, devido à falha na digitalização, que digitalizou em bloco petições diferentes. A ação foi executada da seguinte maneira: abrindo-se os arquivos de imagens e identificando as páginas pertinentes a cada despacho. Cabe ressaltar que, quando os despachos eram referentes à alteração do nome e alteração da sede, estes foram feitos juntos, pois, não foi possível desmembrar a imagem. Para estes casos, a imagem foi indexada ao despacho de alteração de nome. Situação: Finalizado. Consulta 3: Imagens de petições em duplicidade Aproximadamente 124.000 petições duplicadas para um mesmo processo (petição com mais de uma imagem). Essas petições não ficam disponíveis no BuscaWeb (portal) pelo fato de o sistema não conseguir determinar qual imagem deve ser mostrada. Para identificar regras para correção em lote destas duplicidades foram separados os pedidos com um único protocolo. Essa crítica gerou uma nova amostra que totalizou 95.484 petições (ou protocolos). Desta amostra foram analisados aqueles cujas imagens tinham: i) o mesmo número de páginas; ii) com variação de uma página ou iii) com variação de duas páginas, totalizando 71.902 protocolos. A Figura 1 ilustra o procedimento realizado. Figura 1: Separação das imagens para identificar regras para correção em lote 4 Como a quantidade petições para a verificação das regras identificadas era da ordem de 70.000 seguiu a técnica de amostragem. Para as imagens de petições com o mesmo número de páginas e mesma data de “registro na base”, identificou-se a regra de escolher qualquer uma das imagens para disponibilizar no BuscaWeb. Para petições com datas distintas de “registro na base” e com mesmo número de páginas foi verificada regra para manter as mais recentes. Para petições onde a quantidade de páginas difere por uma ou duas optou-se por disponibilizar no BuscaWeb a imagem com maior número de páginas independente da data de registro na base. Aplicando as regras supracitadas foram ocultadas 71.902 imagens para eliminar duplicidades. Na maior parte dos casos foram ocultadas as imagens com data registro mais antiga. Para as imagens restantes (cerca de 50.000), em que não foi possível estabelecer regras para ocultá-las, foram disponibilizadas três pessoas da DISAP para realizar o saneamento manual. Cabe ressaltar que o GT verificou o estado dos processos para estabelecer prioridades de verificação de imagens: i) pedido aguardando ou em exame técnico (ET01, ET02); ii) sub judice; e iii) pedidos PP (pipeline). Para estes estados foram identificados 20.686 processos. Até meados de maio de 2018 já foram verificados 7.721 processos, o que representa 37% do total de processos priorizados para serem analisados manualmente. Situação: Finalizado para os que tiveram regra determinada. O trabalho está em andamento para as imagens com necessidade de verificação manual com previsão de conclusão pela DISAP até o final de 2018. Consulta 4: Imagens de publicação em duplicidade As publicações que apresentaram duplicidade de imagem e tiveram arquivos carregados pelo sistema e-parecer. O GT definiu a regra para ocultar imagens que não foram enviadas pelo eparecer, disponibilizando 2.000 publicações no BuscaWeb. Situação: Finalizado. Consulta 5: Imagens de petições sem protocolo no sistema PAG O cadastramento de protocolos relógio (GRPIs) no sistema PAG é necessário, uma vez que somente imagens de petições protocoladas no PAG são exibidas no BuscaWeb. O INPI definiu procedimento manual para gerar protocolo de GRPI no sistema PAG. Nesse procedimento, é necessário acessar o sistema PAG e utilizar uma tela para digitar o número do 5 pedido, o número do protocolo relógio, os números das guias e o tipo de serviço, além de visualizar a imagem e fazer diversas consultas ao sistema PAG para evitar duplicações. O GT ciente da necessidade de disponibilizar as imagens ao público externo analisou as informações disponíveis no SINPI e que não estavam cadastradas no PAG, de forma a verificar se a automação deste procedimento seria possível. O GT identificou que as informações contidas no SINPI permitiriam a automação de gerar protocolos no sistema PAG. O GT realizou estimou a quantidade de protocolos que poderiam ser gerados com base nas informações cadastradas no SINPI. O GT identificou no SINPI cadastros sem o número da guia ou do AR. Foi feita, assim, uma etapa de digitação manual do “nosso número” e do AR a partir da imagem do processo. Foram recuperados 5.352 valores de guias e 1.270 números de AR. Para o GT verificar se a execução em lote afetaria áreas de protocolo e pagamento foi feita consulta a diversas áreas do INPI. Assim, o GT entrou em contato com os setores Financeiro e de Protocolo, bem como com a Auditoria. O procedimento de automação foi explicado às áreas e não foram detectados problemas de ser realizado em lote, contudo foi estabelecido que seria oportuno redigir uma nota técnica que deveria ser submetida à Presidência do INPI e à Diretoria de Patentes de forma a registrar todo o procedimento. O Grupo encaminhou a nota técnica (NT) ao Presidente do INPI, Sr Luiz Otávio Pimentel pelo processo 52400028489/2018-11, e apresentou o conteúdo da NT ao Sr. Presidente em 16 de fevereiro de 2018. Uma cópia do processo relativo à NT assinada com o “de acordo” do Presidente do INPI e Diretor de Patentes está no Apêndice 1. O GT visando facilitar a rastreabilidade ao procedimento automático definiu que não seriam utilizados “usuários de sistema”, pois, esses poderiam ser utilizados em outras ações da CGTI, assim, ficou acordado que o procedimento ficaria registrado no PAG com nome de usuário do coordenador do GT e acompanhado da mensagem de cadastro automático. Após a execução da rotina de automação foram migrados para o PAG:  1.272.076 protocolos-relógio com um total de 1.272.172 guias associadas (sendo que 482.602 são GRPIs); e  80.501 protocolo-relógio não puderam ser inseridos por falta de informações no SINPI. Não foi possível fazer a migração dos seguintes casos:  57.566 guias cujo protocolo-relógio ultrapassou o limite das 9 possibilidades numéricas de protocolo PAG;  1.603 guias cujo protocolo-relógio está vazio ou é igual à zero;  107 guias cuja AR está cadastrada no PAG para outro processo;  4 guias cuja AR é posterior a 2016; e  7 guias cujo protocolo-relógio está vazio ou é anterior a 1970. 6 Além disso, foi possível indexar 167.089 imagens de petições (e de depósitos) do Storage:  142.274 imagens foram indexadas com número de protocolo, número de GRPI e serviço (200, 848 ou 849);  24.815 imagens em bloco foram indexadas com número de protocolo, número de GRPI e serviço 200. Cabe observar que o GT está em contato com a CGTI para definir procedimento manual a ser efetuado nos casos em que não foi possível fazer a migração dos dados de forma automática. Situação: Finalizado. Consulta 6: Imagens de folhetos não são carregadas por completo para visualização no portal O GT identificou que parte dos folhetos não eram disponibilizados por completo no BuscaWeb, uma vez que somente a folha de rosto do pedido era acessada pelo usuário. Analisando a falha, o GT detectou erro no sistema que realiza a conversão em tempo real de arquivos Multi-TIFF em PDF. O sistema identificava apenas a primeira página dos arquivos salvos nesse formato e a convertia para PDF. Assim, foram feitas alterações no sistema para viabilizar a conversão por completo em PDF destes documentos. Após a implantação da solução anterior, o GT verificou que a capacidade de processamento disponibilizada para a conversão dos arquivos TIFF e Multi-TIFF não era suficiente, incapacitando o uso deste sistema pelos usuários externos e internos do INPI. Deste modo, foi feito um ajuste no processamento para permitir a visualização em PDF do arquivo. O ajuste no processamento é uma solução paliativa, pois o aumento dos recursos computacionais para a conversão dos arquivos TIFF e Multi-TIFF acarreta em um desperdício quando não utilizado, uma vez que é necessário disponibilizar uma quantidade de recursos acima do valor médio utilizado. Como forma de solucionar este problema de forma definitiva, está sendo feita a conversão de cerca de 402.000 folhetos dos arquivos em formato TIFF e Multi-TIFF para PDF e está sendo incluída uma camada de OCR. Situação: A correção do sistema de conversão e leitura dos arquivos TIFF e o aumento de carga para processamento estão finalizados. A conversão dos arquivos TIFF em PDF com OCR está em andamento (77% do total já executado até 08/05/2018). Situação atual global do saneamento de imagens Em linhas gerais a Erro! Fonte de referência não encontrada. apresenta o quantitativo de imagens disponibilizadas no portal levando em conta as ações finalizadas pelo GT. 7 Disponibilização de Número imagens aproximado Ação executada Consulta 1 32.000 Erro ou falta de indexação de informações associadas a uma imagem de publicação Imagem não é exibida quando da existência de mais Consulta 2 800 de um despacho por RPI para um mesmo pedido e existe apenas única imagem vinculada aos despachos Consulta 3 71.900 Imagens de petições em duplicidade Consulta 4 2.000 Imagens de publicação em duplicidade Consulta 5 167.000 Imagens de petições sem protocolo no sistema PAG Consulta 6 80.000 Conversão de formato TIFF para o formato pdf Total 353.700 Imagens disponibilizadas no Portal Tabela 1– Número de imagens disponibilizadas para as etapas concluídas do saneamento de imagem. 3.2 Correções no Campo classificação (Caso 2) Problema Foram identificadas inconsistências que dificultam a recuperação de pedidos de patente quando buscados com base na classificação de patentes. Objetivo Corrigir as inconsistências no campo classificação, a fim de que o conteúdo da base de dados possa ser buscado por de maneira correta. Solução Proposta As correções associadas ao Caso 2, campo classificação, foram desmembradas em cinco consultas:  Consulta 1 – campos e tabelas que guardam informações sobre a IPC;  Consulta 2 – enquadramento da classificação e a natureza do pedido;  Consulta 3 – pedidos PI e MU sem classificação;  Consulta 4 – discordância referente às IPC: SINPI, BuscaWeb e RPI; e  Consulta 5 – pedidos aguardando reclassificação. Consulta 1: Análise dos campos que armazenam as informações pertinentes a Classificação Internacional de Patentes (CIP, na sigla em inglês, IPC) Foram identificadas duas formas de recuperar informações de classificação no SINPI. A primeira é por meio do campo “classificação principal” e a segunda é acessando a tabela “classificação”. Para verificar a consistência das informações que o campo “classificação principal” recupera foram realizados os seguintes testes:  campo “classificação principal” vazio, mas com tabela de classificação preenchida: foram encontrados 206.530 pedidos; e 8  casos com as informações constantes no campo “classificação principal” diferente da ordem 1 da tabela de classificação: foram recuperados 2.823 pedidos. Foi solicitado à CGTI, verificar o motivo da ausência de informações no campo “classificação principal”. O GT de saneamento foi informado que nenhuma rotina atualiza esse campo, e que, portanto, deixou de ser utilizado para carregar dados em sistemas. Em 26 de julho de 2017 o GT de saneamento reuniu-se com os servidores responsáveis por ações relacionadas ao campo classificação do INPI e ficou decidido nessa reunião que o campo “classificação principal” deve ser preenchido com “null”. Esse entendimento foi passado ao Diretor de Patentes autorizou a execução desta ação. Situação: Finalizado. Consulta 2: Enquadramento da classificação indicada no SINPI com a natureza do pedido; e divulgação de classificadores nacionais De forma a aferir se a classificação indexada na base para um pedido era adequada a sua natureza foram realizadas duas verificações:  Pedidos PI e MU que possuíam classificação diferente da IPC; e  Pedidos DI e MI que foram indexados na base com a IPC. No que se refere à primeira verificação nenhum registro foi encontrado. Por outro lado, foram identificados 212 documentos na segunda verificação. Assim, o GT contatou a área de Desenho Industrial para que as informações cadastradas na base possam ser corrigidas. Não temos informações sobre o andamento dessas correções no momento. Em 26 de julho de 2017 ficou acordado em reunião com servidores área de Desenho Industrial que os folhetos destes pedidos deveriam ser abertos e as suas classificações anotadas para correção dos dados na base. O Diretor de Patentes pediu que fossem apagados os registros de IPC inseridos como classificação de MI, natureza de patente que deixou de existir com a LPI, e pelo fato da classificação mais adequada no momento ser a de Locarno. Assim, com o “de acordo” do Diretor foram retiradas tanto do SINPI quanto do BuscaWeb em 18/10/2017 as informações de IPC para Modelos Industriais. Dada a necessidade de dar publicidade à informação foram carregados no Portal do INPI os manuais de Classificação Nacional (antiga dos MI e DI). Na página http://www.inpi.gov.br/menuservicos/patente/classificacao-de-patentes foi inserido o texto a seguir: A Lei nº 5.772, de 21 de dezembro de 1971 (Código da Propriedade Industrial), revogada pela Lei nº 9.279, de 14 de maio de 1996, permitia também a concessão de privilégios de Modelos Industriais (MI). 9 Os pedidos de MI eram classificados, primeiramente, com a Classificação Nacional, a qual era desmembrada, hierarquicamente, em: Grupos - Classes Subclasses. Essa classificação foi substituída pela Classificação de Modelos de Utilidade e Desenhos Industriais, que categorizava os pedidos em classessubclasses. Para realização de buscas utilizando estas classificações, deve-se inserir a classificação desejada no campo (51) - Classificação IPC da ferramenta de busca em patentes no Portal do INPI (https://gru.inpi.gov.br/pePI/jsp/patentes/PatenteSearchAvancado.jsp). No caso de DI, portanto, serão paulatinamente inseridos na base pela Divisão responsável (DIRMA). Evidencia-se a inexistência de recursos humanos disponíveis na área de DI para execução desse trabalho no momento. Situação: Finalizado DIRPA e aguardando DIRMA em relação à base de DI. Consulta 3. Pedidos PI e MU sem classificação indexada na base A verificação no que diz respeito à falta de classificação indicada no SINPI foi feita consulta para a numeração antiga de pedidos (PI e MU) e nova separadamente. Para a formatação de numeração de pedidos de patente vigente até 2011, foram identificados 3.791 registros sem classificação no SINPI com imagem de folheto, sendo que 368 destes apresentavam duas imagens. Assim, 4.159 imagens foram verificadas manualmente e suas classificações foram anotadas. O GT realizou verificação para identificar se estes símbolos anotados manualmente de IPC eram aceitos no SINPI. A Tabela 2, a seguir lista o resultado da consulta. Quantidade 2.024 97 8 1.635 172 62 161 Tabela 2: Consulta na base do INPI sobre registro da Classificação Classificação Principal Classificações Secundárias Símbolo encontrado e válido Símbolo encontrado e válido Símbolo encontrado e válido Alguma classificação secundária inexistente ou inválida Não foi possível ler a classificação no folheto Não foi possível ler a classificação no folheto Símbolo não encontrado no SINPI Sem IPC secundária Símbolo encontrado no SINPI para uma IPC antiga Sem IPC secundária Símbolo não encontrado no SINPI Símbolo encontrado e válido Símbolo não encontrado no SINPI Símbolo não encontrado no SINPI Reunidos em 26 de julho de 2017 ficou acordado que o GT iria verificar se todos os símbolos da IPC existentes na OMPI (Organização Mundial de Propriedade Industrial) estavam cadastrados no SINPI. Foram identificados 70.623 IPCs não cadastradas na base e 3.182 IPCs que estavam indexadas como versão 2006, contudo, eram de versões anteriores. Após essa verificação foi realizada a inserção de todas de IPCs e correções das versões indicadas no SINPI. 10 Com a inserção destes símbolos da IPC no SINPI restaram 27 pedidos da Tabela 2 com classificação que não foi lida ou que era inválida. Deve-se ressaltar que cerca de 2.000 pedidos passariam por alteração de classificação uma vez que os símbolos da IPC para o pedido não são mais válidos. Para os pedidos que recaíram em reclassificação o GT buscou informações da IPC na Derwent. O Diretor aprovou inserir as IPC ativas recuperadas da Derwent para estes pedidos. Para estes casos não foi publicado o despacho 15.11 – Alteração de Classificação. Situação: Finalizado. Consulta 4. Discordância de informações referentes às IPC apresentadas no SINPI, BuscaWeb e RPI Foram identificados 820 pedidos com divergência de informação de IPC no SINPI, BuscaWEB e RPI. Assim, para eliminar essas discordâncias ficou acordado que seria programada a publicação despachos 15.11, pela CGTI. Os 820 despachos foram publicados na RPI 2436 de 12 de setembro de 2017, e que o despacho teria como referência as informações constantes no SINPI, pois é a ferramenta utilizada pelos pesquisadores/examinadores para realizar a reclassificação. Essa ação foi discutida em reunião no dia 26 de julho de 2017, com os servidores que acompanham a Classificação na DIRPA e passou pela aprovação do Diretor de Patentes. Situação: Finalizado. Consulta 5. Pedidos que devem ser reclassificados O GT de saneamento buscou solução para reclassificar de pedidos em lote, uma vez que cerca de 50.000 pedidos se enquadra nessa situação. A solução proposta pelo grupo era de buscar a classificação atualizada destes pedidos (em situação de reclassificar) em bases pagas às quais o INPI tem acesso. A base Derwent foi utilizada para esse procedimento, uma vez que apresenta um banco de dados de patente bastante consolidado e o INPI possui senhas com perfil que permite para baixar grande volume de dados. Foram recuperadas classificações de cerca de 40.000 processos. O GT consultou os servidores da DIRPA que acompanham alterações no campo Classificação para verificar qual o melhor procedimento a ser adotado para realizar a reclassificação de forma automática. O entendimento é que seria melhor usar as CPCs dos pedidos disponíveis na Derwent e utilizar a tabela de conversão de CPC para IPC para gerar a IPC da reclassificação automática. O GT acatou esse entendimento e este procedimento foi passado para o Diretor de Patentes. O GT realizou a publicação das reclassificações em lote nas RPIs 2463 e 2464 do mês de março de 2018. Esta ação possibilitou a atualização de IPC para cerca de 30.000 processos. Em seguida, foi necessária uma “ação corretiva”, uma vez que está ação movimentou pedidos que estavam na fila do exame para outra fila por alterar a ordem da IPC principal. Para isso a lista 11 destes pedidos foi repassada ao coordenador da CEPIT que a encaminhou aos chefes de Divisão da DIRPA para que eles checassem a solução proposta com inversão de ordem das IPC de modo a que os pedidos voltassem à carga da mesma divisão de exame técnico. Para a “ação corretiva” foi definido que os pedidos aguardando ou em exame (ET01 e ET02) seriam avaliados em relação à necessidade de re-reclassificação para retorno às cargas das divisões técnicas de exame da DIRPA, assim 477 despachos 15.11 foram agendados em 08 de maio de 2018. A lista dos pedidos que estavam em situação de reclassificação e não foram abarcados nessa ação em lote foi encaminhada aos responsáveis pela classificação de patentes na DIRPA, Sra. Cátia e ao Sr. Camilo, para análise de regra para reclassificação. Situação: Finalizado. 3.3 Correções necessárias no Campo numeração PCT e numeração WO (Caso 3) Problema Identificou-se que há vários casos em que o número do PCT está incorreto na base, o que pode levar com que seja incorporado o número do WO errado; outra situação é a de ocorrer erros de digitação no cadastramento do número WO e PCT. Informações equivocadas dos pedidos que entraram fazendo uso do PCT pode levar a erros de datas, o que implica em prazos, inclusive de vigência da patente quando concedida. Objetivo Correção das informações referentes aos números WO para evitar erros que impliquem em dificuldade de recuperar informações de um pedido via PCT, assim como erro em prazos de vigência, por exemplo. Solução Proposta As correções associadas ao Caso 3, campos numeração PCT e numeração WO, foram desmembradas em duas consultas. A primeira padroniza a numeração WO e a segunda verifica a relação entre os números WO e PCT cadastrados na base. Consulta 1: Padronização do formato de numeração WO O padrão atual da WIPO para a formatação dos números WO consiste de 2 caracteres para o código de letras WO, acrescentado de 4 dígitos para indicar o ano do depósito WO; e mais 6 dígitos que fazem referência à numeração do pedido, totalizando, assim, 12 caracteres. Portanto, para adequar a base ao padrão atual foram padronizados cerca de 100.000 números de WO. A 12 regra para padronizar a numeração WO de forma automática não pode ser aplicada para todos os pedidos. Para estes casos o GT efetivou o preenchimento da numeração WO manualmente. Situação: Finalizado. Consulta 2: Verificação da relação entre os números WO e PCT Para verificar se os números WO e PCT cadastrados na base estavam relacionados, o GT realizou consulta automática à OMPI com os números PCT disponíveis no SINPI. Nessa consulta foram comparados o número do WO, a data do WO e a data do PCT entre essas duas bases. Os casos onde foi encontrado algum tipo de divergência de informação entre estes três registros eram armazenados em um arquivo junto com o número PCT correspondente. Foram encontrados 7.339 números com divergência de informações. Foi definido que a forma mais segura de proceder à análise dessas divergências era integralmente manual, pois existem vários casos nos quais os pedidos PCT possuem identidade de depositante e inventores e foram protocolados numa mesma data na OMPI. Para essa análise, foi necessário um filtro da listagem de divergência original, pois somente pedidos com a imagem da petição de entrada na fase nacional (código 200) ou, em alguns casos, da petição código 260 (Outras petições) seria possível ter certeza dos dados do pedido depositado a ser comparado com os dados da OMPI. O filtro da listagem original retornou 3.131 pedidos que possuíam imagens no Storage das petições código 200 ou 260 e que começaram a ser analisados manualmente. O procedimento constituiu na consulta dos dados informados nas petições frente aos dados da OMPI num primeiro momento, e posterior comparação da base de dados do SINPI com os dados da OMPI. Por fim, para executar as ações corretivas na base foi verificado o estado do pedido de forma a identificar, por exemplo, se o pedido já foi publicado, se está arquivado ou vigente e assim, definir qual procedimento para a correção da informação. A Figura 2 indica o procedimento adotado para implantar essa consulta pelo GT. Durante a análise manual foram evidenciados pedidos que possuíam divergência ou ausência da classificação IPC sem a publicação de despacho de Alteração de Classificação (15.11), casos que foram informados à área responsável. Cumpre frisar que, devido ao número elevado de pedidos a ser analisado, o servidor destacado pela DNPCT teve sua dedicação ao Grupo de Trabalho elevada durante a duração da portaria. No mês de abril, inclusive, foi solicitada a dedicação exclusiva deste servidor ao Grupo de Trabalho e a inserção de outro servidor nas mesmas condições para que a análise fosse concluída, o que foi aprovado pelo Diretor de Patentes. 13 Figura 2: Resumo metodológico da verificação de números de WO e PCT junto à WIPO Resultado dessa análise:  133 despachos foram agendados (116 do tipo 1.3.1 - republicação e 17 do tipo 1.1.1 – arquivamento definitivo).  580 pedidos sofreram alterações em informações relacionadas ao PCT contemplando 103 números de PCT corrigidos, 264 número de publicação internacional corrigidos, 237 datas de publicação internacional corrigidas e 103 datas de depósito internacional corrigidas.  67 pedidos já possuíam Carta Patente emitida (despacho 16.1 – Concessão de Patente ou Certificado de Adição de Invenção) e a listagem com as alterações a serem efetuadas foram informadas ao Serviço de Expedição de Patentes (SEEXP) para as devidas retificações, que já estão sendo realizadas.  50 pedidos foram renumerados para o número correto, visto que eram oriundos do tratado PCT, mas estavam com numeração de pedido nacional.  478 pedidos sem a publicação 1.1 – Publicação Internacional – PCT. Apresentação de petição de requerimento de Entrada na Fase nacional. Tais pedidos possuem divergências com a OMPI e não tiveram o citado despacho publicado automaticamente pelo Sisad/Anu – Sistema de administração de anuidades. Terão de ser publicados individualmente de forma manual.  50 pedidos tiveram as classificações IPC inseridas.  133 pedidos foram encontrados com IPC diferente da OMPI e foram documentados por divisão técnica para a análise posterior da DIRPA. Estes casos serão avaliados pela CGPCT com conclusão prevista até o final de 2018. Cada caso deve ser analisado separadamente, pois há erros de diversas espécies que geraram a inconsistência nas classificações. Há implicações conforme o status do pedido e as respectivas 14 distribuições principalmente quando envolve as Divisões Técnicas. Não é possível corrigir por sistema, pois os pedidos já tiveram publicações pela DIMINF e os erros persistiram, assim serão corrigidas manualmente. Após a ação corretiva reportada acima, novos problemas foram identificados e corrigidos:  A número de PCT foi erradamente inserido com uma barra o que fez com que a informação fosse mostrada no PDF e no TXT da última revista com uma barra no meio do ano. O número fica correto no BuscaWeb, mas nas revistas saíram errado. o 104 números PCT foram corrigidos. o 10 despachos 1.1.1 corrigindo o INID 86 – Número, Idioma e Data do Depósito Internacional. o 17 despachos 1.3.1 corrigindo o INID 86 - Número, Idioma e Data do Depósito Internacional. Mesmas correções no número do PCT foram adotadas no BuscaWeb.  A alteração na data do PCT, mas não foi alterada a data de depósito para esses casos. o Despachos de 1.1.1 corrigindo o INID 22 – Data do Depósito. o 25 despachos de 1.3.1 corrigindo o INID 22 – Data do Depósito. o 31 pedidos tiveram a alteração feita no SINPI e no Busca sem necessidade de despachos 1.1.1 ou 1.3.1. o Retirado o espaço no meio do número PCT em 2.497 processos (depósito eletrônico). Já foi providenciada a abertura de chamado (Redmine) para corrigir essa inconsistência. Situação: Finalizado (As publicações de retificação e “re-retificação” foram realizadas nas revistas 2468 e 2470, respectivamente). Em correção manual a parte de IPC e a publicação dos despachos 1.1. Sugere-se que os pedidos da lista original que estão sem imagem de petição sejam digitalizados para que a análise seja realizada por eventual novo Grupo de Trabalho. Listagem com esses pedidos foram enviadas à DISAP para que o saneamento seja efetuado. 3.4 Digitalização das RPIs (Caso 4) Objetivo Disponibilizar a maior quantidade de RPI (Patentes) no Portal do INPI em: http://revistas.inpi.gov.br/rpi/. Solução Proposta 15 A partir da RPI (Patentes) 1.598 já estão disponíveis tanto no formato TXT quanto em PDF no Portal do INPI. As RPIs em papel foram desencadernadas para digitalização e OCRização. Tal ação foi feita na ordem decrescentes a partir da última RPI, em formato PDF, disponível no portal. A regra obedecida é a de que as RPIs que existem em duplicidade (cópia física) foram tratadas primeiro. Quando verificada a falta do exemplar no conjunto em duplicidade a RPI passou a ser desencadernada do acervo da biblioteca do INPI. A ação de desencadernamento e encaminhamento dos lotes para a digitalização foi feita com a supervisão do Evanildo Vieira dos Santos, bibliotecário do INPI. O processo de digitalização foi iniciado em 12 de agosto de 2017 com o envio de dois lotes à empresa Flexdoc, que totalizaram 155 revistas (RPI 1250 até 1404) para fins de testes de digitalização/OCR/indexação. Estes lotes foram encaminhados com o objetivo de permitir que o GT determine qual procedimento deve ser adotado para verificação da qualidade do OCR gerado e da possibilidade de migrar informações para o SINPI com a contribuição do membro da CGTI. Houve a identificação de dificuldades no momento de fazer o controle de qualidade à distância, de modo que para resolver esse problema decidiu-se carimbar “em branco” no verso. A dúvida que apareceu era se faltavam páginas no PDF digitalizado, devido à paginação das revistas, bem como problemas no corte das informações quando as margens eram muito estreitas. Essa decisão foi tomada no intuito de agilizar o processo de CQ2. A imagem das revistas são carregadas para pasta REVISTA em \\inpi.gov.br\fileserver\INPI\Compartilhados\FLEXDOC após aprovação em CQ2, para então serem disponibilizadas no portal do INPI. Tendo em vista, a RPI até o número 644 (1983) publicava, em um mesmo volume, a seção de patentes, conjuntamente com a de marcas e de contratos, foi definido que até o número que apresentasse tal condição, a identificação seria da seguinte forma: RPI_INPI_número. Em face das condições do papel RPI 202 até 450, ou seja, 268 revistas, decidiu-se que estas não poderiam ser digitalizadas automaticamente, em virtude o risco de dano ao documento. Desta forma, as ditas RPI permanecem na Biblioteca, para que possam ser inseridas nas atividades de digitalização, no mesmo padrão das patentes antigas, oportunamente. Foram devolvidas as seguintes RPIs que já passaram pelo processo de digitalização: 550-569, 583-650, 652-699, 732786, 794-1011, 1172-1237, 1330-1443, 1455-1473, 1500-1597. Além disso, a resolução da imagem digitalizada para o índice das revistas não permitiu capturar as informações a partir do índice a fim de criar “artefato para interpretação dos dados” advindos das RPIs digitalizadas a fim de abastecer a base do SINPI, assim é preciso usar a revista como um todo e não apenas o índice, o que torna a tarefa complexa. Essa tarefa deve ser planeja no âmbito do PDTI junto à CGTI para planejamento e execução futuros. 16 Situação: Em execução. Até o momento já foram enviados 35 lotes de RPI. Atualmente está em CQ2 a RPI número 599. 3.5 Pedidos Pipeline (Caso 5) As análises dos pedidos pipeline ficaram restritas a divergências de informação da base e SINPI e busca WEB. Problema Identificar problemas de indexação de informação e imagem pertinente a pedidos pipeline. Objetivo Diminuir as divergências de modo que sejam resolvidas a maior parte delas que seja possível sem a re-digitalização de documentos e disponibilizar no portal e base informações mais consistentes. Solução Proposta As correções associadas ao Caso 5, pedidos pipeline, foram feitas analises verificando informações do SINPI, do BuscaWeb e além das imagens do pedido. O GT elaborou tabela com os pedidos PP cadastrados no SINPI e no BuscaWeb contendo as informações pertinentes a i) data de depósito; ii) despachos; iii) pedidos PP divididos; e iv) imagem da petição. A análise destas informações permitiu verificar que 60 pedidos PP apresentavam discordâncias com relação às datas de depósito conforme Apêndice 2. O GT realizou análise manual desses pedidos para verificar qual das bases continha a informação correta (não foi implementada a correção de informação, ainda). Alguns pedidos não apresentavam folheto e nem a petição 200, e, portanto, o GT precisa ter acesso ao documento em papel (ver caixas na Iron) para se certificar de qual a informação deve ser mostrada nas bases. Com relação à análise de despachos foram detectados que alguns despachos não são mostrados no BuscaWeb, mas registrados na base SINPI, Apêndice 2 (não foi implementada a correção de informação, ainda). No que tange a verificação dos pedidos pipeline divididos observou-se divergência de informação entre a base SINPI e o BuscaWeb para os casos indicados na Tabela 3. 17 Mãe PP1100095 PP1100380 PP1100397 Tabela 3: Análise dos pedidos divididos pipeline. Dividido WEB PP1101195 PP1101196 PP1101198 Dividido SINPI PP1101195 PP1101198 e aponta também para informação vazia na tabela dando a entender que pode existir mais um pedido vinculado ao mãe. PP1101190 PP1101190 e aponta também para informação vazia na tabela dando a entender que pode existir mais um pedido vinculado ao mãe. A Figura 3 exemplifica para o pedido PP1100380-4 o vinculo a uma informação de dividido que está também relacionada ao valor “vazio”. O GT também verificou que o pedido PP1100071 apresenta informação de pedido original vinculado ao PI9303982 no BuscaWeb, contudo no SINPI essa informação é o próprio número do pedido PP. Figura 3: Tela de dados do pedido PP1100380-4. Sobre a questão das imagens (duplicidade), 77 pedidos já foram verificados manualmente ocultando a imagem que não deveria ficar disponível, e os casos que não puderam ser resolvidos serão encaminhas para análise. Nessa atividade ficou evidenciado que com a renumeração dos pedidos pipeline (que eram PI11 e esta renumeração aconteceu antes do ano de 2011) estes números que antes eram ocupados pelos pipeline não foram invalidados, passaram a ser preenchidos com pedidos no ano de 2011. Isso gerou inconsistências que precisam ser saneadas. 18 3.6 Pedidos Divididos (Caso 6) Problema A análise dos pedidos divididos é dificultada por não haver separação dos despachos do pedido mãe (original) do (s) pedidos (s) filho (s), ou seja, os divididos, não havia clareza entre qual pedido era original e qual era dividido. Objetivo Os pedidos divididos foram analisados de forma a buscar soluções para os seguintes pontos: i) correção do acesso às informações referentes a pedidos divididos, de modo a recuperar corretamente o pedido original e os divididos associado a este; ii) identificação os despachos que são efetivamente do dividido e não do mãe; e iii) verificação do andamento processual dos divididos. Solução Proposta Para buscar solução aos pontos descritos no objetivo, o GT desmembrou a análise dos divididos em quatro consultas:  Consulta 1: Verificação da interface que disponibiliza dados dos divididos no SINPI.  Consulta 2: Verificação dos pedidos divididos sem despacho 2.4.  Consulta 3: Verificação de pedidos indicados como divididos sem possuir pedido mãe registrado na base de dados.  Consulta 4: Verificação de quais despachos são pertinentes ao pedido original e ao divididos. Consulta 1: Interface que disponibiliza dados dos divididos no SINPI O SINPI, ferramenta de consulta da base de dados do INPI, apresentava no campo 62 os dados dos pedidos: mãe e dividido(s). Contudo, a informação mostrada não estava correta, uma vez que o campo 62 é referente apenas aos dados do pedido original do qual é feita a divisão. A Figura 4 mostra a tela do SINPI para o pedido dividido 122015013851-5, onde o campo 62 mostra o número do pedido original com texto sinalizando que este também é um pedido dividido. 19 Figura 4 - Tela do SINPI para exibir informações (como era antes da ação do GT) Assim, o GT implementou a alteração das informações exibidas no campo 62 como também incluiu um novo campo para exibição da numeração dos pedidos divididos. A Figura 5 mostra a tela do SINPI após as alterações na interface. Figura 5 Tela do SINPI para exibir informações do pedido original e divido(s). Situação atual da tela após ação do GT. 20 Consulta 2: Verificação dos pedidos divididos sem despacho 2.4 O GT encaminhou planilhas à área que realiza o exame formal do pedido dividido para verificação da procedência de ser publicado o despacho 2.4 – Notificação de Depósito do Pedido Dividido – art 26 Inciso I da LPI. O total despachos realizados decorrentes destas listas não foi contabilizado pelo GT, por não ser uma ação em lote e que a área responsável é que implementava e controlava essa análise. Consulta 3: Verificação de pedidos indicados como divididos sem possuir pedido mãe Foram identificados 17 pedidos na tabela que relaciona o pedido filho com o pedido mãe sem informação do pedido mãe. A lista foi analisada pelo GT com base nas imagens da petição inicial. Desses:  2 casos (MU9100149 e102014021020 vinculados respectivamente ao PI1002025-0 e ao PI1104968-5) são de pedidos divididos mesmo, porem a informação do pedido mãe não consegue ser salva na base SINPI por questões de regras de negócios aplicadas até o momento.  12 casos (MU7700867; MU7702381; PI8001453; PI9700573; PI9702405; PI9600714; PI9708761; PI9004922; PI9406420; MU7401405; PI9707733 e PI9710162) não possuem imagem da petição inicial e precisam de análise futura.  3 casos (PI7908936; MU7700866 e PI0602836) possuem imagem da petição e não possuem indicação de serem divididos. Consulta 4: Verificação de quais despachos são pertinentes ao pedido original e ao divididos Para identificar quais despachos exibidos na tela de publicação do dividido pertencem ao pedido dividido ou ao mãe, foi feito um script Python (Apêndice 3) que gera todos os sqls de update para marcar os despachos herdados com o código de identificação (cd_pedido) do mãe. Nessa ação 87 casos que não foram cobertos pela lógica e foram verificados manualmente. A Erro! Fonte de referência não encontrada. mostra que os despachos que aparecem na lista de publicações do pedido dividido, mas que são relativos ao pedido mãe ficam sinalizados pelo fundo da tela na cor cinza. 21 Figura 6: Tela do SINPI após implementar a regra para identificar despachos do mãe e do dividido 3.7 Elaboração de regras para publicação antecipada: despacho 3.2 (Caso 7) Problema Evitar a demora da publicação de despachos de publicação antecipada. Objetivo Permitir a publicação automática do despacho de publicação antecipada. Solução Proposta O fluxo para a realização da publicação antecipada foi elaborada pelo GT e está indicado na Figura 7. Situação: Finalizado e aguardando decisão da DIRPA para implementação pela CGTI. 22 Figura 7- Regras para permitir o despacho de publicação antecipada de forma automática 3.8 Pedidos sem título (Caso 8) Problema O GT identificou que existem pedidos na base de patentes que não tem o seu titulo cadastrado na base de patentes. A falta da informação deste campo faz com que esses pedidos não sejam recuperados em buscas por palavra-chave. 23 Objetivo Carregar em lote os títulos de pedidos onde esta informação não está cadastrada na base de forma a tornar possível recuperar estes pedidos quando realizada buscas por palavras-chave no título. Solução Proposta O GT identificou quais pedidos estavam sem o título e com essa lista realizou busca na Derwent de forma a recuperar essa informação. O GT realizou uma validação das informações recuperadas e após verificar que essas eram corretas, encaminhou proposta ao Diretor de Patentes para a migração dessas informações para a base do INPI. Nessa ação foram recuperados 5.121 títulos, sendo 4.550 referentes a PI e 571 a pertinentes a MU. Situação: Finalizado 3.9 Microfilmes (Caso 9) Problema Antes de patentes, o DNPI publicava/concedia os termos. Atualmente não há acesso a estes dados que se encontram apenas em microfilmes. Objetivo Organização e catalogação dos termos e pedidos de patente que estão apenas no formato de microfilmes. Solução Proposta A ação em relação aos termos e pedidos de patente no formato de microfilmes, visa catalogá-los a fim de que no futuro, caso haja recursos, seja possível digitalizar e disponibilizar os dados para consulta. Foram catalogadas e contabilizadas as informações guardadas em microfilme totalizando 4.587 rolos de microfilmagem, sendo que 2.131 com informações de termos, 2.369 referentes a patentes e 87 pertinentes a D.O.U. Todas as caixas de microfilmes foram organizadas em armários no 11º andar da Maiyrink Veiga, 9. Foi encaminhado pela coordenadora do GT ao Coordenador da CEPIT para orçamento e planejamento da digitalização os microfilmes inventariados. Situação: Finalizado 3.10 CDs com listagem de sequências (caso 10) Problema 24 A ação teve finalidade de identificar se todas as sequencias enviadas por meio de CDs que tem prazo de validade de aproximadamente 10 anos para armazenamento de dados estão cadastrados no SISBIOLIST. Além de ser um produto perecível não são enviados para a guarda de documentos (Iron Mountain, pois o contrato não permite o armazenamento essas mídias eletrônicas. Os Cds encontram-se em caixas que foram encaminhados pela CGPAT II à SARGE por Memo 013/2012 e estão atualmente na Praça Mauá 7, edifício que está em fase de desocupação por parte do INPI. Objetivo Propor a inserção no sistema SISBIOLIST das sequências armazenadas em CD. Foi proposta reunião com os responsáveis, o que não ocorreu no prazo de vigência deste GT. Solução Proposta Foi solicitado acesso à pasta de rede onde estão salvos o conteúdo dos CDs da planilha elaborada pela CGPAT II a fim de garantir que haja um backup seguro desses dados na CGTI. Identificou-se que há alguns CDs cujas listagens não se encontram cadastradas no SISBIOLIST, sendo a maioria delas apresentadas voluntariamente pelos requerentes anteriormente à Resolução. Foi solicitada reunião a fim de definir a preservação do conteúdo dos dados atualmente em CD. Foi sugerido o cadastramento no SISBIOLIST deste conteúdo para posterior descarte seguro dos objetos (CDs). 3.11 Inserção na base de dados de pedidos no período 1972 – 1982 (caso 11) Foram inseridos 23.069 pedidos de patente com data de depósito variando de 1972-01-28 até 1982-09-21 que puderam ser recuperados por acesso à base da Derwent e não constavam na base do INPI. As informações migradas quando disponíveis são: título, a data de depósito, as prioridades e as classificações IPC. 25 4 Apêndice 1: Cadastro automático do PAG 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 5 Apêndice 2: Pedidos pipeline Tabela A2.1 – Divergência de informação de data na Web e SINPI para pedidos PP. Pedido Data WEB Data SINPI PP1100001 16/05/1996 30/08/1993 PP1100014 27/06/1996 19/02/1990 PP1100027 09/08/1996 02/02/1996 PP1100028 09/08/1996 19/06/1991 PP1100044 14/08/2013 17/09/1996 PP1100046 25/05/1993 19/09/1996 PP1100051 23/09/1996 11/03/1986 PP1100056 27/09/1996 26/11/1992 PP1100078 12/11/1996 21/07/1989 PP1100089 05/12/1996 28/06/1993 PP1100133 30/01/1997 25/09/1992 PP1100162 09/02/2010 07/03/1997 PP1100198 01/04/1997 10/03/1993 PP1100227 07/04/1997 22/05/1992 PP1100257 25/06/1991 10/04/1997 PP1100334 23/04/1997 23/07/1997 PP1100357 28/04/1997 19/11/1993 PP1100359 28/04/1997 17/01/1996 PP1100365 28/04/1997 22/07/1993 PP1100366 29/04/1997 30/05/1989 PP1100371 30/05/1997 30/04/1997 PP1100408 02/05/1997 24/08/1988 PP1100443 06/05/1997 12/03/1991 PP1100458 06/05/1997 08/07/1994 PP1100517 13/05/1997 18/11/1989 PP1100534 13/04/1997 13/05/1997 PP1100600 13/05/1997 10/08/1994 PP1100622 13/05/1997 13/11/1992 PP1100627 13/05/1997 19/06/1992 PP1100646 07/05/1997 12/08/1991 PP1100669 07/05/1997 07/09/1994 PP1100680 08/05/1997 28/11/1989 PP1100685 08/05/1997 12/09/1995 PP1100692 08/05/1997 07/06/1993 PP1100694 08/05/1997 15/09/1993 PP1100701 08/05/1997 31/05/1995 PP1100744 09/05/1997 03/09/1987 PP1100787 12/05/1997 03/03/1989 PP1100895 14/05/1997 22/04/1992 PP1100920 14/06/1989 14/05/1997 PP1100923 14/05/1997 12/04/1984 PP1100937 14/05/1997 20/08/2002 51 PP1100984 PP1101014 PP1101019 PP1101034 PP1101038 PP1101055 PP1101071 PP1101072 PP1101106 PP1101113 PP1101114 PP1101141 PP1101147 PP1101154 PP1101183 PP1101193 PP1101195 PP1101199 14/05/1996 01/03/1993 09/05/1994 12/03/1993 14/05/1997 14/05/1997 17/05/1994 14/05/1997 26/01/1996 14/05/1997 14/05/1997 12/05/1993 14/05/1997 14/05/1997 14/05/1997 11/04/2001 11/05/2005 24/09/2007 14/05/1997 14/05/1997 14/05/1997 14/05/1997 26/04/1994 16/05/1989 14/05/1997 19/07/1988 14/05/1997 26/04/1993 15/01/1993 14/05/1997 21/12/1990 02/03/1993 20/02/1992 12/03/1992 11/12/1996 14/05/1997 Tabela A2.2 – Despachos encontrados na base não visíveis no Busca para pedidos PP Pedido PP1100661 PP1101198 PP1101198 PP1101199 PP1101199 PP1101200 PP1101200 PP1101200 RPI 2424 1637 1685 1846 1530 1771 1530 1695 Despacho 21.8 25.4 23.4 23.2 23.16 23.2 23.16 23.1.1 52 6 Apêndice 3: Pedidos divididos Script Esse script permite analisar os despachos herdados dos pedidos de patente para que seja marcado o cd_pedido dos pais. O que precisa ser feito antes de rodar? (1) Salve o arquivo ./data_div/divididos_sinpi.csv com a seguinte consulta (use o separador |) select t1a.no_pedido as filho, t1a.cd_pedido as cod_filho, date(t4a.dh_entrada_protoco) as entrada_filho, t1b.no_pedido as pai, t2.cd_pedido_origem as cod_pai, date(t4b.dh_entrada_protoco) as entrada_pai from ptn_pedido t1a, ptn_pedido t1b, ptn_vinculo_pedido t2, crp_protocolo t4a, crp_protocolo t4b where t2.cd_vinculo = 'D' and t1a.no_pedido != '' and t1a.no_pedido is not null and t1a.cd_naturez_pedido in ('PI','MU','C','PP') and t1b.no_pedido != '' and t1b.no_pedido is not null and t1b.cd_naturez_pedido in ('PI','MU','C','PP') and t1a.cd_pedido = t2.cd_pedido_derivad and t1b.cd_pedido = t2.cd_pedido_origem and t1a.cd_protoco = t4a.cd_protoco and t1b.cd_protoco = t4b.cd_protoco (2) Salve o arquivo ./data_div/despachos_divididos_sinpi.csv com a seguinte consulta (use o separador |) file_sinpi = './data_div/despachos_divididos_sinpi.csv' select t3.cd_pedido, t3.cd_tipo_despach, t3.no_rpi, date(t5.dt_publica_ptn) as data, date(t3.dt_despach) as dt_despach, t3.dt_despach as dh_despach, cd_despach_rpi from ptn_pedido t1, ptn_despacho t3, ptn_tipo_despacho t4, crp_programa_rpi t5 where t1.no_pedido != '' and t1.no_pedido is not null and t1.cd_naturez_pedido in ('PI','MU','C','PP') and t1.cd_pedido = t3.cd_pedido and t4.cd_tipo_despach = t3.cd_tipo_despach and t5.no_rpi = t3.no_rpi and exists( select 1 from ptn_vinculo_pedido t2 where t2.cd_vinculo = 'D' and (t1.cd_pedido = t2.cd_pedido_derivad or t1.cd_pedido = t2.cd_pedido_origem)) (3) Crie, caso não exista, o arquivo ./data_div/force.csv com a primeira linha igual a cd_pedido|cd_despach_rpi|no_rpi Esse arquivo será usado para forçar que um determinado despacho seja marcado no filho com o cd_pedido do pai Como rodar? python analisa_divididos.py Como analisar o resultado? O script agrupa os despachos de 6 formas Conjunto 0 - não encontramos despachos do pai --> não marca nenhum despacho como herdado Conjunto A - antes da data de entrada do filho --> marca despacho como herdado Conjunto B - não está no pedido mae --> não marca nenhum despacho como herdado Conjunto C* - está no pedido mae mas pedido não tem 2.4 --> marca despacho como herdado Conjunto C** - esta no pedido mae e é pré 2.4 --> marca despacho como herdado Conjunto D - esta no pedido mae mas é pós 2.4 --> não marca nenhum despacho como herdado Sendo que os 0, B e D não são marcados como despachos herdados e os A, C* e C** são marcados como despachos herdados. Não se esquecendo que aqueles despachos que estão dentro do arquivo force.csv são TAMBÉM marcados como herdados. Como usar os resultados? Primeiro pode-se usar o arquivo ./data_div/output.csv para avaliar os casos manualmente e preencher o force.csv. 53 Depois de ter preenchido o force.csv pode-se rodar novamente a rotina e pegar todos os updates no arquivo ./data_div/output.sql para serem executados no banco ptnbase. 54