La visualización de patentes es una aplicación de la visualización de información . El número de patentes ha ido aumentando, [1] lo que ha animado a las empresas a considerar la propiedad intelectual como parte de su estrategia. [2] La visualización de patentes, al igual que el mapeo de patentes , se utiliza para ver rápidamente una cartera de patentes .
El software dedicado a la visualización de patentes comenzó a aparecer en 2000, por ejemplo Aureka de Aurigin (ahora propiedad de Thomson Reuters ). [3] Muchas plataformas de análisis de patentes y carteras, como Questel, [4] Patent Forecast, PatSnap, Patentcloud, Relecura y Patent iNSIGHT Pro, [5] ofrecen opciones para visualizar datos específicos dentro de los documentos de patentes mediante la creación de mapas de temas , [6] mapas de prioridades, informes de IP Landscape, [7] etc. El software convierte las patentes en infografías o mapas, para permitir al analista "obtener información sobre los datos" y sacar conclusiones. [8] También llamada patinformática, [9] es la "ciencia de analizar la información de patentes para descubrir relaciones y tendencias que serían difíciles de ver al trabajar con documentos de patentes de forma individual". [ cita requerida ]
Las patentes contienen datos estructurados (como números de publicación) y texto no estructurado (como título, resumen, reivindicaciones e información visual). Los datos estructurados se procesan mediante minería de datos y los datos no estructurados se procesan mediante minería de texto . [10]
El paso principal en el procesamiento de información estructurada es la minería de datos , [11] que surgió a fines de la década de 1980. La minería de datos involucra estadísticas, inteligencia artificial y aprendizaje automático . [12] La minería de datos de patentes extrae información de los datos estructurados del documento de patente. [13] Estos datos estructurados son campos bibliográficos como ubicación, fecha o estado.
La minería de datos permite estudiar los patrones de presentación de solicitudes de patentes de los competidores y ubica a los principales solicitantes de patentes dentro de un área específica de la tecnología. Este enfoque puede ser útil para monitorear los entornos, los movimientos y las tendencias de innovación de los competidores y brinda una visión macro del estado de una tecnología. [ cita requerida ]
La minería de texto se utiliza para buscar en documentos de texto no estructurados. [14] [15] Esta técnica es ampliamente utilizada en Internet, ha tenido éxito en la bioinformática y ahora en el entorno de la propiedad intelectual. [16]
La minería de texto se basa en un análisis estadístico de la recurrencia de palabras en un corpus. [17] Un algoritmo extrae palabras y expresiones del título, resumen y reivindicaciones y las reúne por declinación . "Y" y "si" se etiquetan como palabras que no contienen información y se almacenan en la lista de palabras vacías . Las listas de palabras vacías se pueden especializar para crear un análisis preciso. A continuación, el algoritmo clasifica las palabras por peso, según su frecuencia en el corpus de la patente y la frecuencia del documento que contiene esta palabra. La puntuación de cada palabra se calcula utilizando una fórmula como: [18] [19]
Una palabra de uso frecuente en varios documentos tiene un peso menor que una palabra de uso frecuente en unas pocas patentes. Las palabras que tienen un peso mínimo se eliminan, dejando una lista de palabras o descriptores pertinentes. Cada patente se asocia a los descriptores que se encuentran en el documento seleccionado. Además, en el proceso de agrupación, estos descriptores se utilizan como subconjuntos en los que se reagrupan las patentes o como etiquetas para colocar las patentes en categorías predeterminadas, por ejemplo, palabras clave de las Clasificaciones Internacionales de Patentes.
Se pueden procesar cuatro partes de texto con minería de texto:
El software ofrece diferentes combinaciones, pero el título, el resumen y la reivindicación son generalmente los más utilizados, proporcionando un buen equilibrio entre interferencias y relevancia.
La minería de texto se puede utilizar para limitar una búsqueda o evaluar rápidamente un corpus de patentes. Por ejemplo, si una consulta produce documentos irrelevantes, una jerarquía de agrupamiento de varios niveles los identifica para eliminarlos y refinar la búsqueda. La minería de texto también se puede utilizar para crear taxonomías internas específicas de un corpus para su posible mapeo. [ cita requerida ]
La combinación de análisis de patentes y herramientas informáticas ofrece una visión general del entorno mediante visualizaciones de valor añadido. Dado que las patentes contienen información estructurada y no estructurada, las visualizaciones se dividen en dos categorías. Los datos estructurados se pueden representar mediante minería de datos en mapas macrotemáticos y análisis estadísticos. La información no estructurada se puede mostrar en nubes de datos, mapas de clústeres y mapas de palabras clave en 2D.
Las visualizaciones de mapas se pueden utilizar tanto para resultados de minería de texto como de minería de datos.
Lo que la visualización de patentes puede resaltar : [21] [22]
Aplicación de campo : [24] [22]