Bienvenidos al módulo de "Representación del conocimiento". Antes de explicarles qué vamos a ver en el módulo, quisiera mostrarles algunos términos que tal vez ustedes han oído. Linked Open Data o datos hilados, Knowledge graphs o grafos de conocimiento, Scripts, Sistemas expertos, Ontologías, la Web semántica, Representación y Razonamiento, Grafos semánticos, Grafos de propiedades, y más recientemente, Data centric AI y Fabricas de datos. Todos estos términos tienen que ver con Representación del conocimiento. Pero ¿qué es Representación del conocimiento? Representar el conocimiento en inteligencia artificial consiste en crear un modelo simbólico, una representación formal, que exprese la semántica de un dominio, de forma que se pueda razonar sobre ese conocimiento, para generar nuevo conocimiento que permita resolver tareas complejas y, en últimas, para generar valor a la sociedad o a la organización que lo implemente. Veamos un ejemplo con una representación basada en reglas. Supongamos que tengo información de mi carro, y también sé qué día es hoy. Si a esta información le agregamos el conocimiento, la regla de que en los días impares no pueden circular carros con placa impar, entonces un sistema inteligente que razone con reglas puede deducir que hoy no puedo sacar mi carro. La Representación del conocimiento ha sido uno de los campos de la inteligencia artificial desde sus orígenes, pero ¿por qué es especialmente relevante hoy? Muchas empresas y proyectos, utilizan módulos de representación y explotación del conocimiento en sus sistemas. Empresas como Sears y la BBC, los utilizan para relacionamiento social con sus clientes. Renault, kMart, LinkedIn, Facebook, los utilizan para perfilamiento de usuario y recomendaciones. El Museo Británico, para ampliar la información que provee de sus obras, y el proyecto de los Panama Papers utilizó modelos de representación de conocimiento, para encontrar relaciones no explícitas entre los actores del caso a partir de textos. Pero además el tema es importante por los desarrollos que se están dando a nivel de investigación e innovación, voy hablarles de tres de ellos. DBPedia es posiblemente la base de conocimiento más utilizada de la web. Se originó como una representación del conocimiento disponible en Wikipedia, y cuenta con más de 180 millones de relaciones de conocimiento. DBPedia está desarrollando en la actualidad un sistema inteligente llamado Diffbot, que va a explotar todo el conocimiento de los documentos de la web, para enriquecer más esta base. Es interesante ver cómo se potencia la representación del conocimiento cuando se usan otras técnicas de inteligencia artificial, en este caso, el procesamiento del lenguaje natural. Por su parte, para Gartner, la primera de las 12 tendencias estratégicas del 2022 es lo que ellos llaman las fábricas de datos. Definen una fábrica de datos como un concepto de diseño a un nivel integrador, tanto de los datos como de los procesos, y señalan que para llevar a cabo estas fábricas de datos se requieren tecnologías como los grafos de conocimientos semánticos, que son las tecnologías más recientes de representación del conocimiento. Por último, quiero hablarles de un término acuñado no hace mucho, los Datos inteligentes. Andrew NG, experto mundial en aprendizaje de máquina, y fundador de la empresa Deep Learning, creó recientemente el nodo de investigación en inteligencia artificial centrada en datos, Data centric AI Research Hub, en que afirma que los avances en inteligencia artificial de los últimos años se han centrado en los algoritmos y arquitecturas de Machine Learning, lo que ha producido excelentes resultados, pero considera que es el momento de centrarse más en los datos, y explotar el conocimiento relacionado con ellos. Esta opinión es compartida por Gadi Singer, vicepresidente y director de Emergent AI en Intel Labs, quien anticipa que viene una nueva ola en inteligencia artificial que es más cognitiva, y que da un mejor entendimiento del mundo para una mayor inteligencia, y que esta va a requerir la combinación de las redes neuronales con la representación simbólica del conocimiento. Revisemos ahora lo que vamos a estudiar en este módulo. Primero, vamos a hablar de lo que significa la administración del conocimiento y su relación con sistemas inteligentes de representación del conocimiento. Luego veremos diferentes modelos de representación del conocimiento y cómo cada modelo ha nutrido al siguiente, hasta los que se están usando en la actualidad. Nos centraremos en las ontologías, que son los modelos de conocimiento usados en la actualidad. Estudiaremos el lenguaje RDF y RDF Schema, que es el lenguaje más utilizado para representar una ontología en la web. Terminaremos con una introducción a las grandes ontologías abiertas y masivas, que se llaman grafos de conocimiento, y a la forma en que estas se conectan en lo que se llaman datos hilados o Linked Data. Por último, veamos los objetivos del módulo. Esperamos que al final del módulo, ustedes sean capaces de explicar la evolución de los diferentes modelos de representación del conocimiento en la inteligencia artificial simbólica, que puedan describir los elementos que componen una ontología, que puedan representar una ontología sencilla utilizando los lenguajes RDF y RDF Schema, sobre la sintaxis Turtle y XML, y que reconozcan la importancia de los grafos de conocimiento y los datos hilados, y tengan una idea global de su funcionamiento. Les doy una cordial bienvenida, espero que les guste el módulo y les sea de utilidad.