Bienvenidos al módulo de herramientas de visualización. Este módulo os guiará a través de la elección de las diversas herramientas para visualizar datos. Os presentaremos diversas herramientas según diversos criterios como, por ejemplo, grado de complejidad o si son de pago o de código abierto. La primera herramienta es Tableau Desktop. Tableau Desktop es una de las herramientas más famosas a la hora de visualizar datos. Es una herramienta que, inicialmente, en la opción Desktop es de pago y esta herramienta nos permite conectar diversas fuentes de datos, nos permite trabajar la visualización a dos niveles, a nivel más infográfico o a nivel más visualización y dispone de mucha flexibilidad, también, a la hora de crear pequeñas fórmulas, pequeños cálculos y visualizarlos de una forma eficaz. La versión gratuita se llama Tableau Public. En este caso, lo que tenemos que hacer es publicar nuestra visualización en la red, en la web de Tableau y dejarla de forma pública, por lo cual, aunque disponemos de una versión de no pago, nuestros trabajos quedarán colocados de forma pública. La siguiente herramienta es QlikView. QlikView es una herramienta basada en "business intelligence" y en "dashboards". Es la herramienta más utilizada para tablones y cuadros de mando de analítica de negocio. Y es una herramienta de licencia y de pago. La siguiente herramienta que os presentamos es Flourish. Flourish es una herramienta de última creación, realmente, es muy reciente, tiene pocos meses en el mercado y es una herramienta pensada en el "data storytelling", es decir, en explicar historias con los datos. Es visualización porque hay ciertos niveles de exploración, trabaja con plantillas, pero eso es una herramienta también en que ciertas plantillas están cerradas y disponen de una opción de pago. Infogram, que la hemos visto en otros módulos, es la herramienta ideal cuando quiero hacer pequeñas visualizaciones y presentaciones con un carácter más infográfico. Como veis es muy intuitiva y dispone también de cierta limitación con el tema de datos dinámicos, aunque nos permitiría trabajar, por ejemplo, con datos en Google Drive, no permite conectar muchas fuentes de datos y queda la visualización a un nivel más de presentación. Por lo cual, si queréis hacer infografías, si queréis hacer presentaciones y si queréis hacer un "storytelling" básico, es vuestra herramienta. Carto, esta herramienta, que también es de licencia, es la reina de las herramientas en visualización de datos geográfica, cartográfica, mapas. Todo lo que sea representar datos en un mapa, más a un nivel de detalle que queramos, podemos trabajar a nivel de calle, a nivel de punto, a nivel de área, de ciudad. Es muy flexible, dispone de diversas conexiones con diversas fuentes de datos, pero fijaros que normalmente deberemos trabajar con dos tipos de datos, una capa digamos de área, una capa de polígono en la cual definimos los datos o las áreas que queremos visualizar y una capa de datos en sí, que es donde realmente representaremos el valor más cuantitativo. Por lo cual, normalmente, aunque podamos tirar de ciertas plantillas y ciertos mapas preconfigurados, nos obligará a conectar estas dos fuentes. Datawrapper es una herramienta bastante ágil, bastante fácil y además es de código abierto. Esta herramienta nos permite crear mapas y gráficos, customizarlos, adaptarlos de una forma fácil. Podemos subir archivos CSV o "copypaste" de una tabla o de un rango de celdas de un excel, por ejemplo. Lo lanzamos contra el tablón y generamos este gráfico. Este gráfico lo podemos personalizar a un nivel que otras herramientas, como Infogram, no nos permitiría, pero el límite de aquí es que la salida gráfica al final va a ser un gráfico que tenemos que hacer un "embed", una ventanita dentro de nuestra web y va a estar siempre publicado online. Por lo cual, puede ser un recurso interesante si queremos visualizar, por ejemplo, algunos gráficos en un reporte que tenemos colgado en una web, pero no es una herramienta ideal para trabajar grandes volúmenes de datos o para trabajar tablones complejos. R es una herramienta, más bien, para programadores, más bien, para estadísticos, es una herramienta, es una calculadora visual gráfica, por lo cual es una herramienta más bien para el cálculo en la cual tiene un cierto nivel de presentación de los datos, pero no es una herramienta para iniciarse en la visualización de datos. Processing y P5.js son herramientas realmente pensadas como un lenguaje de programación. Es una herramienta muy versátil pero está pensada para personas que ya dominen esta programación y que quieran hacer cosas más bien complejas. D3 es una librería de Java que nos permite realizar visualizaciones, por lo cual, también es una herramienta que requiere de cierto nivel de conocimiento de programación, aunque si estamos un poco familiarizados con una parte básica de programación, sí que está diseñada a generar visualizaciones más allá de las clásicas gráficas que podemos tener en otras herramientas, son visualizaciones más complejas. Raw es una herramienta, que por debajo hay D3 también, pero que nos permite realizar ciertas visualizaciones más allá de las clásicas. Podemos ir a un "tree map", podemos ir a "parallel course", podemos ir a gráficos de Voronoi, podemos elegir diversos gráficos más complejos, "string graph", pero lo importante, lo interesante de esta herramienta es que no hace falta que sepamos programar, sino simplemente insertamos un fichero CSV o hacemos un "copy paste" de un rango de celdas, lo lanzamos hacia el tablón de conexión de datos y podremos visualizar. Por lo cual es como una preconfiguración de ciertos gráficos y salidas. Es muy interesante esta herramienta y es de código abierto. Quadrigram es una herramienta que nació de una empresa en España y es bastante interesante porque también corre D3 por debajo, pero con un entorno gráfico, con una interfaz mucho más fácil, más intuitiva para que nosotros podamos realmente generar visualizaciones atractivas. Está a caballo entre visualizar y "storytelling", por lo cual es como un Tableau en pequeñito pero, a la vez, lo importante es que nos permite tener el máximo control de los datos. Nuestros datos quedan, en este caso, conectados con el Google Drive, nos obligará a tener una cuenta de Gmail o una cuenta de Google que nos permita tener estas carpetas en la nube, pero nos permitirá tener el máximo control de estos datos. Es muy fácil, también, de utilización y podréis ver algunos ejemplos en su galería y, hasta ahora, es una herramienta gratuita. Pasamos a un siguiente bloque. Os pongo un par de herramientas que están pensadas no tanto para visualizar, sino para pasos previos, en este caso, para capturar datos. Import.io es una herramienta de licencia, de pago, pero que nos permite importar datos que encontramos en tablas o en diversos elementos que están en una web, podría ir a una web determinada, seleccionar un rango e importo realmente esa tabla, que yo estoy viendo en HTML, directamente a un CSV o un XLS. Es una herramienta muy interesante para "scrapear", para rascar datos de partes de web que nos pueden interesar y que nos pueden complementar nuestra visualización. Una herramienta de código abierto bastante interesante es Tabula. Tabula es un pequeño software que podemos instalarnos, que lo que nos permite de una forma eficaz es capturar datos que tenemos en PDFs y normalmente están en tablas. Lo más engorroso es cuando tenemos los datos en un documento cerrado y en una tabla, en este caso, él identifica las tablas que encuentra en un fichero PDF que le damos y nos permite extraerlas y ponerlas en formato, por ejemplo, de CSV como "separated values" o XLS para trabajarlos posteriormente con un Excel. Y, finalmente, cuando queráis hacer visualizaciones mucho más complejas, cuando tengamos muchas variantes y como debemos tener visualizaciones un poco más extrañas, más creativas más allá de los gráficos tradicionales, os recomiendo que visitéis "visualisingdata.com/resources". Esta es la web de Andy Kirk que es uno de los pioneros también en visualización de datos, en la cual tenéis un listado de las mayores herramientas o de las más famosas que permiten trabajar los datos de forma multivariante. Hasta aquí ha sido esta sección de herramientas de visualización.