Prefacio
¡Hola, mundo!
El siglo xxi está siendo testigo de grandes cambios vertiginosos en el contexto social y tecnológico, entre otros. Los tiempos han cambiado, la sociedad se ha globalizado y “exige” respuestas inmediatas a problemas muy complejos. Vivimos en el mundo de la información, de los datos o, mejor, de las bases de datos masivas, y los ciudadanos y, sobre todo, las empresas y los gobiernos dirigen su mirada hacia el mundo científico para que les ayude a “oír las historias” que cuentan esos datos acerca de la realidad de la que han sido extraídos. Y dado su enorme volumen y sofisticación (en el nuevo mundo, las imágenes y los textos, por ejemplo, también son datos), exigen algoritmos de nueva generación en el campo del machine learning, o incluso del deep learning, para “oír las historias” que cuentan. No parecen mirar al “antiguo” investigador científico, sino al “nuevo” científico de datos.
Ello, inevitablemente, se traduce en la necesidad de profesionales con una gran capacidad de adaptación a este nuevo paradigma: los científicos de datos, también llamados por algunos los “nuevos hombres del Renacimiento”, para lo cual las universidades y demás instituciones educativas especializadas se apresuran a incluir el grado de Ciencias de Datos en su oferta educativa y a ofrecer seminarios de software estadístico de acceso abierto para sus estudiantes de primeros cursos.
Con la emergencia de la nueva sociedad, en la que el manejo de la ingente cantidad de información que genera se hace absolutamente necesario para circular por ella, la ciencia de datos ha venido para quedarse. Sin embargo, el mundo de la ciencia de datos es cualquier cosa menos sencillo. En él, cualquier ayuda, cualquier guía es bienvenida. Por ello, es muy recomendable que la persona que se quiera introducir en él, sea con fines de investigación o con fines profesionales, se agarre de la mano de un guía especializado que le lleve, de una manera amena, comprensible y eficiente, desde el planteamiento de su problema y la captura de la información necesaria para poderle dar una solución hasta la redacción de las conclusiones finales que ha obtenido con los modernos informes reproducibles colaborativos. Y como en la parte central de ese camino tendrá que luchar con grandes gigantes (en la actualidad denominados técnicas estadísticas y algoritmos), el guía tendrá que explicarle, de modo sencillo y ágil, en qué consiste la lucha (las técnicas y los algoritmos) y cómo llegar a la victoria lo más rápido posible, enseñándole a moverse por el mundo del software estadístico, en nuestro caso R, que le permitirá realizar los cálculos necesarios para vencer al problema planteado a una velocidad vertiginosa.
En resumen, la información masiva y el moderno tratamiento estadístico de la misma son la “mano invisible” que gobierna la sociedad del siglo xxi, y este manual pretende ser ese guía que le llevará de la mano cuando quiera caminar por ella.
¿Por qué este libro?
Lo dicho anteriormente ya justifica por sí solo