Lecturas Recomendadas sobre Ciencia de Datos

Juan Murillo

d&a blog

El viaje que ha llevado a los datos y sus aplicaciones desde la  periferia hasta el centro del debate actual tiene múltiples ramificaciones: cuestiones sociales, éticas y legales sobre las oportunidades y los riesgos de la “datificación” de nuestra sociedad, aspectos de negocio en torno al reto que supone transformar los datos en soluciones innovadoras percibidas como un nuevo valor por los clientes, y aspectos técnicos y metodológicos en torno a la profesión en boga: la ciencia de datos. Desde BBVA Data & Analytics hacemos esfuerzos divulgativos en todos esos frentes, y en esta ocasión compartimos una selección de referencias bibliográficas orientadas a facilitar objetivos diferentes en audiencias diversas.

En los bloques A y D el público objetivo de las publicaciones sería muy amplio: project managers, perfiles de diseño y de desarrollo de negocio, o simplemente todo el que esté interesado en aprender y tener unos fundamentos elementales sobre la disciplina, sus posibles aplicaciones y los dilemas implícitos.

En los bloques B y C sin embargo apuntamos a otro público: el científico de datos “practicante” que busca resolver dudas metodológicas y profundizar en las diversas especializaciones de la disciplina:

 

A] Aproximación a la ciencia de datos y sus aplicaciones de negocio: introducción a la estadística, sin necesidad de conocer códigos de programación, pero sí ciertas nociones previas matemáticas para proponer aplicaciones con rigor: definiciones, catálogo de posibilidades, riesgos técnicos relativos al tratamiento de sesgos, calidad del dato, métricas de precisión y de exactitud.

  • Statistics Done Wrong. Alex Reinhart
  • How to Lie with Statistics. Darrell Huff & Irving Geis
  • Data Science for Business: What you need to know about data mining and data-analytic thinking. Foster Provost
  • The Signal and the Noise: Why So Many Predictions Fail-but Some Don’t. Nate Silver
  • Everything Is Obvious: How Common Sense Fails Us. Duncan J. Watts
  • Big Data: A Revolution That Will Transform How We Live, Work, and Think. Viktor Mayer-Schönberger & Kenneth Cukier

 

B] Profundización en ciencia de datos; analítica, arquitectura de datos y programación:

  • Toda la colección O’Reilly, destacando los siguientes:
    • Practical Statistics for Data Scientists: 50 Essential Concepts. Peter Bruce & Andrew Bruce
    • Advanced Analytics with Spark: Patterns for Learning from Data at Scale. Sandy Ryza & Uri Laserson
    • Python for Data Analysis. Wes McKinney
  • Doing Bayesian Data Analysis. John K. Kruschke
  • Transparent Data Mining for Big and Small Data. Tania Cerquitelli, Danielle Quercia & Frank Pasquale.
  • The R Book. Michael J. Crawley
  • The Data Warehouse Toolkit: The definitive guide to dimensional modeling. Ralph Kimball
  • Displaying Time Series, Spatial, and Space-Time Data with R. Oscar Perpinan Lamigueiro
  • Computer Age Statistical Inference. Algorithms, Evidence and data Science. Bradley Efron & Trevor Hastie.
  • Introduction to Linear Algebra. Gilbert Strang
  • Applied Predictive Modelling. Max Kuhn & Kjell Johnson
  • Mining Massive Datasets. Jeffrey Ullman

 

C]  Profundización en ciencia de datos; estadística, machine learning e inteligencia artificial:

  • The Elements of Statistical Learning. Trevor Hastie, Robert Tibshirani and  JH Friedman
  • Statistical Rethinking: A Bayesian Course with Examples in R and Stan. Richard McElreath
  • Network Science. Albert-László Barabási & Márton Pósfai
  • Artificial Intelligence. Peter Norvig & Stuart J. Russell
  • Machine Learning. A Probabilistic Perspective. Kevin P. Murphy
  • Pattern Recognition and Machine Learning. Christopher Bishop
  • Networks. An Introduction. M.E.J. Newman
  • Unsupervised Learning Algorithms. M. Emre Celebi & Kemal Aydin
    Deep Learning (Adaptive Computation and Machine Learning series). Ian Goodfellow and Yoshua Bengio and Aaron Courville
  • Reinforcement Learning: an introduction. Richard S. Sutton, Andrew Barto
  • Learning From Data. Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin

 

D] Dilemas éticos y visiones de futuro en torno a la inteligencia artificial: riesgos morales, discriminación injusta, control centralizado de la sociedad, reemplazo del hombre por la máquina, (discurso de Nick Bostrom, Elon Musk o Stephen Hawking), pero también su contrapunto más visionario y tecno-optimista (Ray Kurzweil, Grady Booch, etc)

  • Algorithms to Live By: The Computer Science of Human Decisions. Brian Christian & Tom Griffiths
  • Weapons of Math Destruction. Cathy O’Neil
  • Data and Goliath: The Hidden Battles to Collect Your Data and Control Your World. Bruce Schneier
  • Homo Deus. Yuval Noah Harari
  • Naked Diplomacy. Understanding Power and Politics in the Digital Age. Tom Fletcher
  • Life 3.0: Being Human in the Age of Artificial Intelligence. Max Tegmark
  • Superintelligence: Paths, Dangers, Strategies. Nick Bostrom
  • Who Owns The Future? Lanier, Jaron
  • Machines Of Loving Grace. John Markoff
  • How to Create a Mind: The Secret of Human Thought Revealed. Ray Kurzweil