Big Data: "Las empresas nos conocerán mejor que nosotros mismos"

La ciencia de datos puede ser una gran desconocida para muchos, pero tras un primer vistazo uno se da cuenta[…]

La ciencia de datos puede ser una gran desconocida para muchos, pero tras un primer vistazo uno se da cuenta del valor y de la relevancia que tiene en cualquier empresa, independientemente del sector. Adriá Alcalá, Head of Data en Hundredrooms, aporta un acercamiento muy interesante sobre el significado y la importancia de esta materia. Además nos habla sobre el devenir de las empresas.

Pregunta:  ¿Hay una transformación numérica de las empresas? ¿Hacia dónde crees que vamos?

- Más que una transformación numérica creo que lo que hay es una concienciación numérica, es decir, los números siempre han estado allí aunque las empresas no fueran plenamente conscientes. El cambio ha sido que cada vez hay más empresas que se dan cuenta del potencial que tienen esos datos que tenían y no lo sabían. El futuro, no tengo ni idea, pero creo que vamos camino a un mundo donde el contenido que se ve, se ha individualizado y donde las grandes empresas nos conocerán mejor que nosotros mismos. Es decir, serán capaces de poder predecir nuestro comportamiento incluso antes de nosotros saber que vamos a hacer ya que el ser humano es un animal de costumbres, aunque no lo veamos o no lo queramos ver. Por lo tanto habrá que ser consciente de que todo aquello que se suba a la red (directa o indirectamente) pasará a ser parte de la información del mejor postor. Esto tiene aspectos positivos como que el contenido que veremos siempre será mucho más personalizado, pero aspectos que no lo son tanto como por ejemplo la falta de privacidad. Las grandes empresas nos tendrán ( y nos tienen) perfectamente controlados, por ejemplo Google ya es capaz de saber dónde vives y donde trabajas por el simple hecho de tener controlado donde pasas las horas que dedicas a dormir y trabajar.

Pregunta: ¿Tener datos es tener el poder?

- No exactamente, lo que es el poder es tener la información. Lo que sí es verdad es que tener los datos te permite tener la información, pero no solo hay que ser capaces de conseguir los datos también hay que ser capaces de extraer la información que esconden.

Pregunta: ¿Qué es más importante dentro de la inmensidad de información que manejas: la comprensión y análisis de los datos ya existentes, o hacerse con más datos?

- Las dos cosas son igual de importantes ya que no me sirve de nada tener pocos datos y comprenderlos perfectamente porque esos datos contendrán poca información oculta. Tampoco me sirve tener muchos datos y no ser capaz de comprenderlos. Son dos caminos que hay que recorrer a la vez: a medida que vas comprendiendo aquello que dispones, debes ir incorporando más datos para ver si lo que creías que te decían esos datos sigue siendo verdad o la cosa ha cambiado.

Pregunta: ¿Crees que hay consciencia de la importancia del data en las empresas?

Publicidad

- Existe una mayor consciencia ya que las empresas están empezando a ver el potencial que tienen los datos que poseen.

Pregunta: ¿De qué manera tu departamento interactúa con el resto de departamentos?

- Nuestra mejor manera de interactuar con ellos es teniendo charlas informales, tomando café por ejemplo. De esta manera podemos ver sus preocupaciones y que es lo que les gustaría saber. A partir de ahí, pensamos qué datos podrían sernos útiles para poder responder a sus preguntas y, a partir de esos datos (si los podemos obtener), buscamos respuestas.

Pregunta: Para futuros candidatos, ¿qué cualidades destacarías que debe tener un profesional del data?

- Según el proyecto de Máster in Data Science, se define al científico de datos como una "mezcla de estadísticos, computólogos y pensadores creativos". En primer lugar un buen candidato debe presentar buenas habilidades analíticas en su interacción con las bases de datos, pero no se puede reducir solamente a eso ya que un buen científico de datos debe saber también comprender esos datos y poder comunicarlos a aquellos que no estén familiarizados con esta ciencia. Por último destacaría un poder multidisciplinar ya que se trabaja en todas las industrias y se hace frente a proyectos en todos los niveles

El doctor en estadística Nathan Yau, precisó que "el científico de datos es un estadístico que debería aprender interfaces de programación de aplicaciones (APIs), bases de datos y extracción de datos; es un diseñador que deberá aprender a programar; y es un ingeniero en sistemas computacionales que deberá saber analizar y encontrar datos con significado". Al final un profesional del data tiene que tener una mente abierta y analítica, una alta capacidad de aprendizaje (todo evoluciona muy rápido) y también una cierta imaginación, para poder ver lo que no se ve a primera vista en los datos.

Pregunta: Para familiarizarnos un poco, ¿qué tipo de trabajo haces en Hundredrooms?

- Mi trabajo consiste básicamente en jugar con los datos que tenemos. Me explico un poco, se trata primero de consensuar con el departamento de IT (Iinformation Technology), por un lado sobre los datos que puedo tener, y por otro lado sobre los datos que serían demasiado costosos tener. Es una negociación de coste-beneficio. Por mi parte cuantos más datos mejor y por la suya siempre que haya más beneficio que coste (lo que es perfectamente entendible ya que no sería normal obtener unos datos que cuesten mucho sin que reporten beneficios relevantes). Una vez tenemos los datos empezamos a jugar con ellos principalmente representándolos y viendo su utilidad y la información que esconden.

Cuando ya sabemos esa información, creamos modelos matemáticos para poder sacarla. Para ello se suele requerir primero de una investigación del estado del arte de los algoritmos que se puedan usar, con la intención de no usar siempre lo que ya conocemos si no usar lo que de mejores resultados. Igual que no descartamos nunca un algoritmo por "viejo", tampoco lo descartamos por complejo o porque existe otro que ya conocemos. Finalmente ofrecemos estos modelos a la parte de Producto para que pueda sacar el mayor jugo posible. Dado que, generalmente, los que mejor conocemos la naturaleza de los datos somos nosotros, solemos recomendar u orientar un poco como usar esa información.

Si te interesó este tema, también te puede interesar:

Big data: Los datos personales, motor de la banca digital

En portada

Noticias de