Cómo entrevistar (o no) a un Data Scientist -cientifico de datos-

Hay mucho material en internet sobre ‘las mejores 50 preguntas para entrevistar a un data scientist’ y similares. Le aseguro que cualquier candidato aspirante a data scientist ha leído y aprendido todas esas mismas preguntas y respuestas que probablemente usted le hará y espera, respectivamente.

Tras observar y trabajar con muchos de estos profesionales de los datos -tanto entrevistados y contratados, como profesionales internos formados en disciplinas de datos- algunas conclusiones he obtenido. Al fin y al cabo, soy data scientist y aprendo con la observación y contrastación de datos y evidencias -como no podía ser menos-.

Despues de haber entrevistado a muchos aspirantes a data scientist, asi así como haber entrenado a mas de 300 personas en ciencia de datos, me gustaría compartir mi experiencia en el proceso de contratacion, y algunas consideraciones adicionales.

Cómo entrevistar a un data scientist

La mejor estrategia de entrevista a un candidato a data scientist es enfocarse en su habilidad de resolver problemas; no tanto en sus conocimientos técnicos, ni tampoco en su formación (que por supuesto tambien son necesarios). No digo con esto omitir preguntas técnicas - conceptos estadísticos, algoritmos y modelos, programación, etc.-, sino enfóquese en entender cómo razona el candidato para resolver problemas.

Le aseguro que en la vida real el 90% de los problemas que tendrá que resolver como data scientist serán problemas aparentemente irresolubles.

“Según estudios psicológicos, la resolución de escenarios absurdos mejora la creatividad y el análisis de patrones”

No tenga inconveniente en platear al candidato escenarios absurdos e irreales, y preste atención a como razona el candidato su propuesta de resolver el problema. Quizá aporta una solución también absurda (prepárese para ello), pero si aporta una solución es mucho mas que no aportar nada.

Una técnica que ha sido muy eficiente en mi experiencia es preparar una prueba al candidato, ver como la resuelve y pedirle que explique sus conclusiones. Es decir, en vez de realizar una ‘entrevista’ como tal, preparar una prueba con un set de datos, y solicitar al candidato que resuelva un objetivo en un tiempo requerido, y que explique sus conclusiones y resultados.

Por ejemplo, si el candidato va a trabajar en un departamento de operaciones de cadena de suministro, se puede disponer de un set de datos en internet (hay cientos o miles disponibles) y pedirle que haga un modelo predictivo del tiempo de entrega de las mercancías, y que explique los resultados obtenidos. Deje que use el lenguaje de programación o el framework o las herramientas de su preferencia. Lo importante es que resuelva el problema, no enfocarse en las herramientas que usa para ello.

¿Pero qué es y qué hace un data scientist?

Un data scientist es un profesional capaz de resolver problemas operativos con datos; bien sea interpretando el pasado, diagnosticando las causas de eventos, o bien estimado el evento mas probable en el futuro. Además, un data scientist debe saber interpretar los resultados obtenidos de sus investigaciones, y lo que es más importante: debe ser capaz de explicar dichos resultados a cualquier audiencia -técnica o no-

No alt text provided for this image

Exacto; un data scientist es un individuo versado tanto en conocimientos técnicos (estadística aplicada, programación, ingeniería de datos, inteligencia de negocios, etc.), como en habilidades blandas (comunicación, interpretación, pensamiento crítico, etc.). Y quizá, lo más importante y más escaso: debe conocer y entender el área operativa o de negocio donde va a desempeñar sus funciones. De no ser así, debe tener la habilidad de aprender rápidamente como opera la actividad donde desempeñará sus funciones de data scientist.

Considere que no es lo mismo un data scientist que opera en recursos humanos, como otro que trabaja en marketing, o finanzas, o servicio técnico, u operaciones internas, o ingeniería, o farmacéutica, o producción industrial. Los datos son datos (estamos de acuerdo), pero el entorno es determinante por muchos matices que es necesario conocer.

No alt text provided for this image

Fuente: businessoverbroadway.com

Le aseguro que un buen data scientist no descansa hasta encontrar una solución ‘aparentemente imposible’ a problemas ‘aparentemente imposibles’. En la vida real, esto es más habitual de lo uno se imagina.

No alt text provided for this image

Consideraciones de la organización

Es fundamental tener muy claro el objetivo de por qué necesitamos contratar un data scientist. Es decir, definir muy bien el alcance de nuestro problema de recursos humanos. Así mismo, es tanto o más importante, conocer el estado de la organización en el ciclo de madurez de la ciencia de datos.

Menciono esto porque no siempre esta tan claro. He conocido gerentes que solo quieren contratar data scientists para dar una ‘imagen de modernidad digital y progreso’ frente a otros gerentes o departamentos, pero sin saber que trabajo se encomendara al futuro candidato. Conseguirá agotar al recurso humano y se ira a otro lugar tan pronto le sea posible.

Por otro lado, hay organizaciones que están convencidas que están listas para aplicar Machine Learning o Inteligencia Artificial, pero realizan la mayoría de su reportería de manera manual (copiar-pegar) en hojas de calculo o en diapositivas; o lo que es peor, no tienen un sistema de bases de datos debidamente arquitectado u organizado.

No alt text provided for this image

Para concluir

Antes de contratar a un data scientist, evalúe seriamente reeducar a su personal existente y dotarlo de conocimientos técnicos relativos a ciencia de datos. Su personal existente ya conoce bien su cultura empresarial, los problemas mas habituales y saben bien lo que funciona y lo que no funciona en su organización. Esto es algo que puede llevar años a un data scientist.

A lo largo de mis últimos 5 o 6 años de carrera profesional como data scientist, he tenido la ocasión de entrevistar laboralmente (o participar en entrevistas laborales de otros departamentos) a un buen número de candidatos a científico de datos; tanto individuos muy noveles (juniors) como experimentados (seniors).

Además de esto, he tenido la gran dicha de entrenar a más de 500 compañeros de trabajo en ciencia de datos y analítica avanzada en los últimos 2 años. Profesionales de distintas áreas como finanzas, operaciones, marketing, contabilidad, recursos humanos, servicio al cliente, etcétera. 

P. J. Moreno

Sr Data Scientist