Un sistema de representación de datos creado por IBM muestra el big data que consiste en las ediciones de Wikipedia realizadas por el bot Pearle Visto en Wikipedia |
El Científico de Datos: una nueva (y necesaria) profesión
Publicado por Pablo Albarracín para Ae tecno - América Economía
El big data y las nuevas tecnologías están requiriendo de profesionales con habilidades en ciencias de la computación, matemáticas, estadística y negocios, algo que se está volviendo más que un reto.
Seguramente usted ya alcanzó los 500 contactos en LinkedIn y si aún no entra en aquel ‘selecto’ grupo, quizás deba poner atención en la herramienta de esta red social profesional ‘Gente a la que podrías conocer’, puesto que si conoces a X persona es probable que puedas conocer a ciertos contactos de dicha persona.
Esto que puede verse tan simple, fue obra del científico de datos (data scientists), Jonathan Goldman, quien descubrió esta correlación para aumentar el número de seguidores de LinkedIn. Una ‘sencilla’ herramienta.
Lo que realizó Goldman, analizar y correlacionar big data para obtener ventajas competitivas, es lo que están haciendo compañías como Amazon, Facebook, LinkedIn, Google o YouTube, que buscan cómo utilizar de mejor manera la enorme cantidad de datos que están acumulando día tras día. Quien se encarga de esta labor es el Científico de Datos (CD), una nueva especialidad llamada a convertirse en una de las profesiones más relevantes, y mejor pagadas, del mundo hiperconectado en que vivimos.
Para 2015, cerca de 4,4 millones de empleos TI a nivel global, tendrán relación directa con el procesamiento de big data, señala Gartner.
¿Qué es un Científico de Datos?
Un CD es un profesional que debe provenir y dominar (ojalá con estudios de Ph.D. o Magíster) las ciencias matemáticas y la estadística, además de acabados conocimientos de programación (y sus múltiples lenguajes), ciencias de la computación y analítica. Es un híbrido entre tecnología y análisis cuantitativo. No se descartan también estudios en física, biología o ciencias sociales.
Por otro lado, no menos relevante, el CD debe contar con conocimientos y habilidades para saber comunicar lo que va encontrando, tanto al área de negocios como a TI, además de ser un buen transformador, decidor e interlocutor. No se trata solo de dominar la tecnología, la programación o las bases de datos, sino que el CD debe ser capaz de modificar (para mejor) la dirección del negocio.
Las grandes compañías y corporaciones, desde esferas tan disímiles como pueden ser la banca, el retail, las redes sociales, el comercio online, el turismo, o los centros de investigación científica, se dieron cuenta que el big data no sirve de nada si no se le extrae la inteligencia que posee. Es por ello, que el CD está llamado a cambiar las decisiones de las compañías identificando nuevas oportunidades de negocio. Colosal labor.
Por ejemplo, según señala la compañía estadounidense SAS, una de las líderes en soluciones de inteligencia de negocios (BI), soluciones estadístcas y big data, Google utiliza sus 600 científicos de datos para redefinir su core de búsquedas y sus algoritmos de ad-serving, Zynga usa sus CD para seleccionar juego a juego productos relacionados a sus clientes, mientras que General Electric, optimiza los intervalos de mantención de productos industriales, y algunas compañías de análisis de big data en salud, utilizan los CD para descubrir el tratamiento más efectivo para diferentes enfermedades.
El problema: ¿dónde encontrarlos?
Si bien el big data está atravesando a múltiples compañías (muchas de ellas de Latinoamérica incluso), aún es una tarea compleja contratar o seleccionar un buen equipo de CD para que se haga cargo del big data. Como señalamos con anterioridad, los CD provienen del mundo de las ciencias de la computación, las matemáticas y la estadística, y es precisamente desde estas disciplinas desde donde las empresas extraen sus CD.
Según un estudio de la Unidad de Inteligencia del Economist, donde se entrevistó a 600 ejecutivos globales, 54% de los ejecutivos de Norteamérica señalaron que encontrar la gente adecuada para lanzar un exitoso proyecto de big data, es el obstáculo N° 1 para no hacerlo.
Incluso en los EE.UU. exiten pocas especializaciones universitarias en el área. Lo que están haciendo algunas compañías es crear dentro de su fuerza laboral grupos a los que se los capacita en estas ciencias. Tal es el caso de EMC, que creó el programa de entrenamiento Data Science and Data Analytics, convencidos de que contar con habilidades en esta área mejoraría sus productos de big data y la relación con sus clientes.
Mientras que SAS está colaborando con la Universidad de Carolina del Norte para crear un master en analítica, que incluye entrenamiento para big data en la malla curricular. O el caso del programa de Silicon Valley, Insight Data Science Fellow Program, que toma a científicos por 6 semanas y los entrenan en habilidades propias de un CD.
Tampoco es descartable, para quien esté interesado en especializarse como CD, poner atención en seguir ciertos cursos o materias. “Trate de tomar algunos de los cursos de matemáticas de pregrado que se haya perdido, como Álgebra Lineal, Cálculo Avanzado, Difernecial, Probabilidad y estadística son los más importantes. Después de eso, tomar algunos cursos de aprendizaje automático”, dice Peter Skomoroch, CD de LinkedIn. / Ae tecno - América Economía