Article (tiempo de lectura: 5 minuto)

Dejemos de lado la discusión entre el AutoML y los científicos de datos

En lugar de elegir invertir en AutoML o en científicos de datos, los líderes en tecnología deben reconocer que el futuro está en ambos.

Eric Miller / Rackspace Technology, Mark McQuade / Onica

Mientras que los líderes en tecnología buscan aplicar el machine learning para resolver los problemas comerciales, deben dejar de lado la pregunta acerca de si invertir en automatización o en talento humano en ciencia de datos, o arriesgarse a perder el valor comercial de ambos.

Hemos visto que se ha adoptado con éxito la automatización para administrar la infraestructura y aplicar prácticas de integración continua/entrega continua (CI/CD), a fin de reducir los plazos de implementación. En ambos casos, la automatización reemplaza los procesos manuales que son tediosos, consumen mucho tiempo y son propensos a errores. Además, aumenta la eficiencia y deja que haya disponibles recursos humanos para realizar un trabajo que tenga un mayor impacto.

El machine learning automático (AutoML) promete hacer exactamente eso para el machine learning.

Las tareas que realizan las herramientas de AutoML son más elaboradas, ya que el machine learning es exponencialmente más complejo que la infraestructura o la CI/CD. Esta es una muy buena noticia para los líderes en tecnología. La automatización exitosa de un flujo de trabajo más complicado significa que las empresas pueden obtener mayores recompensas con menos esfuerzo. Dado que los conjuntos de habilidades de los científicos de datos son costosos y difíciles de conseguir, las herramientas de AutoML permitirán a las organizaciones acceder a los beneficios de las soluciones de machine learning a costos más razonables.

Esto ha impulsado de forma natural a los líderes tecnológicos y a la comunidad de la ciencia de datos a comparar el AutoML con los seres humanos, preguntándose cuál es mejor y si los científicos de datos quedarán en el olvido. Pero la respuesta a esta pregunta no está claramente definida. Analicemos por qué y exploremos algunas otras preguntas que deberíamos hacer.

¿El AutoML es mejor que un científico de datos?

En el caso del machine learning, la métrica para "mejor" fluctúa en función del problema comercial que usted intenta resolver.

Las herramientas de AutoML tienen ventajas sobre los científicos de datos humanos en lo que respecta a la velocidad y a la reducción de riesgos, pero el cerebro humano es superior a una máquina de otras maneras. Un científico de datos aporta a un proceso un nivel de matiz, intuición y resolución creativa de los problemas que el AutoML no puede igualar así nomás.

Preguntar si el AutoML es mejor que el machine learning creado por personas es como preguntarse si conviene alquilar una impresora 3D o contratar a un escultor que tiene una maestría. La respuesta radica en lo que uno necesita del producto. 

¿Busca una creación bien detallada e innovadora que resuelva un problema nuevo o un mecanismo que cumpla con las dimensiones y el peso correctos?

Como una impresora 3D, las herramientas de AutoML pueden alcanzar un nivel aceptable de precisión en mucho menos tiempo que una persona. Si es suficiente para el caso de uso comercial, ¿por qué no utilizar AutoML en lugar de horas de mano de obra? Con la automatización, renuncia al control total en favor de la eficiencia y queda con una capacidad limitada para acceder y corregir los modelos o algoritmos subyacentes para su solución. Cuando el caso de uso es más complejo, el aporte humano es fundamental. Un científico de datos puede crear soluciones más matizadas y con mayor rendimiento para aplicaciones complejas de machine learning, como la ingeniería de las características y el ensamblaje de modelos, al tiempo que mantiene un control completo de los modelos y algoritmos que desarrolla.

En otros casos, la métrica de "mejor" no se vincula con los resultados, sino con las aptitudes con las que cuenta una organización. No toda empresa tiene un equipo de científicos de datos especializados ni una necesidad urgente de invertir en dicho equipo. En estos casos, el AutoML puede calificarse como una "mejor" opción solo porque les permite a las organizaciones hacer más con las aptitudes internas que tienen.

¿Reemplazará el AutoML a los científicos de datos?

La respuesta es "sí". Ya estamos viendo que esto ocurre.

En los casos en los que una máquina puede desarrollar un modelo de machine learning más eficiente y todavía tener un rango de exactitud aceptable, tiene sentido que las organizaciones elijan el AutoML. Estas herramientas abren la posibilidad de que los programadores que no cuentan con antecedentes clásicos en ciencia de datos accedan al machine learning. Estamos viendo a más ingenieros de software desarrollar conocimiento en machine learning en el trabajo, y esto forma a un nuevo contingente de "ciudadanos científicos de datos". Es posible que no cuenten con la experiencia necesaria para diseñar modelos complicados de machine learning, pero pueden aprovechar las herramientas del AutoML para resolver problemas reales para sus organizaciones.

Aunque el AutoML puede soportar parte del flujo de trabajo del machine learning sin necesitar a los científicos de datos, eso no significa que el conjunto de aptitudes de la ciencia de datos se volverá obsoleto. Los científicos de datos con formación clásica son tan importantes, si no más, ahora que más organizaciones pueden acceder al AutoML.

La discusión entre el AutoML y los científicos de datos ha fracasado por naturaleza, y alentamos a los líderes en tecnología a profundizar en la pregunta real: ¿cómo las empresas pueden aprovechar plenamente el AutoML y los científicos de datos?

Los científicos de datos son los ganadores reales con el AutoML

Los líderes en tecnología inteligente se están dando cuenta rápidamente de que no se trata de elegir entre el AutoML o los científicos de datos, sino de elaborar una estrategia para sacar provecho de ambos. El AutoML solo aumentará el valor de los científicos de datos humanos.

Los científicos de datos que adopten AutoML podrán expandirse todavía más en las capacidades del machine learning y ser aún más eficaces en lo que hacen. En el tiempo en que un científico de datos tardaría en fabricar diez experimentos, ahora puede realizar centenares de experimentos. Los científicos de datos expertos ven esto como una oportunidad para pasar la mayor parte de su tiempo explorando los problemas técnicos de manera más exhaustiva, lo que les significará más beneficios para sus organizaciones.

Los científicos de datos exitosos adoptarán las herramientas de AutoML de la misma manera que la industria de la construcción adopta las herramientas de panelización y prefabricación: como un mecanismo para reducir el tiempo que dedican a tareas repetitivas y permitir que una máquina prepare los materiales que necesitan para realizar un trabajo más especializado.

Deje de lado la discusión entre el AutoML y los científicos de datos, necesitará ambos

Es inútil intentar establecer un ganador en el debate del AutoML frente a los científicos de datos. El futuro no es una discusión entre el AutoML o los científicos de datos, es una discusión entre el AutoML y los científicos de datos.

Los científicos de datos que adopten el AutoML como un acelerador para su potencial serán los verdaderos ganadores.

Los líderes en tecnología deben adoptar el AutoML, no como un sustituto individual para los científicos de datos, sino como una forma de empezar a cosechar los beneficios del machine learning antes de que se pueda desarrollar el conjunto de aptitudes internas de la ciencia de datos, y como una forma de impulsar el impacto de los científicos de datos internos con los que cuenta. Las organizaciones inteligentes pueden empezar a sumergirse en el AutoML ahora mismo y, con el soporte de un conjunto de aptitudes de programadores, estar mejor preparadas para reclutar a los mejores científicos de datos a medida que avanzan.

Únase a la conversación: encuentre Solve en Twitter and LinkedIn, o síganos en RSS.

Acerca del autor

Director sénior de Estrategia TécnicaEric Miller

Eric Miller es el director sénior de Estrategia Técnica de Rackspace. En ese puesto, ofrece liderazgo en consultoría estratégica con un historial demostrado en el desarrollo de prácticas en el ecosistema de la red de socios de Amazon (APN). En...

Más

Arquitecto de soluciones en la nube Mark McQuade

Mark McQuade es arquitecto de soluciones en la nube en Onica, una empresa de Rackspace Technology. A principios de su carrera, ocupó roles de soporte técnico, operaciones, desarrollo comercial y liderazgo durante 13 años en un proveedor de...

Más


Serie Solve Strategy

Inscríbase en uno de estos eventos mundiales, o en todos, en los que participarán personas influyentes, expertos, técnicos y líderes de la industria

Inscribirse