Cómo aplicar el aprendizaje automatizado en forma más inteligente
Conceptos como la inteligencia artificial explicable, los sesgos algorítmicos y la privacidad por diseño han brindado lecciones respecto a las limitaciones de la inteligencia artificial.
(The New York Times Syndicate)
En años recientes las organizaciones han girado hacia amplificar su poder predictivo reuniendo datos masivos con aprendizaje automatizado complejo, o autoML. Dichos esfuerzos son presentados típicamente como un intento para mejorar el aprendizaje automatizado y “democratizar” el conocimiento al permitir que las firmas con experiencia limitada en la ciencia de datos desarrollen procesos analíticos capaces de resolver sofisticados problemas empresariales.
Como parte de nuestra investigación con Rick Netemeyer y Donald Adjeroh, estamos examinando la eficacia de autoML para detectar los eventos adversos en grandes cantidades de contenido digital creado por los usuarios. La meta del proyecto es usar aprendizaje automatizado para generar señales exactas y oportunas al detectar potenciales eventos adversos. Por ejemplo, varios grupos interesados — incluyendo fabricantes de productos y grupos de defensa del consumidor – tal vez quisieran saber si ciertos productos y eventos adversos (como “Prius” y “pedal atorado”) aparecen desproporcionadamente en las búsquedas en línea analizadas por nuestros modelos de aprendizaje profundo.
LEA: Diseñe un sistema de productividad que le funcione
A la luz de nuestra investigación hasta este punto, sugerimos el despliegue de un nuevo enfoque al que llamamos “aprendizaje automatizado aumentado”, o augML. AugML enriquece el concepto del autoML al enfatizar la importancia de los expertos, el contexto y los datos complementarios. Los directivos y científicos de datos que buscan aumentar de esta forma sus capacidades de aprendizaje automatizado deberían considerar lo siguiente:
— Semi-automatizar el proceso de desarrollo del modelo: Los avances en aprendizaje automatico han incrementado tanto la complejidad de las tareas del modelado predictivo como las oportunidades para automatizar esas tareas. Sin embargo, al menos en el futuro cercano, la automatización no podrá reemplazar al conocimiento de los expertos. En nuestro proyecto de detección de eventos adversos, el proceso para alcanzar la mejor estructura para nuestra arquitectura de aprendizaje profundo fue semiautomático, guiado por el análisis de los expertos respecto a los comportamientos subyacentes a analizar y aumentado con aprendizaje automatizado.
VER TAMBIÉN: El coronavirus de China ha revivido temores económicos en el mundo
— Contextualizar el aprendizaje automatizado: En un nivel básico el aprendizaje automatizado puede describirse como algoritmos que aprenden patrones a partir de los datos. La forma en que los datos se le presentan al algoritmo es crítica para construir modelos de aprendizaje automatizado de alto desempeño. La riqueza representacional proviene de incorporar una serie de constructos altamente contextualizados y personalizados específicamente de acuerdo al problema. Esto es logrado por medio de representation engineering, el mapeo intencional de datos estructurados y desestructurados en una arquitectura de datos personalizada y significativa.
— Equilibrar profundidad y amplitud: Los métodos avanzados de aprendizaje automático son muy aptos para descubrir patrones en cada esquina y recoveco de una serie de datos. Los métodos AutoML han perfeccionado este beneficio al usar transfer learning — una técnica de aprendizaje automatizado en la que los patrones de una serie de datos son redefinidos usando insights de datos externos similares. Por ejemplo, si una firma quiere inferir los sentimientos de sus consumidores a través de las transcripciones de las llamadas a su centro de ayuda telefónica, autoML puede aprovechar datos comparables de transcripciones de datos en otras firmas. Sin embargo, nuestra investigación muestra que, en lugar de extraer de sus datos primarios hasta la última gota de conocimiento, las firmas pueden obtener un poder predictivo significativamente mayor al integrar fuentes complementarias. En el caso del problema con el centro de ayuda telefónica, los datos complementarios podrían incluir grabaciones de audio, reseñas del producto y encuestas de satisfacción.
INTERESANTE: Cómo superar su hábito de distraerse
Conceptos como la inteligencia artificial explicable, los sesgos algorítmicos y la privacidad por diseño han brindado lecciones respecto a las limitaciones de la inteligencia artificial. En la misma vena, necesita discutirse más el cómo maximizar valor a partir del aprendizaje automático. Utilizar un enfoque aumentado en el aprendizaje automático nos permitió desarrollar una robusta capacidad de IA que era menos artificial y más inteligente.