Los científicos de datos que trabajan con el aprendizaje automáticonos han traído la era actual de big data. Los modelos tradicionales de machine learning (ML) ahora tienen mucho éxito en la predicción de resultados basados en los datos. Pero los modelos de ML generalmente no están diseñados para responder qué se podría hacer para cambiar esa probabilidad. Este es el concepto de inferencia causal. Y hasta hace poco, había pocas herramientas disponibles para ayudar a los científicos de datos a entrenar y aplicar modelos de inferencia causal, elegir entre los modelos y determinar qué parámetros usar.
IBM Research cambió esto. Lanzado en 2019, IBM Causal Inference 360 Toolkit de código abierto, es el primero de su tipo en ofrecer un conjunto completo de métodos, todo bajo una API unificada, que ayuda a los científicos de datos a aplicar y comprender la inferencia causal en sus modelos.
Ahora, IBM presentó un nuevo y personalizadositio webpara el IBM Causal Inference 360 Toolkit, con tutoriales, información de soporte y demos, las cuales muestran las capacidades para múltiples dominios, incluida la salud, la agricultura y el marketing en los sectores financiero y bancario. También se lanzó una nueva versión de la biblioteca Python de código abierto con funcionalidades adicionales.
Tomar decisiones implica hacer preguntas y tratar de obtener la mejor respuesta posible. A la pregunta: "¿Qué pasa si como huevos todos los días en el desayuno?", dependiendo de lo que se esté midiendo y de los factores adicionales involucrados, la respuesta podría variar ampliamente. ¿Y si las personas que tienden a desayunar huevos todas las mañanas son también las que hacen ejercicio todas las mañanas? Quizás la diferencia que vemos en el resultado estaría impulsada por el ejercicio y no por comer huevos.
Esto se denomina variable de confusión, que afecta tanto a la decisión como al resultado. Y eso es lo que la inferencia causal intenta resolver. ¿Cuál es la respuesta a la pregunta después de controlar (tanto como sea posible a partir de los datos) la variable de confusión?
A continuación, se intenta explicar cómo se influye en el resultado en función de diferentes parámetros -por ejemplo, cuántos huevos se comen; qué se come con los huevos; si la persona tiene sobrepeso, etc.-. También podemos intentar dar cuenta de lo que estamos buscando, si nos interesa si la persona aumentaría de peso, dormiría mejor, comería menos durante el día o bajaría el colesterol, por ejemplo.
En resumen, podría ser fácil comenzar con una pregunta que se pueda responder utilizando datos. Pero para obtener una respuesta confiable, se necesitaría ajustar los parámetros involucrados y el tipo de modelo que se está utilizando.
La inferencia causal consiste en un conjunto de métodos que intentan estimar el efecto de una intervención sobre un resultado a partir de datos de observación. Con IBM Causal Inference 360 Toolkit, las personas pueden usar múltiples herramientas para mover sus procesos de toma de decisiones desde un escenario de “mejor estimación” a respuestas concretas basadas en datos.
La librería de IBM Causality 360 es una biblioteca Python de código abierto que utiliza modelos de machine learninginternamente y, a diferencia de la mayoría de los paquetes, permite a los usuarios conectar casi cualquier modelo de ML que deseen. También tiene metodologías para seleccionar los mejores modelos y sus parámetros basados en paradigmas de ML como la validación cruzada, y para utilizar novedosas y bien establecidas métricas causales específicas.
En el laboratorio de IBM Research en Haifa, Israel, han utilizando el Causal Inference 360 Toolkit como parte de suinvestigación sobre la reutilización de fármacos1. La reutilización o reposicionamiento de fármacos es un método para encontrar nuevos usos terapéuticos para los medicamentosaceptados. Aquí, la pregunta que el equipo hizofue: "¿Qué pasaría si el paciente X tomara el medicamento Y?"
El resultado fue eldescubrimiento de dos nuevos tratamientos potenciales para la demencia que suele acompañar a la enfermedad de Parkinson. Puede encontrar más detalles sobre cómo funcionó el modelado causal en esta investigación aquí.
En otro ejemplo, el equipo buscaba comprender si las nuevas prácticas de riego contribuyen a la reducción deseada de la contaminación y la filtración de nutrientes. Para hacer esto, usaron un conjunto de datos que capturó múltiples aspectos del uso agrícola de la tierra, incluido su método de riego y medición de escorrentía. Notaron que los datos mostraron poco efecto. Luego, usaron el IBM Causal Inference 360 Toolkit para corregir el hecho de que los métodos de riego dependen en gran medida del tipo de uso de la tierra y del cultivo. El resultado cambió: demostraronque la introducción de estas nuevas técnicas de riego reduce la escorrentía. Podría ahorrar fertilización y agua, así como reducir la contaminación de la cuenca. Esta disminuciónse puede cuantificar aún más para estimar la compensación entre los ahorros y la inversión inicial.
Con la nueva capacidad y el sitio web de IBM Causal Inference 360 Toolkit, IBM espera ayudar alas personas en el campo de la inferencia causal para que apliquen fácilmente las metodologías de machine learning, y que los profesionales de ML pasen de hacer preguntas puramente predictivas a preguntas de 'qué pasaría si' utilizando inferencia causal.
- Daniella Zolezzi
- Consultora de Proyectos, APOYO Comunicación
- dzolezzi@apoyocomunicacion.com
- tel:947102205
International Business Machines Corporation (IBM) (NYSE: IBM) es una empresa multinacional estadounidense de tecnología y consultoría con sede en Armonk, Nueva York. IBM fabrica y comercializa hardware y software para computadoras, y ofrece servicios de infraestructura, alojamiento de Internet, y consultoría en una amplia gama de áreas relacionadas con la informática, desde computadoras centrales hasta nanotecnología.
Acerca de APOYO Comunicación
Somos una consultora de comunicación, que busca ser aliada de sus clientes, ofreciendo servicios integrados a través de cuatro grandes disciplinas: comunicación externa, comunicación interna, insights y transformación digital, para contribuir con los objetivos de comunicación y reputación de nuestros clientes y que éstos a su vez se vean reflejados en los resultados de negocio.
Datos del contacto
-
- Daniella Zolezzi
-
Consultora de Proyectos
APOYO Comunicación - dzolezzi@apoyocomunicacion.com
Temas relacionados
Noticias relacionadas
IBM anuncia watsonx.governance para ayudar a las organizaciones con la gobernanza y confiabilidad de la IA generativa
watsonx.governance ayuda a: gestionar la IA para cumplir con las próximas regulaciones y políticas de seguridad y transparencia globales. Detectar y mitigar proactivamente los riesgos, monitoreando...
Talento y habilidades en la IA Generativa: lo que los ejecutivos necesitan saber y hacer hoy
Con la IA generativa redefiniendo cada trabajo y cada tarea, desde el nivel inicial hasta el ejecutivo, los líderes empresariales deber saber y hacer tres cosas claves: I. La IA generativa involuc...
Reporte de IBM: el costo promedio de una filtración de datos en Latinoamérica alcanzó los USD 2,46 millones en 2023
•En la región, las organizaciones con un uso extensivo de seguridad impulsada por inteligencia artificial y automatización pudieron reducir los costos de las filtraciones de datos en USD 1,04 millo...
Tres acciones que impulsan la inclusión en los entornos laborales
IBM recomienda 3 áreas para ayudar a las empresas a convertirse en mejores aliadas LGBTQIA+ y generar un impacto positivo en los entornos laborales: Establecer expectativas claras para los colabora...
Estudio IBM: Los datos inadecuados dificultan el progreso de los objetivos de ESG en América Latina
• Los ejecutivos de América Latina citan los datos inadecuados (43%) como la barrera principal que retiene el progreso de ESG. •Solo 4 de cada 10 consumidores encuestados en América Latina sienten ...