opinion

¿Cómo la inferencia de IA están transformando las demandas de centros de datos?

José Alberto Llavot | Gerente de Preventa y Desarrollador de Negocios en Schneider Electric para México y Centroamérica | - Publicado:

La Inteligencia Artificial (IA) generativa está poniendo a prueba la infraestructura tradicional de los centros de datos. Para responder bien, primero hay que distinguir el tipo de carga: no es lo mismo entrenar modelos que ejecutar inferencia. Esa diferencia define en qué modernizaciones conviene invertir, desde energía y enfriamiento hasta la manera de operar y escalar.

Versión impresa

El entrenamiento es la etapa en la que se construye el modelo y, por naturaleza, concentra la mayor exigencia técnica. Requiere clústeres con procesadores gráficos (Graphics Processing Unit o GPU) y densidades que con frecuencia superan los 100 kW por rack, por lo que la gestión térmica avanzada deja de ser opcional. En este contexto, soluciones como el enfriamiento líquido directo al chip o los intercambiadores de calor en puertas traseras resultan clave, al igual que arquitecturas eléctricas modulares y con capacidad de crecer al ritmo de los aceleradores, cuyo consumo y potencia térmica de diseño (Thermal Design Power o TDP) tienden a aumentar generación tras generación.

La inferencia es la etapa en la que el modelo ya entrenado se pone a trabajar y genera resultados con datos nuevos. Va desde interacciones sencillas hasta análisis en tiempo real en salud, comercio y operaciones industriales. Aunque por servidor suele demandar menos que el entrenamiento, hoy crece en complejidad y escala, y por eso eleva la densidad eléctrica. Puede verse en despliegues por debajo de 40 kW por rack, pero también en rangos de 40 a 80 kW en casos avanzados, sobre todo cuando se requieren tiempos de respuesta muy bajos. Además, es ahí donde se materializa el retorno de la IA, por lo que optimizar la inferencia pasa a ser una prioridad.

La pregunta relevante entonces no es solo cuánta potencia se necesita, sino dónde ocurre esa inferencia y por qué importa. A diferencia del entrenamiento, que tiende a concentrarse en grandes instalaciones hiperescalables, la inferencia se distribuye entre la nube pública, centros de datos de terceros (colocation), entornos en las propias instalaciones (on-premise) y el borde (edge), cerca de donde se generan los datos. Hacia el final de la década, convivirán centros con densidades moderadas enfocadas en inferencia y otros de ultra alta densidad orientados a entrenamiento, lo que aumenta la diversidad de diseños.

Artículo completo en www.panamaamerica.com.pa

Más Noticias

Sociedad Apede rechaza regulación de 'apps' de transporte: Es un retroceso, afecta clima de inversión e impacta el turismo

Provincias Adolescente asesina a un hombre de varias puñaladas durante una riña en Chame

Deportes Ismael anota doblete y León sigue metido en zona de liguilla en México

Deportes Patiño llega a 500 hits el día que Chiriquí avanza a otra final; no se retirará este año

Variedades Gracie Bon perdió más de $200 mil en un negocio tras confiar en dos 'psicópatas' que la engañaron

Política Nuevo magistrado del TE tendrá la responsabilidad de restaurar la confianza del pueblo, asegura Camacho

Sociedad Prohíben solicitar certificados de salud mental para trámites de trabajo y estudios en Panamá

Variedades Presentan 'Panama Latin Treasures', con una rareza musical de Rubén Blades

Sociedad Baja la pretensión salarial de los panameños; en marzo se situó en $984

Sociedad Mulino anuncia revisiones al decreto que regula 'apps' de transporte: 'No estamos para perjudicar a nadie'

Política Bloise no le teme a una expulsión de Vamos; Zulay le recuerda a Juan Diego las diferencias de trato en su bancada

Provincias Delincuentes asaltan un bus de la ruta expreso Panamá-Colón; usuarios están preocupados

Mundo Trump advierte que Irán 'no puede chantajear' a EE.UU. con un nuevo cierre del estrecho de Ormuz

Sociedad Mizrachi sobre regulación de 'apps' de transporte: 'Bajan a Uber al nivel del taxi'

Economía Mitradel da plazo de 10 días para corregir irregularidades en proyecto del Cuarto Puente

Sociedad CSS destaca resarcimiento de $2.4 millones por caso de corrupción

Economía Panamá suscribe Memorando de Entendimiento con la OCDE

Sociedad Si vas a viajar al Mundial, vacúnate contra el sarampión, recomienda el Minsa

Variedades El príncipe Enrique y Meghan Markle se reúnen con supervivientes del ataque de Bondi

Judicial Violencia psicológica contra los hombres también será castigada; penas van de 5 a 8 años de cárcel

Política PRD pide al Parlacen juramentar a Nito Cortizo y a Gaby Carrizo

Sociedad Billeteros piden suspensión de la Lotto y el Pega 3, tras fallo de la Corte Suprema

Suscríbete a nuestra página en Facebook