Vigilancia de la huella de carbono del aprendizaje automático
A los internautas les cuesta imaginar que interactuar con ChatGPT o ver vídeos recomendados por YouTube genera emisiones de gases de efecto invernadero muy reales. Para los investigadores, en cambio, la huella de carbono creada por los ordenadores y otros dispositivos digitales es un tema muy candente en nuestra era del calentamiento global. Y nos recuerdan que los combustibles fósiles (carbón, petróleo y gas) se queman para generar electricidad en la red donde cargamos nuestras baterías y enchufamos nuestras máquinas, y no olvidemos toda la infraestructura de redes e Internet, sobre todo los centros de datos que almacenan nuestros datos y aplicaciones, que consumen enormes cantidades de energía en todo el mundo.
En Francia, la cuestión es objeto de un Programa Nacional Digital y Medio Ambiente lanzado por el Instituto Francés de Investigación en Informática y Automática en 2022. Y las preocupaciones que ha suscitado son compartidas en todo el mundo, sobre todo por la asombrosa magnitud de las emisiones digitales que se prevé que generemos en el futuro. A principios de este año, Soumya Sudhakar, Vivienne Sze y Sertac Karaman, del Instituto Tecnológico de Massachusetts (Estados Unidos), presentaron los alarmantes resultados de un modelo que simulaba las emisiones potenciales del procesamiento de datos a bordo en vehículos autónomos propulsados por electricidad, que hacían un amplio uso de sensores e inteligencia artificial (IA). En concreto, llegaron a la conclusión de que la computación requerida por una flota mundial de mil millones de vehículos autónomos tendría una huella de carbono al menos tan grande como la generada actualmente por todos los centros de datos del mundo.
Una cuestión cada vez más urgente por el auge de la IA
Un estudio publicado a mediados de febrero de 2023 modeliza las emisiones generadas por el aprendizaje automático entre 2012 (año de gran avance en este campo) y 2021. Los dos autores, un investigador especializado que trabaja para la empresa Hugging Face y un estudiante de posdoctorado del Instituto de Inteligencia Artificial de Quebec, seleccionaron 95 algoritmos de ML mencionados en 77 artículos científicos que se extrajeron de cinco campos: clasificación de imágenes, detección de objetos, traducción automática, agentes conversacionales o chatbots y reconocimiento de entidades nombradas (un aspecto del procesamiento del lenguaje natural que consiste en clasificar palabras en una categoría: personas, lugares, empresas, fechas, cantidades, direcciones, etc.).
Es realmente difícil reunir toda la información necesaria para realizar estimaciones detalladas de la huella de carbono.
No se trataba de evaluar la cantidad exacta de dióxido de carbono vinculada a cada una de ellas, sino de esbozar las principales tendencias. "Es muy difícil reunir toda la información necesaria para realizar estimaciones detalladas de la huella de carbono", señala Sasha Luccioni, de Hugging Face. "Los trabajos sobre IA tienden a no revelar la cantidad de potencia informática utilizada, ni dónde se llevó a cabo el entrenamiento".
Un menor rendimiento no implica necesariamente menos emisiones
El proyecto se centró en la fase de entrenamiento de los modelos de aprendizaje, que requiere una gran cantidad de potencia de cálculo. La primera conclusión fue que 73 de los 95 modelos se entrenaron utilizando electricidad generada principalmente a partir de carbón, gas natural y petróleo. A título ilustrativo, los modelos alimentados con energía procedente del carbón generaron una media de 512 g de CO2 equivalente por kilovatio-hora, frente a los 100,6 g de los que se alimentaron principalmente con energía hidroeléctrica (se generaron varios gases de efecto invernadero, pero se convirtieron en CO2 equivalente para proporcionar una cifra única). En segundo lugar, en este contexto es importante señalar que un mayor consumo de electricidad no implicaba necesariamente una mayor huella de carbono, dadas las bajas emisiones de los modelos que funcionaban con hidroelectricidad. Otra conclusión fue que, al comparar dos modelos propulsados por combustibles fósiles, el rendimiento no se correlacionaba necesariamente con una menor huella de carbono.
La huella de carbono de los algoritmos de traducción automática disminuye desde 2019
Sin embargo, los investigadores no observaron "un aumento sistemático de las emisiones de carbono para tareas individuales." Las huellas generadas por los modelos de clasificación de imágenes y los chatbots siguieron creciendo, pero las de los algoritmos de traducción automática han disminuido desde 2019.
Sin embargo, el hecho de que hubo un aumento general fue innegable. Los modelos de aprendizaje generaron una media de 487 toneladas equivalentes de CO2 en 2015-2016. En 2020-2022, esta cifra, que solo correspondía a la formación, alcanzó las 2020 toneladas. El despliegue también tuvo un impacto importante. Una sola solicitud de ChatGPT puede ciertamente satisfacerse con un coste mínimo en términos de energía, pero los millones de solicitudes dirigidas cada día a un número de chatbots en constante crecimiento es mucho más problemático. "En eso estoy trabajando ahora", señala Sasha Luccioni. "Sin embargo, sigue siendo una tarea compleja, dado que la forma en que se despliegan los modelos, el hardware utilizado y el escalado, etc. influyen mucho en la energía necesaria y el carbono emitido".

Comentarios
Publicar un comentario