Una startup de Miami dice haber roto un ‘cuello de botella’ que frena a la IA: asegura haber resuelto un problema matemático que abarataría los modelos

Imagen autor
Publicado el: 3 de julio de 2026 a las 12:46
Síguenos
Logotipo de SubQ, la tecnología desarrollada por la startup Subquadratic para reducir el coste computacional de la inteligencia artificial.

La inteligencia artificial tiene un problema que ya no se puede esconder detrás de palabras técnicas. Cada vez hace más cosas, pero también necesita más electricidad. Y eso, en plena transición energética, importa mucho.

Ahora una startup de Miami llamada Subquadratic asegura haber encontrado una salida parcial a ese atasco. Su modelo, llamado SubQ, promete leer enormes cantidades de texto con mucha menos computación que los sistemas actuales. La idea suena potente, casi demasiado. Por eso la clave no está solo en el anuncio, sino en las pruebas.

El coste oculto de la IA

La Agencia Internacional de la Energía ya ha puesto cifras al problema. Los centros de datos consumieron alrededor del 1,5 % de la electricidad mundial en 2024, unos 415 TWh, y podrían superar los 945 TWh en 2030. Eso es más o menos lo que consume hoy Japón en un año. No es poca cosa.

Además, la propia AIE avisó en abril de 2026 de que el consumo eléctrico de los centros de datos subió un 17 % en 2025, mientras que el de los centros centrados en IA creció todavía más rápido. La paradoja es clara, cada tarea de IA puede ser más eficiente, pero si cada vez usamos más IA, la demanda total sigue creciendo.

Qué promete SubQ

Subquadratic afirma que SubQ está construido para trabajar con contextos de millones de tokens. En lenguaje sencillo, esto significa que el modelo puede leer y relacionar muchísima más información de una vez, como contratos largos, repositorios de código completos o grandes colecciones de documentos.

La empresa presentó SubQ 1.1 Small el 16 de junio de 2026 y asegura que su tecnología usa 64,5 veces menos computación que la atención densa en una ventana de un millón de tokens. También afirma que funciona 56 veces más rápido que FlashAttention-2 en ese mismo tamaño de contexto.

Por qué esto importa

Los modelos actuales se apoyan en una arquitectura llamada Transformer, presentada en 2017 en el trabajo científico “Attention Is All You Need”. Ese avance abrió la puerta a buena parte de la IA moderna, pero trajo una mochila pesada.

El problema está en la llamada atención densa. El modelo compara cada fragmento de texto con todos los demás para entender relaciones. Si el texto se duplica, el trabajo no se duplica, se multiplica mucho más. En la práctica, eso implica más chips trabajando, más calor, más refrigeración y más presión sobre la factura de la luz.

SubQ intenta cambiar esa lógica. En vez de mirar todas las relaciones posibles, usa una atención dispersa que selecciona las partes relevantes según el contenido. Es como leer un informe buscando lo importante, no repasando cada palabra contra todas las demás.

Las pruebas publicadas

Appen, una empresa dedicada a evaluación de modelos, ha publicado pruebas sobre SubQ 1.1 Small. Según su informe, el modelo logró un 100 % de recuperación exacta en pruebas de “aguja en un pajar” con ventanas de 1 y 2 millones de tokens, y mantuvo un 98 % en 6 y 12 millones de tokens.

En programación, Appen evaluó 1055 problemas de LiveCodeBench con cuatro respuestas por problema. El modelo subq-2m-preview-small alcanzó un 89,7 % en pass@4, una puntuación que lo coloca cerca de los modelos punteros en ese tipo de prueba.

También hay una cifra llamativa de velocidad. En la evaluación de Appen, la tecnología SSA completó una pasada de atención con un millón de tokens en 381 milisegundos, frente a 21,4 segundos para FlashAttention-2 en el mismo escenario. Aun así, conviene leerlo bien, porque una prueba de laboratorio no siempre equivale a un uso real diario.

La parte que exige cautela

Aquí viene el matiz importante. SubQ no está todavía disponible de forma amplia para que cualquiera pueda probarlo sin restricciones. La propia compañía habla de acceso temprano y de despliegue con socios seleccionados, así que todavía falta el examen más duro, el de miles de usuarios externos probándolo en tareas reales.

Además, Subquadratic reconoce que no entrenó el modelo desde cero. Partió de un modelo de pesos abiertos y sustituyó la atención densa por su sistema SSA. Esto no invalida el resultado, pero sí obliga a separar dos cosas, la mejora arquitectónica real y las capacidades que el modelo base ya tenía.

También hay un detalle técnico relevante. En su informe, la empresa explica que el mecanismo concreto con el que SSA cumple sus requisitos queda fuera del alcance del documento. Dicho de otra forma, hay datos prometedores, pero no toda la receta está sobre la mesa.

Menos energía no siempre significa menos CO2

Si las cifras se confirman, el impacto ambiental podría ser importante. Menos computación por tarea suele significar menos electricidad necesaria para hacer lo mismo. Y en IA, donde millones de consultas se repiten cada día, una mejora de eficiencia puede notarse mucho.

Pero no hay que venderlo como una solución mágica al CO2. Si la IA se abarata mucho, también puede usarse mucho más. Ese efecto rebote ya lo conocen bien los expertos en energía, cuando algo cuesta menos, se consume más. Y ahí es donde la tecnología se cruza con las políticas públicas, las renovables y la planificación de redes.

La AIE lo resume con una idea sencilla. La IA puede ayudar a optimizar sistemas energéticos, redes y procesos industriales, pero no elimina por sí sola la necesidad de decisiones climáticas serias. Es una herramienta, no una excusa para consumir sin límite.

Qué mirar ahora

Lo importante en los próximos meses será comprobar si SubQ mantiene esos resultados fuera de las pruebas controladas. Harán falta evaluaciones abiertas, comparaciones reproducibles y datos claros sobre coste, energía real consumida y rendimiento en empresas.

También habrá que ver de dónde sale la electricidad que alimenta estos avances. Una IA más eficiente ayuda, pero si los centros de datos crecen conectados a gas o a redes saturadas, el balance ambiental puede perder brillo muy rápido. Y eso se nota.

En cualquier caso, SubQ apunta a una dirección interesante. No se trata solo de hacer modelos más grandes, sino de hacerlos menos derrochadores. 

El informe técnico de SubQ 1.1 Small ha sido publicado por Subquadratic.


Adrian Villellas

Adrián Villellas es ingeniero informático y emprendedor en marketing digital y ad tech. Ha liderado proyectos de analítica, publicidad sostenible y nuevas soluciones de audiencia. Colabora además en iniciativas científicas ligadas a la astronomía y la observación espacial. Publica en medios de ciencia, tecnología y medioambiente, donde acerca temas complejos y avances innovadores a un público amplio.

Deja un comentario