Las implicaciones económicas de que los LLMs se están volviendo mejores

Paul Kedrosky en un post de blog analizando la realidad económica de los LLMs usando una analogía de los promedios de bateo:

En 1941, Ted Williams bateó .406. Ningún jugador de béisbol profesional en las Grandes Ligas ha bateado .400 desde entonces. Durante décadas, se hipotetizó que esta desaparición tenía algo que ver con... algo, tal vez el pitcheo moderno, los juegos nocturnos o los viajes. Algo estaba haciendo que los buenos jugadores fueran peores de alguna manera.

El biólogo evolutivo y escritor Stephen Jay Gould pensó que todo el mundo entendía la historia al revés. En su libro Full House, argumentó que los bateadores de .400 no desaparecieron porque los bateadores empeoraron. Desaparecieron porque todos los jugadores mejoraron. A medida que el juego mejoró, la varianza de los jugadores se colapsó. El promedio de bateo medio se mantuvo alrededor de .260, pero la desviación estándar casi se redujo a la mitad. En una distribución más ajustada, un bateador de .400 se vuelve casi imposible. La brecha entre el promedio y la élite se había cerrado.

Lo mismo está sucediendo con los modelos de lenguaje grandes y, una vez más, la gente lo está malinterpretando.

Paul desarrolla la analogía muy bien, y vale la pena leerlo completo. Pero el punchline es:

Las implicaciones económicas son claras. Cuando la varianza es amplia, ser el modelo de frontera significaba algo. Podías, después de todo, ser casi un 50% mejor que el modelo promedio. Y podías, en teoría, ponerle un precio acorde. La distancia entre la frontera y lo "suficientemente bueno" era lo suficientemente amplia como para parecer un foso temprano.

Ahora, sin embargo, la brecha desde la frontera del modelo hasta el percentil 90 es menor al 6%. La brecha entre el modelo #1 y el #2 es prácticamente cero. La prima que el mejor modelo solía exigir se está colapsando con la disminución de la varianza.

Así es como se ven los mercados de materias primas (commodities) en maduración. El bateador de .400 ha desaparecido, no porque el juego haya empeorado, sino porque los rendimientos convergieron. La varianza que impulsó a valores atípicos como Ted Williams fue impulsada por la adolescencia del béisbol.

Del mismo modo, los modelos de lenguaje grandes probablemente seguirán mejorando. Pero cada vez importará menos, dada la disminución de la varianza, por lo que el precio se convertirá en el principal diferenciador, no las diferencias menores entre modelos. Esto tendrá enormes implicaciones, desde el ascenso continuo e inexorable de China en la IA, como ya estamos viendo con la enorme ventaja de precios de DeepSeek, hasta la presión resultante sobre los márgenes de las empresas de frontera y las implicaciones para el desempeño post-IPO de dichas empresas.

El modelo de negocio actual de la IA está roto:

Primero, las empresas sí están adoptando la tecnología. Pero todavía estamos en el punto de la línea del tiempo en que tecnología y proveedor son términos intercambiables en la misma conversación. Si quieres verlo en la línea de tiempo, estamos todavía en el momento en el que “smartphone” era el término que usábamos para referirnos a la categoría de dispositivos que podían hacer más que llamadas: iPhone, BlackBerry, cualquier Android y cualquier cosa que haya estado intentando hacer Microsoft en su momento. Hoy en día, es claro que hay dos opciones en el mercado: iPhone y Samsung. La cosa es que ya nadie se refiere a estas cosas como “smartphones”. Son teléfonos. Aunque hagan mucho más que llamadas. Y creo que lo mismo va a pasar con los modelos. Hoy hablamos de Codex vs Claude Code. En 5 años o menos eso no va a importar, si no es que ya no importa.

El performance del modelo importa, sí, pero no tanto como qué tan fácil es usarlo:

Aunque Gemini sea un mejor modelo, si es más fácil usar Claude Code en la terminal, la banda va a usar Claude Code en la terminal.*

Aunque Gemini sea un mejor modelo, si Xcode 26 trae por default ChatGPT, la banda va a usar ChatGPT.

Aunque Gemini sea un mejor modelo, OpenAI tiene una aplicación nativa que se integra súper bien con otras apps y hace el manejo de workflows mucho más sencillo.

El rendimiento del modelo solo le importa a las personas que tienen un interés a nivel de ingeniería. El resto de las personas, el 98 % de los usuarios de estas herramientas, solo quieren algo que funcione y están dispuestos a usar algo que sea suficientemente bueno, no importa que no esté en el bleeding edge.

Una parte esencial de qué tan fácil es usar un modelo es el precio. Claude Code está creando el Instagram del software:

Claude Code y Codex y todas estas herramientas le están permitiendo a personas “normales” saltarse los protocolos de la industria y conectar directamente con su nicho de audiencia. Para las personas que piensan en producto, antes solamente podían desarrollar sus habilidades si lograban entrar a trabajar a alguna empresa que les diera la oportunidad. Hoy esa barrera es virtualmente inexistente. Una cuenta de Claude Code les abre oportunidades que hace 5 años eran impensables.

Igual que con los influencers y medios, en software se van a empezar a abrir nichos que les van a permitir a “creadores” conectar directamente con personas que tienen su mismo problema y están dispuestos a pagar por un programa que se los resuelva. Ya no va a ser necesario que alguien con sentido de producto tenga que trabajar con Google, Meta o Amazon para impactar a usuarios; una cuenta de Claude Code será suficiente para muchos.

Y sí, a lo mejor estos nuevos creadores no van a tener las mismas garantías o estatus que trabajar con las grandes empresas te da. Pero para muchos va a ser suficiente para vivir de lo que les gusta hacer.

Podemos debatir (y se ha debatido) muchísimo sobre si los influencers son actores o si están demeritando el arte. En la industria del software ya están sonando ecos de los mismos gritos de la disrupción. Independientemente de las habilidades histriónicas de alguien que se hizo famoso en Instagram, la realidad es que la gente va a ir a ver la película porque sale en ella; y alguien que tiene un problema va a pagar por la aplicación que le resuelva el problema independientemente de si la hicieron con Claude Code o no.

Si no quieres pagar por leer el artículo de Paul, puedes escuchar la discusión en el último episodio de su podcast.

Sigue leyendo

Comentarios