Por qué dejamos de cobrar por conversación

Por qué dejamos de cobrar por conversación

Durante mucho tiempo, el modelo estándar para plataformas de WhatsApp fue cobrar por conversación. Y tiene lógica a primera vista: si hay una conversación, se cobra. Fácil de explicar, aparentemente simple de medir.

Pero cuando lo miras de cerca, ese modelo tiene un problema de fondo que afecta directamente cómo diseñas producto y cómo escala tu costo.

El problema con cobrar por conversación

Cobrar por conversación implica que un solo mensaje activa el costo completo. Un "hola" se convierte automáticamente en una conversación facturable, aunque no haya intención de compra, ni uso real del sistema, ni valor generado para nadie.

Piensa en todo lo que cae dentro de ese mismo costo fijo: saludos, aclaraciones, mensajes cortos, pruebas internas, iteraciones de producto. Un flujo de tres mensajes simples cuesta lo mismo que uno de cuarenta mensajes con lógica compleja, llamadas a herramientas y procesamiento de IA.

Eso no es un modelo de pricing que te incentive a compartir tu producto, ya que si 2.000 personas te escriben solo para saludar, ya gastaste $1.000 (a $0,50 la conversación). No hubo una venta, pero el costo ya está.

Para empresas que venden directamente por WhatsApp o que tienen presupuesto para absorber ese gasto, el modelo funciona. Pero para el resto (productos conversacionales que no monetizan cada interacción) es un costo que no tiene relación con el valor que generan.

Qué pasa cuando el costo no refleja el uso real

Cuando el precio no refleja lo que realmente está pasando, empiezas a diseñar producto condicionado por el pricing. Te preocupas por reducir conversaciones en vez de mejorar la experiencia o solo hacer productos que generen dinero, olvidando servicio al cliente, por ejemplo. Evitas flujos que podrían ser más útiles para el usuario porque sabes que cada interacción nueva es un costo fijo más.

El pricing deja de ser una consecuencia del valor que generas y se convierte en una restricción que limita lo que puedes construir.

La alternativa: cobrar por lo que tu sistema realmente hace

Un modelo basado en ejecuciones y tokens invierte esa lógica. En vez de cobrar porque alguien escribió, cobras por lo que tu sistema hizo.

Si tu flujo es simple y eficiente, el costo es bajo. Si es más complejo y utiliza más capacidad, el costo escala de manera proporcional. No hay sorpresas ni subsidios cruzados.

 Por conversaciónPor ejecución y tokens
Un "hola" sin respuesta útilCosto completo de conversaciónCosto mínimo (pocos tokens)
Prueba interna o mensaje de testCosto completo de conversaciónCosto mínimo
Flujo simple de 3 mensajesCosto completo de conversaciónCosto bajo, proporcional al uso
Flujo complejo con AI, APIs y lógicaCosto completo de conversaciónCosto mayor, proporcional al procesamiento
40 mensajes con herramientas y lógicaCosto completo de conversaciónCosto que refleja el trabajo real

La diferencia es clara: en un modelo por conversación, todo cuesta lo mismo sin importar el valor generado. En un modelo por ejecución, pagas por lo que usas.

Por qué esto importa para tu producto

Cuando el pricing está alineado con el uso real, puedes tomar decisiones de producto sin miedo. Puedes iterar más rápido, probar flujos nuevos y optimizar la experiencia del usuario sin que cada experimento se sienta como un riesgo financiero.

Un modelo basado en ejecuciones es más transparente, más predecible y más alineado con cómo funcionan los productos conversacionales en la práctica. No te penaliza por la actividad de tus usuarios. Te cobra por el valor que tu sistema procesa.

Y eso cambia completamente la forma en que construyes.