Durante mucho tiempo, el modelo estándar para plataformas de WhatsApp fue cobrar por conversación. Y tiene lógica a primera vista: si hay una conversación, se cobra. Fácil de explicar, aparentemente simple de medir.
Pero cuando lo miras de cerca, ese modelo tiene un problema de fondo que afecta directamente cómo diseñas producto y cómo escala tu costo.
El problema con cobrar por conversación
Cobrar por conversación implica que un solo mensaje activa el costo completo. Un "hola" se convierte automáticamente en una conversación facturable, aunque no haya intención de compra, ni uso real del sistema, ni valor generado para nadie.
Piensa en todo lo que cae dentro de ese mismo costo fijo: saludos, aclaraciones, mensajes cortos, pruebas internas, iteraciones de producto. Un flujo de tres mensajes simples cuesta lo mismo que uno de cuarenta mensajes con lógica compleja, llamadas a herramientas y procesamiento de IA.
Eso no es un modelo de pricing que te incentive a compartir tu producto, ya que si 2.000 personas te escriben solo para saludar, ya gastaste $1.000 (a $0,50 la conversación). No hubo una venta, pero el costo ya está.
Para empresas que venden directamente por WhatsApp o que tienen presupuesto para absorber ese gasto, el modelo funciona. Pero para el resto (productos conversacionales que no monetizan cada interacción) es un costo que no tiene relación con el valor que generan.
Qué pasa cuando el costo no refleja el uso real
Cuando el precio no refleja lo que realmente está pasando, empiezas a diseñar producto condicionado por el pricing. Te preocupas por reducir conversaciones en vez de mejorar la experiencia o solo hacer productos que generen dinero, olvidando servicio al cliente, por ejemplo. Evitas flujos que podrían ser más útiles para el usuario porque sabes que cada interacción nueva es un costo fijo más.
El pricing deja de ser una consecuencia del valor que generas y se convierte en una restricción que limita lo que puedes construir.
La alternativa: cobrar por lo que tu sistema realmente hace
Un modelo basado en ejecuciones y tokens invierte esa lógica. En vez de cobrar porque alguien escribió, cobras por lo que tu sistema hizo.
Si tu flujo es simple y eficiente, el costo es bajo. Si es más complejo y utiliza más capacidad, el costo escala de manera proporcional. No hay sorpresas ni subsidios cruzados.
| Por conversación | Por ejecución y tokens | |
|---|---|---|
| Un "hola" sin respuesta útil | Costo completo de conversación | Costo mínimo (pocos tokens) |
| Prueba interna o mensaje de test | Costo completo de conversación | Costo mínimo |
| Flujo simple de 3 mensajes | Costo completo de conversación | Costo bajo, proporcional al uso |
| Flujo complejo con AI, APIs y lógica | Costo completo de conversación | Costo mayor, proporcional al procesamiento |
| 40 mensajes con herramientas y lógica | Costo completo de conversación | Costo que refleja el trabajo real |
La diferencia es clara: en un modelo por conversación, todo cuesta lo mismo sin importar el valor generado. En un modelo por ejecución, pagas por lo que usas.
Por qué esto importa para tu producto
Cuando el pricing está alineado con el uso real, puedes tomar decisiones de producto sin miedo. Puedes iterar más rápido, probar flujos nuevos y optimizar la experiencia del usuario sin que cada experimento se sienta como un riesgo financiero.
Un modelo basado en ejecuciones es más transparente, más predecible y más alineado con cómo funcionan los productos conversacionales en la práctica. No te penaliza por la actividad de tus usuarios. Te cobra por el valor que tu sistema procesa.
Y eso cambia completamente la forma en que construyes.