Event-driven real-time sync.

Cuando algo cambia en un sistema, los demás se enteran al instante.

Las arquitecturas request-response son perfectas para muchos casos, pero no para escenarios donde varios sistemas tienen que reaccionar a un mismo evento. Con un event mesh basado en MuleSoft, Anypoint MQ y Kafka, un cambio en un sistema dispara reacciones desacopladas en los demás: data warehouse, motor de marketing, servicios de notificación, partners. Cada consumer reacciona a su tiempo, sin que el productor sepa quién lo escucha.

Volver a MuleSoft

Arquitectura event-driven

¿Qué resuelve un event mesh con MuleSoft?

Cuando el cambio de un dato relevante tiene que llegar al data warehouse, al motor de marketing, al CRM, a la app y a un partner externo, encadenar llamadas síncronas se vuelve frágil y lento. Con un event mesh, el productor publica una sola vez y cada consumer reacciona a su tiempo, con su propia política de reintentos, sin tirar abajo al resto cuando uno falla.

Eventos versionados con schema registry (Avro o JSON Schema).
Consumers idempotentes con deduplicación por event ID.
Dead letter queue para mensajes que fallan tras N reintentos.
Tracing distribuido (OpenTelemetry) para seguir un evento desde producer hasta consumers.

Sistemas típicos involucrados

Las familias de sistemas que conviven en un event mesh enterprise.

Bus de mensajería

Anypoint MQ, Apache Kafka, AWS SQS/SNS, Azure Service Bus, Google Pub/Sub, RabbitMQ, IBM MQ como backbone del event mesh.

Salesforce eventing

Platform Events, Change Data Capture y Pub/Sub API basada en gRPC para eventos nativos del CRM.

Fuentes legacy

Cores y ERPs que no publican eventos nativamente, integrados con outbox pattern y poller de cambios.

Consumers

Data warehouse, CRM, ERP, motores de marketing, sistemas de notificación y partners externos vía webhooks.

Arquitectura objetivo

Event mesh con productores, broker y consumers desacoplados, orquestado con MuleSoft.

+--------------------+           +--------------------+
|  Producer system A |           |  Producer system B |
+----------+---------+           +----------+---------+
           |                                |
           | publishes event                | publishes event
           v                                v
+----------------------------------------------------+
|   Event Mesh / Backbone                            |
|   (Anypoint MQ + Kafka + bridges)                  |
|   - Topics: customer.* / order.* / inventory.*     |
|   - Schema registry (Avro / JSON Schema)           |
+--------------------+-------------------------------+
                     |
        +------------+-----------+----------+
        |                        |          |
        v                        v          v
+--------------+      +--------------+   +-----------+
|  Consumer 1  |      |  Consumer 2  |   |Consumer N |
|  (data WH)   |      | (Salesforce) |   | (emails)  |
+--------------+      +--------------+   +-----------+
        |
   Cada consumer: idempotente, con DLQ y tracing OTel

System APIs

En event-driven los sistemas fuente publican eventos. salesforce-events-sapi suscribe a Platform Events y CDC; erp-events-sapi lee outbox table del ERP. Cada uno transforma y publica al bus con un contrato canónico.

Process APIs

event-router-pa rutea eventos entre topics según reglas de negocio. event-enrichment-pa agrega contexto (info de producto, segmento del cliente) antes de re-publicar. Ambas son consumers y producers a la vez.

Experience APIs

Cuando hay clientes externos suscribiéndose a eventos, webhook-eapi entrega eventos a TPPs vía HTTP webhooks con firma, retries y dashboard de salud por suscriptor.

Flujo paso a paso

Cómo se propaga un cambio de precio a cinco canales en tiempo real.

1 El pricing engine actualiza el precio del SKU en el sistema fuente. La transacción local incluye un insert al outbox table del cambio.
2 Un poller publica el evento pricing.updated.v1 al topic correspondiente con payload {sku, oldPrice, newPrice, effectiveDate, reason}.
3 MuleSoft pricing-events-sapi consume el mensaje del topic con acknowledgement manual.
4 event-enrichment-pa enriquece el evento con info del producto (categoría, marca), promo aplicable y reglas de negocio relevantes.
5 La Process API publica el evento enriquecido pricing.changed.enriched.v1 al bus para los consumers descendentes.
6 Cada consumer reacciona en paralelo: e-commerce actualiza Vtex o Magento, marketplace propaga a Mercado Libre y Amazon, POS empuja a tiendas, app móvil invalida cache CDN, motor de email evalúa wishlist.
7 Cada consumer es idempotente: deduplica por event ID guardado en Redis con TTL antes de procesar.
8 Cada consumer publica un evento de status pricing.applied.ok.{channel} o pricing.applied.error.{channel} al bus.
9 pricing-monitor-pa consume los eventos de status. Si tras N segundos no recibió OK de algún canal, dispara alerta operativa.
10 Tracing distribuido (OpenTelemetry) une producer, broker y consumers con un único correlationId visible en Anypoint Monitoring.
11 Mensajes que fallan tras N reintentos con backoff exponencial pasan a la dead letter queue para investigación manual.

Patterns aplicados

Los patrones de integración que sostienen el event mesh en producción.

Publish-Subscribe

El producer no conoce a sus consumers. Cada sistema publica al topic y los consumers se suscriben de forma independiente.

Outbox pattern

El cambio en el sistema fuente y el insert al outbox table viajan en la misma transacción. Un poller publica al bus después.

Idempotent consumers

Cada consumer guarda los IDs de eventos procesados y descarta duplicados. Asume entrega at-least-once como default.

Schema evolution

Eventos versionados con schema registry (Avro o JSON Schema). Consumers tolerantes a campos extra; nunca se remueven campos.

Dead letter queue

Eventos que fallan tras N retries van a una DLQ separada para diagnóstico, sin frenar al resto del flujo.

Ordering por aggregateId

Cuando el orden importa, la key del mensaje fuerza que todos los eventos del mismo aggregate vayan a la misma partición.

Cómo lo implementamos

Cinco fases del mapa de eventos al event mesh productivo en evolución continua.

Discover · 1-3 semanas

Mapa de eventos del negocio

Identificación de eventos relevantes (customer.*, order.*, inventory.*, pricing.*), productores, consumers actuales y deseados, requerimientos de orden y latencia. Entregables: assessment, catálogo de eventos, decisión Anypoint MQ vs Kafka.

Design · 2-4 semanas

Topología y contratos

Diseño del event mesh, topics, particiones, schema registry, política de versionado. Contratos para los primeros eventos, plan de gobernanza, observabilidad y DLQ.

Build · 6-10 semanas

Producers, consumers y enrichment

Implementación del primer event flow end-to-end. System APIs publishers, Process API de enrichment, consumers idempotentes con DLQ. Tests MUnit, CI/CD a sandbox.

Deploy · 2-4 semanas

Hardening y observabilidad

Tuning de tiers del bus, ajuste de particiones, tracing distribuido, alertas sobre consumer lag y DLQ. Go-live por dominio (pricing, inventory, customer). Hypercare con el equipo del cliente.

Evolve · continuo

Expansión del event mesh

Sumar nuevos productores y consumers, capacitación al equipo del cliente para evolucionar contratos sin romper consumers, integración con event mesh corporativo cuando aplica.

Requisitos del proyecto

Lo que tiene que estar disponible del lado del cliente para arrancar.

Datos mínimos

Mapa inicial de eventos relevantes del negocio, definición de aggregateId por dominio y disponibilidad de los sistemas fuente para emitir eventos o exponer outbox.

Licencias y capacidades

Anypoint Platform, Anypoint MQ y/o Kafka según sizing. Conectores Salesforce, SAP, Oracle, NetSuite y los sistemas core que aplique. Schema registry compatible.

Integraciones típicas

CRM, ERP, e-commerce, data warehouse, motor de marketing, partners externos. Tracing y observabilidad sobre Anypoint Monitoring + Datadog, Splunk o New Relic.

Pre-requisitos organizacionales

Sponsor de arquitectura empresarial, IT lead disponible, data owners por dominio comprometidos con la gobernanza de contratos de eventos y políticas de versionado.

KPIs operativos

Las métricas que típicamente mejoran tras la implementación. Sin números de mercado: cada cliente fija su baseline.

KPI	Qué mide	Por qué importa
Consumer lag	Mensajes pendientes de consumir por consumer y topic.	Indicador más temprano de que un consumer se está atrasando frente a la velocidad del producer.
Event processing time P95	Latencia desde que el evento se publica hasta que el consumer lo confirma.	Refleja la experiencia real percibida por los sistemas downstream.
DLQ count	Cantidad de mensajes que terminaron en la dead letter queue.	Cualquier crecimiento indica un consumer roto o un cambio de contrato no propagado.
Messages published vs consumed	Diferencia entre publicaciones y consumos por topic.	Detecta consumers caídos antes de que el negocio los reclame.
Schema validation failure rate	Mensajes rechazados por no cumplir el schema registrado.	Alerta de un producer que cambió contrato sin coordinar con consumers.
End-to-end trace coverage	Porcentaje de eventos con tracing completo desde producer hasta el último consumer.	Define cuán debuggable es el sistema cuando algo sale mal.

Time-to-value: primer dominio de eventos en producción tras 8 a 12 semanas desde el kickoff.

Cómo se mide: dashboard entregado por Solu sobre Anypoint Monitoring, complementado con Datadog, Splunk o New Relic cuando el cliente ya los usa.

Preguntas frecuentes

¿Cuándo conviene event-driven y cuándo request-response? −

Conviene event-driven cuando varios sistemas tienen que reaccionar al mismo cambio, cuando el productor no necesita la respuesta inmediata del consumer y cuando el throughput exige desacoplamiento. Request-response sigue siendo el camino correcto para consultas en vivo, validaciones síncronas y flujos transaccionales cortos. La mayoría de los stacks maduros combinan los dos modos.

¿Anypoint MQ o Kafka? +

Anypoint MQ encaja cuando el cliente ya está en el ecosistema MuleSoft, el throughput es moderado y se valoran simplicidad operativa y soporte unificado. Kafka entra cuando hay alto volumen sostenido, retención larga para reprocesamiento histórico, particionado fino o streams analytics. Muchos clientes operan ambos: Anypoint MQ para integraciones enterprise, Kafka para data streaming. MuleSoft puentea los dos sin fricción.

¿Cómo manejamos eventos fuera de orden? +

Asumimos at-least-once y consumers idempotentes como base. Cuando el orden importa (varios eventos del mismo cliente o cuenta), se usa una key estable como aggregateId para que todos los eventos del mismo agregado vayan a la misma partición y se procesen secuencialmente. Cuando ni eso alcanza, el consumer mantiene estado de versión y descarta eventos viejos.

¿Qué pasa cuando un consumer queda atrasado? +

El consumer lag es la métrica clave: alerta antes de que el negocio note el atraso. La estrategia depende del consumer: escalar consumers paralelos sobre más particiones, separar el procesamiento pesado a un flow asincrónico, descartar eventos viejos según política de retención, o combinar las tres. Lo importante es que el productor no se ve afectado en ningún caso.

¿Cómo se debugga un evento que se “perdió”? +

Con tracing distribuido (OpenTelemetry) cada evento lleva un correlationId que recorre producer, broker y consumers. Anypoint Monitoring expone la traza completa: dónde se publicó, cuándo se consumió, dónde falló, si pasó a DLQ. La DLQ guarda el payload y la causa de fallo para reprocesar manualmente cuando se resuelve la causa.

Cuando algo cambia, los demás se enteran al instante.

Hablemos del estado de tus sistemas y diseñamos juntos el roadmap del event mesh.

Ver los 17 casos de uso