CASO DE ESTUDIO

Vidiv

De experimento técnico a plataforma escalable en un año

Vidiv no acababa de arrancar: de su producto original, una plataforma de eventos masivos online, pivotó a una plataforma enfocada a la enseñanza online que tampoco acaba de encontrar product-market-fit. Sin embargo, aprovechando el conocimiento acumulado sobre WebRTC aplicado a videollamadas, el equipo técnico decidió construir una prueba técnica consistente en un agente conversacional de voz basado en inteligencia artificial. Funcionaba, algunos clientes mostraban interés, pero era claramente un experimento técnico sin futuro comercial claro. Los primeros 6 meses ayudé a darle forma desde mi puesto de diseñador en Visual MS y, a mediados de 2025, se me encargó hacerme responsable del producto y las operaciones.

Resumen

Contexto: Startup que pivota a agentes conversacionales de voz basados en inteligencia artificial
Mi rol: responsable de producto y operaciones
Equipo de producto: Miguel (full-stack developer), Iria (diseño)
Resultado: De experimento inestable a ganadora INNDAT 2025 con ~20 clientes (Moeve, Lexidy, Transpaís)

El problema real

Estado en junio 2025:

El agente de voz funcionaba pero todo comenzó con una interfaz muy básica y cada implementación requería intervención manual. Para aliviar presión en el equipo se llevó a cabo una estrategia que consistía en derivar el prompting de los agentes y las integraciones a partners pero no había procesos claros en ese sentido. Tampoco había control sobre facturación ni beneficios de los servicios ofrecidos por ellos. Los clientes tenían interés pero hacía falta ampliar funcionalidades y automatizar varios procesos.

La pregunta: ¿Esto puede ser un negocio o es solo un experimento técnico?

La solución

Transformar el experimento en plataforma donde partners pudieran crear y gestionar agentes de voz con integraciones robustas de forma autónoma.

Diferencial estratégico: «No hacemos chatbots. Creamos agentes que aportan valor mediante integraciones con sistemas reales, comprometidos con un uso seguro, ético y responsable de la inteligencia artificial.»

Mi rol

Responsable de producto y operaciones
Roadmap y priorización | Coordinación equipo técnico | Reestructuración operativa de partners | Control facturación y beneficios derivados de servicios

Lo que construimos

Consolidación: convertirlo en un producto

Lo primero fue consolidar lo que teníamos. El experimento técnico funcionaba — el equipo ya tenía experiencia sólida en WebRTC de la época de eventos online — pero todo era manual y fragmentado.

Consolidamos la base de datos para automatizar procesos que hasta ese momento requerían intervención manual. Pero el trabajo más importante fue redefinir la interfaz. Los técnicos la habían construido funcional pero requería muchos ajustes de diseño: la experiencia visual era pobre y la usabilidad dejaba mucho que desear.

El cambio más significativo fue transformarla de solo audio a una experiencia multimodal donde podías cambiar de voz a texto sin fricción. Esto requirió repensar completamente la interfaz.

Además, teníamos un problema de duplicación: existían dos interfaces separadas — un iframe para integrar en webs y una versión fullscreen. Cada cambio requería rediseñar e implementar en ambas. Las convertimos en un componente único y reutilizable, reduciendo el trabajo de diseño y frontend a la mitad.

Añadimos monitorización real del flujo de conversaciones para entender qué pasaba en producción.

En paralelo, reestructuramos cómo operaban los partners: definimos procesos claros de facturación, establecimos control sobre beneficios y creamos espacios que nos permitían tener control sobre las integraciones que realizaban.

Autonomía: eliminar el cuello de botella

Construimos una zona privada completa donde partners y clientes pudieran gestionar agentes sin depender de nosotros para cada pequeño cambio. Esto incluía creación y configuración autónoma de agentes, personalización total del widget, editor de prompts con controles avanzados (Temperatura, Top P), y gestión de voces y modelos de IA.

Para los clientes desarrollamos un panel de analítica: dashboard con consumo en tiempo real, análisis por agente individual, detección automática de temas recurrentes y preguntas frecuentes, transcripciones de las conversaciones, identificación de oportunidades de mejora, alertas al 80% de consumo y exportación de datos.

Diferenciación: integraciones como ventaja competitiva

Apostamos por conectar con sistemas reales. Implementamos webhooks (pre y post conversación), integración MCP (Model Context Protocol), pre-carga de datos de usuario antes de iniciar conversación, identificación de URL de origen del contacto, y redirección inteligente de llamadas según condiciones configurables.

Esto permitió casos de uso diferenciados: agentes que acceden al CRM y conocen el historial del cliente antes de saludar, usuarios ya logueados cuyo agente tiene sus datos automáticamente, catálogos personalizados según perfil, derivación a humano solo cuando cumple condiciones específicas.

Integramos 10+ modelos de IA (GPT-4o, GPT-5, GPT-5.1, GPT-5-nano, Claude 3.7/4/4.5, Gemini, Amazon Bedrock, Deepseek R1, Llama 3) para dar flexibilidad de optimización coste/calidad. Añadimos soporte para 50+ idiomas incluyendo lenguas cooficiales españolas, voces expresivas, clonado de voces y control de verbosidad.

En UX: interfaz unificada de chat + voz, transcripción en tiempo real, llamadas salientes automatizadas, enlaces con vista previa, widget que se adapta al idioma del navegador, preguntas sugeridas para iniciar conversación, y finalización automática de llamadas.

Anticipamos el AI Act europeo implementando etiquetado «Agente de IA por Vidiv» además de gestión de consentimientos RGPD.

Go-to-market: cerrar el ciclo de venta

Finalmente, necesitábamos que prospectos pudieran ver el producto funcionando rápidamente. Construimos un generador de prompts para hacer demos personalizadas, implementamos números telefónicos nacionales españoles…

Pasamos de «algunos clientes interesados» a un proceso de venta replicable a nivel internacional.

Resultados

98 releases en 6 meses
~20 clientes (Moeve, Transpaís, Lexidy, entre otros)
Ganadora INNDAT 2025 (categoría startup)
3 Partners gestionando ~20 clientes

Transformación

La transformación fue completa. Pasamos de un experimento técnico sin futuro comercial claro a un producto viable con estrategia definida. De requerir intervención manual para cada cliente a una plataforma self-service donde partners operaban autónomamente. De una arquitectura que dependía de procesos manuales a un sistema automático. De partners operando sin control a procesos claros de facturación y beneficios. Y de un posicionamiento difuso a un mensaje claro: «agentes que aportan valor mediante integraciones robustas».

Decisiones críticas

1. Consolidar antes que brillar
Los primeros 2 meses estuvieron centrados en pulir la prueba técnica para convertirla en algo funcional a nivel técnico y de experiencia de usuario.

2. Autonomía como prioridad
La zona privada para que los partners crearan los agentes no era el feature más vistoso, pero nos permitió escalar. Cuantas más posibilidades dábamos a los partners mejores eran los agentes.

3. Integraciones para aportar valor
Siempre consideramos que las integraciones eran el punto crítico para ofrecer valor a los clientes. Un agente conversacional de voz, por muy bien que funcione, debe ofrecer algo más que la capacidad de sorprender. Si no puede integrarse con otros sistemas se convierte en un juguete.

4. Multi-modelo
10+ modelos añadió complejidad, pero dio flexibilidad y redujo dependencia de proveedor único. Algo importante en el que los LLMs sacan nuevas versiones constantemente, afectando al comportamiento de los agentes.

5. Compliance anticipado
Implementamos etiquetas para ser transparentes y así cumplir con el AI Act. Se convirtió en argumento de venta con corporaciones.

6. Operaciones de partners primero
El control de facturación antes de escalar era fundamental, sin él no obteníamos beneficios.

Aprendizajes clave

Transformar experimentos en productos

Demo ≠ producción. La diferencia: procesos, monitorización, arquitectura aburrida
Operativa es producto. Sin control de facturación de partners, no hay negocio escalable

Voice

Latencia = UX. 500ms se sienten eternos en conversación de voz
Multimodal > solo voz. Usuarios quieren elegir canal según contexto

Plataformas

Partners necesitan éxito rápido. Primer cliente que falla = abandono
Analytics > features vistosas. Adherencia vino de datos accionables

Diferenciación

«Otro agente de voz» no es posicionamiento
Integraciones (webhooks, MCP) fueron el diferencial real
Clientes querían «agente que accede a mi CRM», no «agente que habla bonito»

Modelos de IA

Selección de modelo = decisión de producto (impacta UX, costes, diferenciación)

Reflexión

De experimento técnico sin futuro claro a plataforma ganadora INNDAT 2025 con ~20 clientes y red de partners autónomos en 6 meses.

El éxito no vino de la tecnología de voz (ya existía). Vino de convertir prototipo frágil en producto con procesos sólidos, herramientas de autonomía, e integraciones que aportaban valor real.

El mayor aprendizaje: Los experimentos técnicos son entretenidos, pero no son negocios. Convertir uno en el otro requiere meses de trabajo poco glamuroso: arquitectura, procesos, operaciones. Ese trabajo aburrido es lo que separa un demo de un producto.

Estado: Ganadora INNDAT 2025 | ~20 clientes | Red partners autónomos

–

Escríbeme si quieres charlar sobre este caso.

Otros casos de estudio

Tecnoszubia

De crisis de cliente a feature diferenciadora en una semana

Leer

Mapia

De experimento técnico a plataforma escalable en un año.

Leer

Contacto

✉️ Correo electrónico

☎️ +34 637 81 06 58

linkedin.com/in/azur-gonzalez