{ text: "Los números de directivos y socios financieros están guardados de antemano. Se devuelve la llamada a esos números, nunca al que acaba de llamar.", level: 1 }, { text: "Todo pago por encima de un umbral escrito requiere dos validaciones independientes en dos canales.", level: 1 }, { text: "Se acuerda fuera de línea una pregunta de verificación entre las personas que autorizan pagos.", level: 1 }, { text: "El procedimiento prohíbe expresamente hacer excepciones por razones de urgencia o confidencialidad.", level: 2 }, { text: "Se realiza un ejercicio de simulación al menos una vez al año, incluido el directivo.", level: 3 }, ]} />

Organización y equipo

El fraude del CEO en la era de la clonación de voz

El fraude en transferencias ya no necesita imitar un correo electrónico. Imita su voz, y pronto su cara en videollamada. Por qué la detección es un callejón sin salida, y qué procedimiento detiene realmente un pago.

Publicado el 11 de junio de 2026 6 min de lectura Critical

Última revisión: 11 de junio de 2026

Una transferencia fraudulenta rara vez comienza con una intrusión. Comienza con una llamada que todos encuentran normal.

El fraude del CEO no es nada nuevo. Un falso directivo, una transferencia urgente, un contable que actúa antes de pensar: los estafadores llevan años explotando este esquema. Lo que ha cambiado es que ya no necesitan imitar una firma o un estilo de correo electrónico. Imitan la voz. Y en una videollamada, la cara.

La mayoría de las empresas responden pidiendo a sus equipos que escuchen con más atención. Esa es la respuesta equivocada, y es costosa.

Lo que cuentan los casos conocidos

Primer caso documentado, 2019. El director de una filial británica recibe una llamada de su jefe, el CEO de la empresa matriz alemana. La voz es la correcta: el acento, el ritmo, hasta la cadencia de un alemán que habla inglés. Le piden que transfiera 220.000 euros a un proveedor húngaro, rápido. Cumple. La voz era sintética, entrenada con grabaciones públicas del directivo. El dinero pasó por Hungría, luego México, y nunca volvió. El detalle que importa: la víctima reconoció la voz. No fue engañada por un clon aproximado. Escuchó a su jefe.

2024, Hong Kong. Un empleado de la ingeniería Arup recibe un correo electrónico que le intriga: una transacción confidencial, firmada por el director financiero. Intuye la trampa, buen instinto. Para tranquilizarlo, le invitan a una videoconferencia. El director financiero está en pantalla, rodeado de colegas que reconoce. Todos son falsos. Deepfakes fabricados a partir de imágenes públicas. La videollamada barrió en pocos minutos la desconfianza que había despertado el correo. Quince transferencias después, la empresa había perdido 25 millones de dólares. El fraude solo se descubrió al cotejar con la sede.

Julio 2024. Un ejecutivo de Ferrari recibe mensajes, luego una llamada del CEO Benedetto Vigna. La voz se sostiene, el acento sureño está ahí, el tono es apremiante, el asunto confidencial. El ejecutivo duda y hace una pregunta sencilla: el título del libro que Vigna le había recomendado. Silencio al teléfono. El estafador cuelga. Ninguna herramienta detectó nada. Una pregunta que solo el verdadero Vigna podía responder fue suficiente.

Por qué la detección no le salvará

La tentación es tratar la voz sintética como se trató el spam: detectar señales débiles, desplegar herramientas que analicen el grano del audio, formar a los equipos para descubrir el artefacto. Esta respuesta tranquiliza porque se parece a algo conocido. No funciona.

Los clones ya son demasiado buenos para el oído. El directivo de 2019 escuchó el acento y la melodía de su jefe, y transfirió de todos modos. Una herramienta de detección envejece al revés: cada avance de los generadores la hace un poco más ciega, y esos avances superan sus ciclos de adquisición de software. Estaría corriendo una carrera perdida de antemano.

Peor aún, entrenar a las personas para “reconocer un deepfake” produce el efecto contrario al buscado. Crea empleados falsamente seguros de sí mismos, convencidos de que sabrían detectar lo falso. Son los más fáciles de engañar.

Lo que realmente detiene un pago

La defensa no se juega en la percepción. Se juega en el procedimiento, y casi no cuesta nada.

Una orden de pago nunca se valida en función del canal por el que llega. Alguien llama, escribe, deja un mensaje de voz: la solicitud se devuelve la llamada a un número ya conocido, del directorio interno, nunca al número que acaba de contactarle ni al proporcionado en el mensaje. Si la persona no está disponible en su número habitual, la solicitud espera.

Por encima de un umbral, una transferencia requiere dos validaciones independientes, de dos personas, por dos canales. Esta regla no tolera ninguna excepción, menos aún la urgencia, menos aún la confidencialidad.

La urgencia y el secreto no son circunstancias. Son las dos herramientas del estafador.

Shield — shield.travel

Necesita que actúe rápido y solo. Un procedimiento que desaparece en cuanto alguien dice “es urgente y queda entre nosotros” no es un procedimiento, es una cortesía.

Añada una pregunta de verificación acordada de antemano, fuera de línea, entre las personas que autorizan pagos. No una contraseña guardada en un archivo. Una pregunta cuya respuesta no existe en ningún lugar. Eso fue lo que salvó a Ferrari.

Si usted dirige

Usted es la materia prima. Sus conferencias, sus podcasts, sus presentaciones de resultados, sus vídeos en LinkedIn: horas de audio limpio para entrenar un clon de su voz. No puede ni debe dejar de ser visible. Ese no es el problema a resolver.

El problema es que en muchas empresas “venía del jefe” todavía basta para liberar un pago. Mientras eso sea cierto, su exposición pública es una vulnerabilidad directa. La única decisión que importa, y es el único que puede imponerla a las finanzas, es hacer que su voz sea insuficiente. Que nadie autorice nada únicamente porque sonaba como usted. El día que su voz ya no valga como firma, puede hablar en público tanto como quiera.

Angle de lecture

Particulier RSSI / DSI CEO

El mismo mecanismo le apunta en su vida privada: una llamada de “su banco”, o de un familiar en apuros cuya voz fue clonada a partir de una historia publicada en línea. La defensa es idéntica. Cuelga y llama de vuelta al número oficial, el del dorso de la tarjeta, el que ya tiene en el teléfono. Acuerde en familia una palabra que nadie más conozca, para pedirla en caso de duda. También puede reportar intentos al INCIBE (incibe.es) o llamar al 017.

Su función no es comprar un detector de deepfakes. Es redactar el procedimiento de pago, fijar el umbral de doble validación y entrenar a los equipos de finanzas no para reconocer una voz, sino para aplicar la devolución de llamada en canal conocido sin dudarlo, incluido cuando el propio director general está impaciente al teléfono. Póngalo a prueba con una simulación. Verá rápidamente quién cede bajo presión.

Su voz ya circula, en claro, por todas partes. Protegerla es una causa perdida. Hágala inútil como medio de autorización: ningún pago solo por su palabra, sea cual sea el canal, sea cual sea la urgencia. Es una regla que debe exigir, y a la que se somete el primero.

Qué implementar

N1 Los números de directivos y socios financieros están guardados de antemano. Se devuelve la llamada a esos números, nunca al que acaba de llamar.
N1 Todo pago por encima de un umbral escrito requiere dos validaciones independientes en dos canales.
N1 Se acuerda fuera de línea una pregunta de verificación entre las personas que autorizan pagos.
N2 El procedimiento prohíbe expresamente hacer excepciones por razones de urgencia o confidencialidad.
N3 Se realiza un ejercicio de simulación al menos una vez al año, incluido el directivo.