Los gemelos digitales en el marketing y la investigación de mercados

Cómo los gemelos digitales de consumo están transformando el análisis de datos y por qué la validación de los biosensores es fundamental para su éxito

Los gemelos digitales de los consumidores, modelos virtuales que simulan el comportamiento, la atención y las emociones de los compradores, están transformando cada vez más la investigación de mercados. Este artículo analiza la metodología, el debate sobre la validez de los encuestados sintéticos y el papel de plataformas de biosensores como iMotions a la hora de basar los gemelos de los consumidores en respuestas humanas reales.

La idea del gemelo digital llegó al marketing por una vía diferente a la que siguió en ingeniería, donde el término está quizás más extendido. Los gemelos digitales industriales surgieron a partir de sensores instalados en activos físicos; los gemelos digitales de marketing surgieron al reconocer que los consumidores, al igual que las turbinas y las cadenas de suministro, podían modelarse como sistemas con entradas medibles y resultados predecibles.

En los últimos dos años, la convergencia entre los grandes modelos lingüísticos, las infraestructuras de datos de comportamiento y la neurociencia aplicada al consumidor ha impulsado esta idea, pasando de ser un concepto especulativo a una metodología operativa —con todas las dudas sobre su validez que conlleva una adopción tan rápida—.

Para los profesionales de la investigación de mercados, los expertos en análisis del consumidor y los investigadores académicos que estudian el comportamiento del consumidor, el gemelo digital del consumidor se ha convertido en una opción metodológica a tener muy en cuenta.

Este artículo analiza qué son realmente los «gemelos de consumidores», cuál es su lugar dentro del panorama general de los métodos de encuestados sintéticos, qué dicen los estudios actuales sobre su validez y por qué la validación basada en biosensores —del tipo que permiten plataformas como iMotions— se está convirtiendo en un factor fundamental para la credibilidad de los datos obtenidos a partir de los gemelos.

¿Qué es un gemelo digital de consumo?

La terminología en este ámbito aún no está clara, y es importante dejar las cosas claras antes de seguir adelante. El sector de la investigación de mercados está convergiendo en tres categorías de metodología sintética, definidas de forma más o menos imprecisa, que se distinguen principalmente por su grado de base en datos de personas reales.

Imagen conceptual del gemelo digital

Los encuestados sintéticos puros son perfiles generados por IA a partir de datos censales, modelos de comportamiento y priores de grandes modelos lingüísticos. No están vinculados a ninguna persona real concreta. Resultan útiles para simulaciones a nivel de población, la ampliación de encuestas y trabajos exploratorios en los que el objetivo es aproximarse a los patrones de respuesta agregados, más que predecir el comportamiento individual.

Los consumidores sintéticos son una variante de los encuestados sintéticos diseñada específicamente para aplicaciones de investigación de mercado. Están concebidos para imitar la forma en que piensan y actúan los compradores reales a la hora de evaluar conceptos de producto, precios y mensajes, y suelen utilizarse para realizar pruebas de conceptos, pruebas de mensajes y estudios exploratorios en fases iniciales.

Los gemelos digitales de consumidores se sitúan en el extremo más concreto del espectro. Un gemelo digital de consumidor es una representación virtual de una persona concreta o de un segmento de consumidores bien definido, creada a partir de datos reales a nivel individual procedentes de respuestas a encuestas, observaciones de comportamiento, historiales de transacciones, transcripciones de entrevistas o preferencias declaradas, y diseñada para evolucionar con el tiempo a medida que se acumulan nuevos datos. Mientras que un consumidor sintético es un perfil generalizado, un gemelo digital es un modelo dinámico y calibrado de un individuo conocido o de un microsegmento.

Esta distinción es importante porque las estrategias de validación, los casos de uso y los riesgos varían según estas categorías. Un encuestado sintético puro se valida, por lo general, comparándolo con estadísticas demográficas agregadas. Un «gemelo de consumidor» se valida comparándolo con las respuestas reales de la persona o el segmento al que representa, lo que le permite generar predicciones específicas para ese individuo o grupo.

Cómo se crean realmente los «gemelos de consumidores»

La mayoría de las implementaciones en producción de gemelos de consumo combinan tres capas de datos de entrada.

Los datos de comportamiento y transaccionales constituyen la base empírica. El historial de compras, las interacciones en la web y en las aplicaciones, los datos de los programas de fidelización, los patrones de consumo de medios y los registros de CRM describen lo que el consumidor ha hecho realmente. Estos datos tienen la ventaja de ser observados, en lugar de declarados por el propio usuario, y proporcionan los patrones temporales que hacen que un gemelo sea dinámico, en lugar de estático.

Los datos sobre preferencias declaradas y actitudes describen lo que el consumidor dice de sí mismo. Las respuestas a encuestas, las transcripciones de entrevistas, los resultados de los grupos focales y los datos de panel aportan información sobre las motivaciones y el razonamiento que los datos de comportamiento por sí solos no pueden captar. Las técnicas de generación aumentada por recuperación han hecho cada vez más viable basar los gemelos basados en modelos de lenguaje grande (LLM) en transcripciones de conversaciones reales con las personas representadas.

Los datos demográficos y contextuales sitúan al gemelo virtual en una población concreta: edad, ingresos, ubicación geográfica, composición del hogar y etapa de la vida. Las investigaciones han demostrado que los encuestados sintéticos basados en modelos de lenguaje grande (LLM) obtienen resultados considerablemente mejores cuando se les pide que tengan en cuenta los atributos demográficos de la persona a la que están representando, siendo la edad y el nivel de ingresos variables especialmente importantes para reproducir las distribuciones de respuestas del mundo real.

El «gemelo» se implementa normalmente como un modelo de lenguaje grande (LLM) con acceso estructurado a estos datos, complementado con la recuperación de transcripciones y registros de comportamiento del individuo, y condicionado mediante indicaciones o ajuste fino para que responda al estilo de la persona representada. Las implementaciones más sofisticadas incorporan modelos de comportamiento, modelos de intención de compra, modelos de atención y modelos de emociones sobre la base del LLM para generar predicciones específicas ante estímulos concretos.

Ámbitos de aplicación de los gemelos de consumo

Las aplicaciones de marketing de los gemelos digitales se agrupan en torno a cinco casos de uso que se solapan.

Pruebas de conceptos y productos. Se trata de la aplicación más habitual. Una marca evalúa un nuevo concepto de producto, el diseño del envase o la formulación sometiendo a un gemelo (o a un grupo de gemelos que se ajusten al público objetivo) al estímulo y recopilando las respuestas previstas en aspectos como el atractivo, la originalidad, la intención de compra y la adecuación a la categoría.

Una investigación reciente ha demostrado que los métodos de valoración de la similitud semántica aplicados a consumidores sintéticos basados en modelos de lenguaje grande (LLM) alcanzaron una fiabilidad del 90 % en las repeticiones de pruebas realizadas por personas, en 57 encuestas sobre productos de cuidado personal con 9 300 respuestas humanas, lo que constituye la evidencia más sólida publicada hasta la fecha de que los consumidores sintéticos pueden reproducir la evaluación conceptual humana agregada en condiciones metodológicas adecuadas.

Pruebas publicitarias y creativas. Los gemelos pueden predecir qué variantes publicitarias tienen más probabilidades de obtener mejores resultados en cuanto a interacción, recuerdo y persuasión antes de que la marca se comprometa a invertir en medios. Los datos económicos son convincentes: las pruebas previas tradicionales de un único anuncio de 30 segundos suelen requerir varios cientos de encuestados y semanas de trabajo de campo; las pruebas previas basadas en gemelos pueden analizar cientos de variantes en cuestión de horas.

Simulación del recorrido del cliente y optimización de la experiencia del cliente. Se pueden someter a «gemelos» de segmentos específicos de clientes a diferentes variantes del recorrido —distintos flujos de incorporación, intervenciones de fidelización, interacciones de servicio— para identificar qué itinerarios producen los mejores resultados. Esto hace que el diseño del recorrido pase de ser un mero análisis de atribución basado en datos históricos a una simulación orientada al futuro.

Investigación sobre precios y surtido. Los estudios de disposición a pagar de tipo conjunto han comenzado a dar paso a metodologías basadas en gemelos, en las que estos evalúan las relaciones entre las distintas combinaciones de precio, características y marca a una escala mucho mayor de lo que permiten los estudios tradicionales con personas.

Mejora de la personalización y la segmentación. A un nivel más analítico, los «gemelos» de clientes individuales (cuando los datos lo permiten) pueden utilizarse para probar recomendaciones personalizadas, variantes de contenido u ofertas, lo que ayuda al motor de personalización a aprender más rápido de lo que lo haría solo con pruebas A/B en tiempo real.

¿El problema de la validez?

El interés metodológico que suscitan los «gemelos de consumidores» va acompañado de una amplia bibliografía sobre su validez que, a finales de 2025 y principios de 2026, presenta resultados decididamente dispares.

Estos resultados alentadores son reales. Más allá del estudio sobre productos de cuidado personal mencionado anteriormente, investigaciones revisadas por pares y documentos de trabajo han demostrado que los encuestados sintéticos basados en modelos de lenguaje grande (LLM) pueden reproducir ciertos patrones agregados en la opinión política, las preferencias de los consumidores y las respuestas cualitativas.

Estudios realizados por la Harvard Business School, el MIT Sloan y varios departamentos universitarios de marketing han analizado estos métodos en profundidad. La revista *International Journal of Research in Marketing*, en colaboración con el Marketing Science Institute, ha convocado la presentación de artículos para un número especial dedicado específicamente a la IA generativa, los datos sintéticos y los encuestados sintéticos en la investigación de mercados, lo que indica que el ámbito académico considera que el tema merece un análisis riguroso.

Los resultados desalentadores son igualmente reales. Una evaluación exhaustiva de nueve modelos de lenguaje a gran escala (LLM) de código abierto y comerciales, realizada por Tjuatja y sus colegas, reveló que, en general, los modelos no logran reflejar un comportamiento similar al humano en lo que respecta a los sesgos de respuesta en formato de ítem que los seres humanos muestran de manera fiable. Bisbee y sus colegas, en la revista *Political Analysis*, documentaron lo que denominaron «los peligros de los modelos de lenguaje a gran escala» como encuestados sintéticos, incluyendo una sensibilidad considerable a la redacción de las preguntas y a las estrategias demográficas de formulación de las mismas. Yu y sus colegas, al comparar GPT-4 y Llama3 con las respuestas humanas en cuestionarios de empatía estandarizados, descubrieron que GPT-4 reproducía la estructura factorial esperada de los cuestionarios, pero no la magnitud de las puntuaciones humanas, mientras que Llama3 fallaba incluso en la estructura factorial.

En la bibliografía se repiten varios modos de fallo concretos:

  • Adulación y sesgo positivo. Los modelos de lenguaje grande (LLM) entrenados para ser serviciales y complacientes suelen generar comentarios excesivamente positivos o acríticos cuando se utilizan como encuestados sintéticos, sin llegar a poner de manifiesto las reacciones negativas ni los defectos del producto que los consumidores reales identificarían.
  • Varianza insuficiente en las respuestas. Los encuestados sintéticos suelen generar distribuciones de respuestas demasiado uniformes y centradas, lo que disimula los valores atípicos y los casos extremos que caracterizan el comportamiento de los consumidores en el mundo real.
  • Sesgo de deseabilidad social. Estudios recientes demuestran que los modelos de lenguaje grande (LLM) muestran sesgos de deseabilidad social similares a los de los seres humanos en las respuestas a las encuestas, lo cual puede parecer positivo hasta que uno se da cuenta de que este sesgo es precisamente lo que los estudios de mercado bien diseñados pretenden evitar.
  • Sensibilidad a la formulación de las preguntas. Las estimaciones obtenidas a partir de encuestados sintéticos son muy sensibles a la redacción de las preguntas, la descripción de los perfiles y el orden de las opciones, lo que dificulta la obtención de estimaciones fiables sin un control metodológico minucioso.
  • Validez a nivel poblacional, pero no a nivel individual. Varios estudios han señalado que los métodos sintéticos pueden reproducir con bastante precisión los patrones de respuesta agregados, pero no logran predecir las respuestas de individuos concretos, una distinción que reviste gran importancia para las aplicaciones de personalización.
  • Alucinación. Los modelos generativos a veces inventan información que parece verosímil, pero que en realidad es errónea, lo que puede dar lugar a conclusiones engañosas si no se detecta mediante la validación.

En resumen, los gemelos digitales orientados al consumidor son útiles, pero aún no son fiables por sí solos. Generan hipótesis de forma adecuada, reproducen ciertos patrones agregados de manera fiable y producen resultados cualitativos que son realmente informativos; sin embargo, sus resultados deben calibrarse en función de la respuesta humana real antes de utilizarlos para tomar decisiones comerciales de gran trascendencia.

Por qué es importante la validación de los biosensores

Es aquí donde la historia metodológica da su giro más interesante para los investigadores de marketing. La validación tradicional de los encuestados sintéticos ha utilizado los datos de encuestas a personas reales como referencia, comparando la respuesta de Likert prevista del gemelo con lo que personas reales indicaron en los mismos ítems. Esto es necesario, pero insuficiente, por una razón que los profesionales del marketing conocen desde hace décadas: lo que los consumidores dicen sobre un estímulo y cómo responden realmente a él son cosas diferentes.

La neurociencia del consumo ha documentado ampliamente esta brecha. El mero hecho de reflexionar sobre una respuesta puede alterarla, y las medidas basadas en la autoevaluación están sujetas a la deseabilidad social, al sesgo de recuerdo y a la posracionalización. Un «gemelo del consumidor» entrenado para predecir lo que dice la gente, en el mejor de los casos, predecirá con precisión lo que dice la gente.

No predice necesariamente la atención preconsciente, la valencia emocional, el esfuerzo cognitivo u otras dimensiones de la respuesta que determinan el comportamiento de compra real —dimensiones que, según estima la bibliografía general sobre neurociencia del consumidor, representan la gran mayoría de la toma de decisiones—.

La validación basada en biosensores ofrece una forma de salvar esta brecha. La metodología es sencilla en principio: aplicar el mismo estímulo que evaluó el gemelo a una muestra pequeña pero representativa de participantes reales equipados con dispositivos de seguimiento ocular, análisis de expresiones faciales, electrodermografía (ED) y, cuando proceda, electroencefalografía (EEG).

Compara las predicciones del gemelo sobre los parámetros que pueden medir los biosensores —patrones de atención visual, respuesta emocional, nivel de excitación, carga cognitiva— con las respuestas fisiológicas reales registradas. Utiliza las discrepancias para calibrar el gemelo e identificar en qué casos sus predicciones son fiables y en cuáles fallan.

Este ciclo de calibración y validación presenta varias características interesantes. Las mediciones de los biosensores están menos sujetas a los sesgos de respuesta que afectan tanto a las encuestas a personas como a los encuestados sintéticos, lo que proporciona una referencia independiente. Generan datos continuos y resueltos en el tiempo, en lugar de puntuaciones resumidas únicas, lo que significa que un solo estudio con biosensores puede validar predicciones gemelas en múltiples momentos dentro de un mismo estímulo. Además, los datos son, por lo general, incomparables con cualquier cosa que pueda inventar un gemelo basado en un modelo de lenguaje grande (LLM), lo que hace que sea más difícil que se filtren inadvertidamente en el proceso de entrenamiento.

iMotions ofrece la referencia de referencia

Dado que iMotions Lab es una plataforma de investigación de biosensores multimodal idealmente posicionada para aplicaciones de neurociencia aplicadas al consumidor, que integra el seguimiento ocular, el análisis de expresiones faciales, la GSR/EDA, el EEG, el ECG y el análisis de voz en un entorno sincronizado de recopilación y análisis de datos, la validación de gemelos de consumidores, a través de varias de las capacidades de iMotions, resulta de gran relevancia.

Pruebas de estímulos multimodales. La plataforma iMotions Lab permite aplicar diseños de estudio idénticos en estudios basados en pantallas, entornos de realidad virtual, contextos en tiendas con gafas de seguimiento ocular y entornos naturalistas. En el caso de un «gemelo de consumidor» que deba validarse en publicidad digital, envases, entornos minoristas y experiencias de producto, esta coherencia entre contextos reduce la variación metodológica.

Cobertura de metodologías de neurociencia del consumidor. iMotions es compatible de forma explícita con las principales metodologías de neuromarketing: la atención visual mediante el seguimiento ocular en pantalla, la respuesta emocional mediante el análisis de expresiones faciales de Affectiva y el análisis de la voz, la implicación fisiológica mediante la galvanometría de piel (GSR) y la respuesta neuronal mediante la integración del electroencefalograma (EEG). Cada una de estas metodologías se corresponde con las dimensiones de la respuesta del consumidor que un gemelo trataría de predecir.

Integración de encuestas. La plataforma incluye una herramienta de encuestas integrada que permite a los investigadores cruzar las respuestas declaradas por los participantes con sus respuestas inconscientes registradas por biosensores en el mismo estudio. Esto resulta especialmente útil para la validación de gemelos: un equipo de investigación puede recopilar tanto las puntuaciones explícitas en la escala de Likert (que el gemelo ha sido entrenado para predecir) como las respuestas implícitas de los biosensores (que proporcionan una validación independiente) en un único conjunto de datos integrado.

Escalabilidad a lo largo de todo el ciclo de investigación. iMotions ofrece configuraciones que van desde estudios remotos basados en cámaras web —adecuados para muestras de mayor tamaño y una iteración más rápida— hasta configuraciones de laboratorio multimodales avanzadas para una validación de alta fidelidad. Para los programas de investigación basados en gemelos, esto resulta útil porque las estrategias de validación difieren en las distintas fases: el trabajo metodológico en las primeras fases puede utilizar instrumentación de laboratorio con muestras pequeñas, mientras que la calibración continua de un gemelo desplegado puede basarse en estudios remotos con cámara web para ganar en escala.

Exportación e integración de datos. Los datos brutos y las métricas derivadas pueden exportarse en formatos compatibles con el análisis posterior en R, Python, SPSS y otros entornos estadísticos, lo que permite integrar los resultados de los biosensores en los mismos flujos de trabajo de modelización que entrenan y evalúan al propio gemelo.

El papel que desempeña iMotions en un programa de investigación basado en gemelos no es el de sustituir al gemelo, sino el de actuar como capa de validación y calibración. El gemelo genera predicciones a gran escala; iMotions proporciona los datos de referencia de los biosensores que determinan si esas predicciones son fiables y en qué aspectos deben corregirse.

Un flujo de trabajo de validación representativo

Una metodología representativa para un estudio de mercado validado por pares podría desarrollarse de la siguiente manera.

El equipo de investigación crea o adquiere bajo licencia un «gemelo de consumidor» que representa al segmento objetivo, basándose en los datos disponibles a nivel individual —respuestas a encuestas, transcripciones de entrevistas, registros de comportamiento y contexto demográfico—. Se generan variantes de estímulos para la cuestión de investigación en cuestión: variantes creativas de anuncios, diseños de envases, conceptos de producto y flujos de la experiencia del cliente.

El modelo evalúa cada variante, generando puntuaciones previstas en las dimensiones de respuesta de interés (atractivo, atención, valencia emocional, intención de compra) y explicaciones cualitativas de las valoraciones. Las variantes se clasifican según su rendimiento previsto, y se seleccionan las mejores candidatas, junto con un pequeño conjunto de candidatas contrastantes, para su validación mediante biosensores.

Se selecciona una muestra reducida de participantes reales que se ajustan al segmento objetivo y se les exponen a los estímulos seleccionados en un estudio basado en iMotions, en el que se recogen de forma sincronizada datos de seguimiento ocular, análisis de expresiones faciales, respuesta galvánica de la piel (GSR) y respuestas a la encuesta. Los datos de los biosensores se procesan para obtener las dimensiones de respuesta equivalentes a las previstas por el gemelo: la atención a partir de los patrones de mirada, la valencia emocional a partir de las expresiones faciales, la excitación a partir de la GSR y las valoraciones explícitas a partir de la encuesta.

Las predicciones del gemelo se comparan con los datos del biosensor y de la encuesta. En este punto, hay tres resultados posibles: las predicciones del gemelo se corresponden bien con la respuesta humana (el gemelo está calibrado para este tipo de estímulo y se puede confiar en él para la evaluación de variantes posteriores), las predicciones del gemelo presentan un sesgo sistemático que se puede corregir (se ajusta la calibración y el flujo de trabajo continúa), o las predicciones del gemelo no se corresponden con la respuesta humana (el gemelo no es adecuado para esta categoría de estímulos y se requieren métodos tradicionales).

El modelo gemelo validado, cuya calibración está documentada, puede utilizarse entonces para evaluar variantes adicionales con mayor fiabilidad que la que ofrecería un modelo gemelo sin calibrar. Los estudios periódicos de revalidación garantizan que las predicciones del modelo gemelo sigan reflejando la respuesta humana a medida que evolucionan los productos, los mercados y el comportamiento de los consumidores.

Consideraciones metodológicas

Hay una serie de consideraciones que cualquier equipo que esté barajando la posibilidad de utilizar metodologías basadas en gemelos en la investigación de mercados debe tener en cuenta.

La generalización categórica no está demostrada. La mayoría de los resultados positivos de validación obtenidos hasta la fecha se han producido en categorías de productos relativamente limitadas: productos de cuidado personal, bienes de consumo envasados y publicidad en categorías consolidadas. Su eficacia en decisiones de compra B2B complejas, artículos de lujo, productos con especificidades culturales y categorías verdaderamente novedosas sigue sin estar demostrada.

Afirmaciones a nivel poblacional frente a afirmaciones a nivel individual. Las pruebas publicadas más sólidas respaldan el uso de métodos sintéticos para las predicciones agregadas. Las afirmaciones sobre predicciones a nivel individual —«este cliente concreto responderá de esta manera concreta»— están mucho menos fundamentadas y deben tratarse con cautela, sobre todo en aplicaciones de personalización en las que la precisión individual es fundamental.

Calidad de los datos en los que se basa el modelo. La calidad de un «gemelo» de consumidor depende directamente de la calidad de los datos individuales en los que se basa. Los gemelos creados a partir de transcripciones detalladas de conversaciones con consumidores reales del segmento objetivo ofrecen mejores resultados que los basados únicamente en atributos demográficos. La inversión en los datos en los que se basa el modelo suele ser la decisión metodológica con mayor impacto.

Ética y privacidad. Los gemelos de consumidores plantean cuestiones éticas distintas a las de los gemelos digitales operativos. Si un gemelo representa a una persona concreta e identificable, dicha persona suele tener derechos sobre cómo se utilizan sus datos y cómo actúa el gemelo en su nombre. Los gemelos de segmentos agregados plantean menos problemas éticos, pero siguen requiriendo un consentimiento cuidadoso y transparencia. El RGPD, la CCPA y las normativas emergentes específicas sobre IA coinciden en el principio de que los gemelos de consumidores creados a partir de datos personales requieren un consentimiento explícito y una transparencia significativa.

El problema del sesgo de adulación y positividad es real. Los equipos que utilizan «gemelos de consumidores» para tomar decisiones sobre si lanzar o no un producto deben ser especialmente cautelosos ante la tendencia documentada de los métodos basados en modelos de lenguaje grande (LLM) a generar predicciones excesivamente positivas. La validación mediante biosensores es una de las medidas de protección más eficaces contra este sesgo, ya que las respuestas fisiológicas están menos sujetas a ese sesgo de positividad inducido por el entrenamiento.

Hacia dónde se dirige el sector

Es probable que tres factores determinen la metodología de los «consumidores gemelos» en los próximos años.

En primer lugar, la integración de datos de comportamiento y de biosensores en el entrenamiento de gemelos virtuales está pasando de la fase de validación a una base sólida. En lugar de crear gemelos virtuales a partir de datos de texto y demográficos y validarlos con biosensores, los principales programas de investigación están empezando a incorporar los datos de los biosensores directamente en el entrenamiento de los gemelos virtuales, lo que da lugar a gemelos que predicen desde el principio tanto las respuestas conscientes como las inconscientes.

En segundo lugar, los métodos de rectificación y calibración son cada vez más sofisticados. Estudios académicos recientes han introducido técnicas en tiempo de inferencia para ajustar las respuestas de los encuestados sintéticos, con el fin de que se ajusten mejor a las distribuciones de las respuestas humanas, a pesar de disponer de datos humanos limitados, lo que hace que la investigación basada en gemelos resulte más práctica para los equipos que no pueden permitirse una validación humana continua a gran escala.

En tercer lugar, están surgiendo normas reglamentarias y metodológicas. Los organismos profesionales del sector de la investigación de mercados, las revistas académicas y los principales compradores del sector coinciden en sus expectativas en cuanto a la transparencia, la validación y la presentación de informes de la investigación basada en gemelos. Los estudios que solo presentan predicciones basadas en gemelos sin validación humana se ven cada vez con más escepticismo, mientras que los que incluyen tanto las predicciones basadas en gemelos como la validación mediante biosensores o validación humana se consideran contribuciones metodológicas legítimas.

Primeros pasos

Para los equipos de investigación que estén considerando trabajar en este ámbito, el proceso práctico consta de tres etapas.

En primer lugar, hay que identificar las categorías y las decisiones para las que resultan adecuados los métodos basados en gemelos —por lo general, cuestiones de investigación de gran volumen y menor importancia, en las que la rapidez y la escala aportan un claro valor añadido con respecto a los métodos tradicionales, en categorías de productos para las que existen pruebas de validación—.

En segundo lugar, hay que desarrollar la capacidad de validación de biosensores. Este es precisamente el caso de uso para el que se han diseñado plataformas como iMotions Lab, que ofrecen la cobertura de la metodología de neurociencia del consumidor, la sincronización multimodal y la integración de encuestas que requiere la validación basada en gemelos. Desarrollar esta capacidad de validación marca la diferencia entre una investigación basada en gemelos que genera conclusiones fiables y una que da lugar a afirmaciones especulativas.

En tercer lugar, desarrollar normas metodológicas internas que establezcan cuándo se puede confiar directamente en las predicciones basadas en gemelos, cuándo requieren validación mediante biosensores y cuándo siguen siendo necesarios los métodos tradicionales de investigación con seres humanos. Los programas más consolidados consideran que los estudios con gemelos, los biosensores y la investigación tradicional son métodos complementarios que deben combinarse en función de la pregunta de investigación, y no alternativas que compiten entre sí.

La tecnología avanza tan rápido que cualquier postura metodológica que se adopte hoy tendrá que revisarse en el plazo de un año. Sin embargo, es probable que el principio subyacente —que las predicciones sintéticas deben basarse en la respuesta humana real, y que esta se mide con mayor rigor mediante métodos de biosensores multimodales— se mantenga estable independientemente de los avances metodológicos que se produzcan en el futuro.

Bibliografía y lecturas recomendadas

  • Bisbee, J., et al. (2024). ¿Sustitutos sintéticos de los datos de encuestas a personas? Los riesgos de los grandes modelos de lenguaje. Political Analysis, 32(4), 401–416.
  • Goli, A., y Singh, A. (2024). ¿Pueden los modelos de lenguaje a gran escala captar las preferencias humanas? Marketing Science.
  • Argyle, L. P. y otros (2023). «De uno, muchos: el uso de modelos lingüísticos para simular muestras humanas». Political Analysis, 31(3), 337-351.
  • Tjuatja, L., et al. (2024). ¿Muestran los modelos de lenguaje grande sesgos en las respuestas similares a los humanos? Un estudio de caso sobre el diseño de encuestas. Transactions of the Association for Computational Linguistics.
  • Los modelos de lenguaje grande reproducen la intención de compra humana mediante la extracción de similitudes semánticas a partir de las puntuaciones de Likert (2025). arXiv:2510.08338.
  • Revista Internacional de Investigación en Marketing e Instituto de Ciencias del Marketing. (2025). Convocatoria de número especial: IA generativa, datos sintéticos y encuestados sintéticos en la investigación de mercados.
  • Almeida, G. F. C. F. y otros (2024). «Exploración de la psicología del razonamiento moral y jurídico de los modelos de lenguaje grandes (LLM)». *Artificial Intelligence*, 333.