コンシューマー向けデジタルツインがインサイトをどのように変革しているか、そしてその成功にバイオセンサーの検証が不可欠な理由
消費者の行動や関心、感情をシミュレートする仮想モデルである「デジタルツイン」は、マーケティングリサーチに大きな変革をもたらしつつある。本記事では、その手法、合成回答者を巡る妥当性に関する議論、そしてiMotionsのような生体センサープラットフォームが、消費者のデジタルツインを実際の人間の反応に基づいて構築する上で果たす役割について考察する。
Table of Contents
「デジタルツイン」という概念がマーケティング分野に浸透した経緯は、この用語がより広く使われているエンジニアリング分野とは異なるものでした。産業分野におけるデジタルツインは、物理的な資産にセンサーを取り付けることから始まりましたが、マーケティング分野におけるデジタルツインは、タービンやサプライチェーンと同様に、消費者もまた、測定可能な入力と予測可能な出力を備えたシステムとしてモデル化できるという認識から始まりました。
ここ数年、大規模言語モデル、行動データインフラ、そして消費者神経科学の融合により、このアイデアは単なる仮説的な概念から実用的な手法へと急速に発展した。もっとも、その急速な普及に伴い、有効性に関する疑問も数多く提起されている。
市場調査の専門家、消費者インサイトのリーダー、そして消費者行動を研究する学術研究者にとって、コンシューマー・デジタルツインは今や、真剣に検討すべき方法論の一つとなっている。
本記事では、コンシューマー・ツインとは具体的にどのようなものか、合成回答者手法という広い枠組みの中でどのような位置づけにあるのか、その妥当性について現在の研究が何を示しているのか、そしてiMotionsなどのプラットフォームによって可能となるバイオセンサーを用いた検証が、ツインに基づくインサイトの信頼性にとってなぜ不可欠になりつつあるのかについて考察する。
コンシューマー向けデジタルツインとは何ですか?
この分野における用語の定義はまだ定まっておらず、先へ進む前に明確にしておく必要があります。市場調査業界では、合成手法について、おおむね3つの大まかなカテゴリーに収束しつつありますが、これらは主に、実在の人物のデータにどの程度基づいているかによって区別されます。

「純粋な合成回答者」とは、国勢調査データ、行動モデリング、および大規模言語モデルの事前分布に基づいてAIが生成したペルソナです。これらは特定の個人とは結びついていません。個々の行動を予測するのではなく、集計された回答パターンを概算することを目的とする、人口レベルのシミュレーション、調査データの拡張、および探索的な研究において有用です。
「合成消費者」とは、市場調査用途に特化して設計された「合成回答者」の一種です。これらは、実際の購入者が製品コンセプト、価格設定、メッセージを評価する際の思考や行動を再現するように設計されており、主にコンセプトテスト、メッセージテスト、および初期段階の探索調査に活用されます。
コンシューマー・デジタルツインは、そのスペクトルの中で最も現実的な位置づけにあります。コンシューマー・ツインとは、特定の個人または厳密に定義された消費者セグメントを仮想的に表現したものであり、アンケート回答、行動観察、取引履歴、インタビュー記録、および/または表明された嗜好といった、個人レベルの実際のデータに基づいて構築され、新たなデータが蓄積されるにつれて時間とともに進化するように設計されています。合成消費者(シンセティック・コンシューマー)が一般化されたペルソナであるのに対し、デジタルツインは、既知の個人またはマイクロセグメントをモデル化した、動的で精緻に調整されたモデルです。
この区別が重要なのは、各カテゴリーによって検証手法、ユースケース、リスクが異なるためです。純粋な合成回答者は、一般的に人口統計の集計データに基づいて検証されます。一方、コンシューマー・ツインは、それが表す実在の人物やセグメントの実際の回答に基づいて検証されるため、その個人やグループに特化した予測を生成することが可能になります。
「コンシューマー・ツインズ」は実際にどのように構築されるのか
コンシューマー・ツインの実用的な実装の多くは、3つの入力層を組み合わせています。
行動データと取引データが実証的な基盤を形成しています。購入履歴、ウェブやアプリでのインタラクション、ロイヤリティプログラムのデータ、メディア利用パターン、CRM記録などは、消費者が実際にどのような行動をとったかを明らかにします。これらのデータには、自己申告ではなく実際に観測されたものであるという利点があり、静的なものではなく動的な「ツイン」を形成する時間的なパターンを提供します。
表明された選好や態度に関するデータは、消費者が自分自身について語る内容を反映しています。アンケート回答、インタビューの記録、フォーカスグループの成果、およびパネルデータは、行動データだけでは捉えきれない動機や思考プロセスを補完するものです。検索強化生成(Retrieval-Augmented Generation)技術の発展により、LLM(大規模言語モデル)ベースのツインを、対象となる個人との実際の会話記録に基づいて構築することが、ますます現実的なものとなっています。
人口統計データや文脈データは、特定の対象集団(年齢、所得、居住地域、世帯構成、ライフステージなど)において、生成AIモデルを位置づける基盤となります。研究によると、LLM(大規模言語モデル)に基づく合成回答者は、模倣対象者の人口統計的属性を考慮するよう指示された場合、その性能が大幅に向上することが示されています。特に、年齢と所得水準は、現実世界の回答分布と一致させる上で極めて重要な変数となります。
この「ツイン」自体は、通常、当該データへの構造化されたアクセス機能を備えたLLMとして実装され、個人の会話記録や行動記録からの情報検索機能が追加され、プロンプトや微調整によって、対象となる人物の応答様式に準拠するよう制約が加えられています。より高度な実装では、LLMの基盤の上に、行動モデル、購買意向モデル、注意モデル、感情モデルなどを重ね合わせることで、特定の刺激に対する具体的な予測を生成します。
消費者向けツイン技術が活用されている分野
デジタルツインのマーケティング分野における活用事例は、5つの重複するユースケースに集約される。
コンセプトおよび製品テスト。これは最も実施件数の多い調査手法です。ブランド側は、ツイン(またはターゲット層に合致したツインの集団)に刺激材料を提示し、魅力、独自性、購入意向、カテゴリー適合性などの観点から予測される反応を収集することで、新製品のコンセプト、パッケージデザイン、または処方を評価します。
最近の研究では、LLM(大規模言語モデル)に基づく合成消費者に適用された意味的類似度評価手法が、9,300件の人間による回答を含む57件のパーソナルケア製品に関する調査において、人間のテスト・リテスト信頼性の90%を達成したことが示された。これは、適切な方法論的条件下において、合成消費者が人間の概念評価の集計結果を再現できることを示す、これまで公表された中で最も有力な証拠となっている。
広告およびクリエイティブのテスト。Twinsを活用すれば、ブランドがメディア費用を投入する前に、どの広告バリエーションがエンゲージメント、記憶率、説得力において最も高い成果を上げそうかを予測できます。その経済的メリットは極めて魅力的です。従来の30秒CM1本に対する事前テストでは、通常、数百人の回答者と数週間にわたる実地調査が必要でしたが、Twinsを活用した事前テストなら、数百ものバリエーションを数時間で検証することが可能です。
カスタマージャーニーのシミュレーションとCXの最適化。特定の顧客セグメントの「双子」グループに対し、異なるオンボーディングフロー、顧客維持のための施策、サービスとのやり取りといったジャーニーのバリエーションを適用することで、どの経路が最良の結果をもたらすかを特定できます。これにより、ジャーニー設計は、単なる過去の帰属分析から、将来を見据えたシミュレーションへと移行します。
価格設定および商品構成に関する調査。コンジョイント分析形式の「支払意思額」調査は、双子を対象とした手法へと移行しつつある。この手法では、双子が価格、機能、ブランドの組み合わせにおけるトレードオフを評価し、従来の人間を対象とした調査では不可能なほど大規模な分析が可能となっている。
パーソナライゼーションとセグメンテーションの最適化。より分析的なレベルでは、(データが許す限り)個々の顧客の「ツイン」を活用して、パーソナライズされたレコメンデーション、コンテンツのバリエーション、またはオファーをテストすることができ、これにより、実際のA/Bテストのみを行う場合よりも、パーソナライゼーションエンジンの学習速度を向上させることができます。
妥当性の問題(?)
「コンシューマー・ツインズ」をめぐる方法論的な活発さに対し、その妥当性に関する文献も数多く存在するが、2025年末から2026年初頭時点では、その評価は明らかに賛否両論である。
こうした有望な知見は事実です。前述のパーソナルケア製品に関する研究に加え、査読付き論文やワーキングペーパーによる研究でも、LLM(大規模言語モデル)に基づく合成回答者が、政治的意見、消費者の嗜好、および定性的な回答における特定の集計パターンを再現できることが実証されています。
ハーバード・ビジネス・スクール、MITスローン・スクール・オブ・マネジメント、および複数の大学のマーケティング学部による研究では、これらの手法が真剣に検討されてきた。『International Journal of Research in Marketing』誌は、マーケティング・サイエンス・インスティテュートと共同で、マーケティング調査における生成AI、合成データ、および合成回答者をテーマとした特集号への投稿を募集しており、学術界がこのテーマを厳密な検討に値するものとして捉えていることを示している。
こうした憂慮すべき知見もまた、紛れもない事実である。Tjuatjaらによる9つのオープンソースおよび商用LLMの包括的な評価では、人間が確実に示す項目形式の回答バイアスに関して、これらのモデルは概して人間のような行動を反映できていないことが判明した。Bisbeeらは『Political Analysis』誌において、合成された調査回答者としてのLLMについて、彼らが「大規模言語モデルの危険性」と呼ぶものを報告しており、そこにはプロンプトの文言や人口統計学的プロンプティング戦略に対する著しい感受性が含まれていた。 Yuらは、標準化された共感質問票におけるGPT-4とLlama3の応答を人間の回答と比較し、GPT-4は質問票の予想される因子構造を再現したものの、人間の得点の大きさは再現できなかったのに対し、Llama3は因子構造の再現さえも失敗したことを明らかにした。
文献には、いくつかの特定の故障モードが繰り返し見られる:
- おべっかや過度な肯定バイアス。役に立ち、協調的であるよう訓練されたLLMは、仮想の回答者として使用された際、非現実的なほど肯定的だったり批判的でないフィードバックを生成しがちであり、実際の消費者が指摘するような否定的な反応や製品の欠点を浮き彫りにすることができない。
- 回答の分散が不十分である。合成回答者は、回答分布が滑らかすぎたり中心に偏りすぎたりする傾向があり、現実の消費者行動の特徴である外れ値や極端なケースが平滑化されてしまう。
- 社会的望ましさバイアス。最近の研究によると、LLMはアンケート回答において人間と同様の社会的望ましさバイアスを示すことが明らかになっている。一見すると好ましいように思えるが、このバイアスこそが、適切に設計された市場調査が回避しようとしているものだと気づけば、話は別だ。
- プロンプトの影響を受けやすい。合成回答者による推定値は、プロンプトの文言、ペルソナの設定、選択肢の順序に非常に左右されやすいため、綿密な方法論的な管理を行わなければ、安定した推定値を得ることが困難である。
- 集団レベルでの妥当性は認められるが、個人レベルでの妥当性は認められない。複数の研究で、合成手法は集計された回答パターンをかなり正確に再現できる一方で、特定の個人の回答を予測することはできないことが指摘されている。この違いは、パーソナライゼーションの応用において極めて重要である。
- 錯覚。生成モデルは、一見すると説得力があるものの、実際には事実と異なる情報を生成することがあり、検証の過程でこれが見逃されると、誤解を招くような結果をもたらす恐れがある。
率直に言えば、消費者向けデジタルツインは有用ではあるものの、単独ではまだ信頼に足るものではありません。仮説の生成や特定の集計パターンの再現には優れており、真に有益な定性的な成果も生み出しますが、重要な商業的判断に活用するには、実際の人の反応と照らし合わせて検証を行う必要があります。
バイオセンサーのバリデーションが重要な理由
ここで、マーケティング研究者にとって、この方法論の展開が最も興味深い局面を迎える。従来の合成回答者の検証では、人間の調査データを「グラウンド・トゥルース(真の基準)」として用いてきた。つまり、合成回答者のリッカート尺度による予測回答と、実際の人間が同じ項目について報告した回答とを比較するのだ。これは必要ではあるが、十分とは言えない。その理由は、マーケターたちが数十年前から認識している通り、消費者が刺激について口にする言葉と、実際にそれに対して示す反応とは、別物だからである。
消費者神経科学はこのギャップについて広範に実証している。反応について単に振り返るという行為そのものが反応を変化させ得る上、自己報告による測定には、社会的望ましさバイアス、記憶バイアス、事後合理化の影響を受けやすい。人々の発言を予測するように訓練された「消費者ツイン」が、せいぜいできることといえば、人々の発言を正確に予測することだけである。
必ずしも、実際の購買行動を左右する前意識的注意、感情的価値、認知的努力、あるいはその他の反応の側面を予測するものではない。これらの側面は、消費者神経科学の広範な文献において、意思決定の大部分を占めると推定されている。
バイオセンサーを用いた検証は、このギャップを埋める手段となります。その手法は、原理的には単純明快です。つまり、双子が評価したのと同じ刺激を、アイトラッキング、表情分析、皮膚電気反応(GSR)、そして必要に応じて脳波(EEG)の測定装置を装着した、小規模ながらも代表的な実在の回答者グループに提示するのです。
バイオセンサーが測定可能な指標(視覚的注意のパターン、感情的反応、覚醒度、認知負荷など)に関するツインの予測と、実際に記録された生理的反応とを比較する。その相違点を利用してツインを調整し、予測が信頼できる部分と、予測が外れる部分を特定する。
この「較正と検証」のループには、いくつかの優れた特徴がある。生体センサーによる測定値は、人間を対象とした調査や合成回答者に影響を及ぼすような回答バイアスの影響を受けにくく、独立した基準となる。また、単一の要約スコアではなく、連続的で時間分解能の高いデータを生成するため、1回の生体センサー調査だけで、単一の刺激に対する多くの時点におけるツインの予測を検証することができる。 また、このデータは一般的に、LLMベースの双子が生成しうるものとは比較にならないため、トレーニングプロセスに意図せず漏れ出すリスクが低くなります。
iMotionsがグラウンドトゥルースを提供します
iMotions Labは、アイトラッキング、表情分析、GSR/EDA、EEG、ECG、音声分析を統合し、これらを同期したデータ収集・分析環境として提供する、コンシューマー向け神経科学アプリケーションに最適なマルチモーダル生体センサー研究プラットフォームであるため、iMotionsの各種機能を活用したコンシューマー・ツイン検証は、本プラットフォームと直接的に関連しています。
マルチモーダル刺激テスト。iMotions Labプラットフォームは、画面ベースの調査、VR環境、アイトラッキングメガネを使用した店舗内環境、および自然環境といった、あらゆるコンテキストにおいて同一の調査設計をサポートします。デジタル広告、パッケージ、小売環境、製品体験といった多様な領域で検証が必要な消費者ツインの場合、こうしたコンテキスト間の一貫性により、方法論的なばらつきを低減することができます。
消費者神経科学の手法に関する解説。iMotionsは、ニューロマーケティングの中核となる手法を明確にサポートしています。具体的には、画面ベースのアイトラッキングによる視覚的注意、Affectivaによる表情分析および音声分析による感情反応、GSR(皮膚電気反応)による生理的関与、そしてEEG(脳波)統合による神経反応です。これらはそれぞれ、ツインモデルが予測を目指す消費者反応の次元に対応しています。
調査機能の統合。本プラットフォームには、調査ツールが組み込まれており、研究者は同一の研究において、参加者の明示的な回答と、無意識のバイオセンサー反応とを照合することができます。これは特に双生児検証において有用です。研究チームは、明示的なリッカート尺度による評価(双生児が予測するように訓練されたもの)と、暗黙的なバイオセンサー反応(独立した検証を提供するもの)の両方を、単一の統合データセットとして収集することが可能です。
研究の成熟度に応じた拡張性。iMotionsは、大規模なサンプルサイズや迅速な反復に適したウェブカメラベースの遠隔調査から、高精度な検証のための高度なマルチモーダル実験室環境まで、幅広い構成を提供します。 双子を対象とした研究プログラムにおいて、これは有用です。なぜなら、検証戦略は研究段階によって異なるためです。初期段階の方法論的な研究では、少数のサンプルに対して実験室レベルの機器を使用する場合がある一方、導入済みの双子を対象とした継続的なキャリブレーションでは、規模の拡大を図るためにウェブカメラを用いた遠隔調査に依存する場合があるからです。
データのエクスポートと統合。生データおよび派生指標は、R、Python、SPSS、その他の統計解析環境での後続の分析に対応した形式でエクスポート可能です。これにより、バイオセンサーの出力を、ツイン自体の学習および評価を行うのと同じモデリングワークフローに統合することが可能になります。
iMotionsがツインベースの研究プログラムにおいて果たす役割は、ツインの代わりとなることではなく、検証および調整の層としての役割です。ツインは大規模な予測を生成し、iMotionsは、それらの予測が信頼できるかどうか、またどこを修正すべきかを判断するための、実測値となるバイオセンサーデータを提供します。
代表的な検証ワークフロー
ツイン検証による消費者調査の代表的な手法は、次のように進められる。
研究チームは、調査回答、インタビューの記録、行動履歴、人口統計学的背景といった利用可能な個人レベルのデータに基づき、対象セグメントを代表する「コンシューマー・ツイン」を構築、あるいはライセンス供与を受ける。そして、その調査課題に合わせて、広告クリエイティブのバリエーション、パッケージデザイン、製品コンセプト、顧客体験フローといった刺激要因のバリエーションが生成される。
このツインモデルは各バリエーションを評価し、対象となる反応指標(魅力、注目度、感情的価値、購入意向)に対する予測スコアと、評価結果に関する定性的な説明を生成します。バリエーションは予測パフォーマンスに基づいて順位付けされ、上位の候補に加え、対照となる少数の候補がバイオセンサーによる検証のために選定されます。
対象セグメントに合致する実際の回答者から小規模なサンプルを募集し、iMotionsを基盤とした調査において選定された刺激を提示する。その際、アイトラッキング、表情分析、皮膚電気反応(GSR)、およびアンケート回答を同時に収集する。生体センサーデータは、双生児モデルが予測した対応する反応次元へと処理される。具体的には、視線パターンから注意、表情から感情の価数、GSRから覚醒度、アンケートから明示的な評価が導き出される。
双子の予測は、バイオセンサーおよび調査データと比較される。 この時点で、3つの結果が考えられます。双子の予測が人間の反応とよく一致する場合(この刺激タイプに対して双子が調整済みであり、さらなる変異体の評価において信頼できる)、双子の予測に修正可能な系統的な偏りがある場合(調整を行い、ワークフローを継続する)、あるいは双子の予測が人間の反応と一致しない場合(この刺激カテゴリに対して双子は不適切であり、従来の方法が必要となる)です。
このようにして検証済みかつ校正記録が整備されたツインモデルは、校正されていないツインモデルよりも高い信頼性をもって、その他のバリエーションを評価するために活用できます。定期的な再検証調査を行うことで、製品、市場、消費者の行動が変化していく中でも、ツインモデルの予測が人間の反応を的確に捉え続けられるようになります。
方法論に関する考察
消費者調査においてツインベースの手法を検討しているチームにとって、いくつかの注意点に留意することが不可欠です。
カテゴリー別の一般化については、まだ実証されていない。これまでの肯定的な検証結果の多くは、パーソナルケア製品、消費財、確立されたカテゴリーにおける広告など、比較的制約の多い製品カテゴリーに関するものである。複雑なB2B購買決定、高級品、文化的に特有の製品、そして真に斬新なカテゴリーにおける成果については、依然として実証されていない。
集団レベルと個人レベルの予測に関する主張。公表されている最も有力な証拠は、集計的な予測には合成手法を用いることを支持している。一方、「この特定の顧客はこう反応する」といった個人レベルの予測に関する主張は、その根拠が著しく乏しく、特に個人の予測精度が重要なパーソナライゼーションの用途においては、慎重に扱うべきである。
基礎データの質。コンシューマー・ツインの精度は、その基盤となる個人レベルのデータの質に左右されます。ターゲット層の実際の消費者との会話の詳細な記録に基づいて構築されたツインは、単なる人口統計学的属性のみに基づいて構築されたツインよりも優れた成果を上げます。基礎データへの投資は、一般的に最も費用対効果の高い方法論上の判断と言えます。
倫理とプライバシー。コンシューマー・ツインは、運用上のデジタル・ツインとは異なる倫理的課題を提起する。ツインが特定可能な個人を表す場合、その個人は通常、自身のデータの利用方法や、ツインが自身に代わって行動する方法に関して権利を有する。集約されたセグメント・ツインは倫理的な問題が少ないとはいえ、それでも慎重な同意と透明性が求められる。GDPR、CCPA、および新たに策定されつつあるAI関連規制は、個人データに基づいて構築されたコンシューマー・ツインには、明示的な同意と実質的な透明性が求められるという原則で一致しつつある。
おべっかやポジティブバイアスの問題は現実のものだ。製品発売の可否判断にコンシューマー・ツインを活用するチームは、LLM(大規模言語モデル)ベースの手法が過度に楽観的な予測を生成しがちであるという既知の傾向について、特に注意を払う必要がある。生体センサーによる検証は、このバイアスに対する有効な対策の一つである。なぜなら、生理的反応は、学習によって生じる同様のポジティブバイアスの影響を受けにくいからだ。
この分野の今後の動向
今後数年間、消費者のツイン・メソドロジーを形作る要因として、以下の3つの動向が挙げられる。
まず、行動データと生体センサーデータをツインの学習プロセスに統合する取り組みは、検証の段階を超え、本格的な実用化へと向かっています。テキスト情報や人口統計データからツインを構築し、生体センサーを用いてその妥当性を検証する従来の方法とは異なり、最先端の研究プロジェクトでは、生体センサーデータをツインの学習プロセスに直接組み込み始めており、その結果、最初から意識的な反応と無意識的な反応の両方の側面を予測できるツインが生み出されています。
第二に、データ補正やキャリブレーションの手法がますます高度化しています。最近の学術研究では、限られた実データを用いて合成回答者の出力を調整し、人間の回答分布により近づけるための推論時手法が導入されており、これにより、大規模かつ継続的な実データによる検証を行う余裕のないチームにとっても、ツイン(仮想人間)を活用した研究がより実践的なものとなっています。
第三に、規制や方法論に関する基準が確立されつつある。市場調査業界の業界団体、学術誌、および主要な業界の買い手は、双子を対象とした調査における透明性、検証、報告に関する期待について、見解を一致させつつある。人間の検証を伴わない双子による予測のみを報告する研究は、ますます懐疑的に見られるようになっている一方で、双子による予測と、バイオセンサーまたは人間による検証の両方を報告する研究は、正当な方法論的貢献として扱われるようになっている。
はじめに
この分野での研究を検討している研究チームにとって、具体的な進め方は3つの段階から成ります。
まず、ツインベースの手法が適しているカテゴリーや意思決定を特定します。具体的には、検証データが存在する製品カテゴリーにおいて、処理量が多く、リスクの低い研究課題で、スピードと規模の面で従来の手法よりも明確な価値が得られるケースが挙げられます。
第二に、バイオセンサーの検証体制を構築することです。これは、iMotions Lab などのプラットフォームが特に設計されたユースケースであり、ツイン検証に必要な消費者神経科学の手法、マルチモーダル同期、およびアンケート調査との統合機能を備えています。検証体制の構築の有無こそが、信頼性の高い知見を生み出すツイン研究と、推測に過ぎない主張を生み出すツイン研究との違いを決定づけるのです。
第三に、双子の予測結果を直接信頼できる場合、バイオセンサーによる検証が必要な場合、そして従来の人間を対象とした研究手法が依然として必要とされる場合について、内部的な方法論的基準を策定する。最も成熟した研究プログラムでは、双子、バイオセンサー、および従来型の研究を、互いに競合する選択肢としてではなく、研究課題に応じて組み合わせるべき補完的な手法として扱っている。
技術の進歩は極めて速いため、今日とった方法論的な立場は、1年以内に見直しが必要になるだろう。しかし、合成予測は実際の人間の反応に基づいていなければならないこと、そして実際の人間の反応はマルチモーダルなバイオセンサー手法によって最も厳密に測定できるという根本的な原則は、今後どのような方法論的な進展があろうとも、変わらないままである可能性が高い。
参考文献および関連文献
- Bisbee, J. 他(2024).「人間による調査データの合成代替物? 大規模言語モデルの危険性」.『Political Analysis』,32(4),401–416.
- Goli, A., & Singh, A. (2024). 大規模言語モデルは人間の選好を捉えることができるか?『Marketing Science』
- Argyle, L. P. 他 (2023). 「一から多へ:言語モデルを用いた人間サンプルのシミュレーション」. 『Political Analysis』, 31(3), 337–351.
- Tjuatja, L. 他(2024)。「LLMは人間のような回答バイアスを示すか? 調査設計における事例研究」。『計算言語学会誌』。
- LLMはリッカート尺度評価の語義的類似性を引き出すことで、人間の購買意図を再現する(2025年)。arXiv:2510.08338.
- 『International Journal of Research in Marketing』およびマーケティング・サイエンス研究所(2025年)。特集号の募集:マーケティング調査における生成AI、合成データ、および合成回答者。
- Almeida, G. F. C. F. 他 (2024). LLMの道徳的・法的推論の心理的メカニズムの解明. Artificial Intelligence, 333.
