取消
NMSBA徽标子

神经营销中的样本量

卡拉·内格尔(Carla Nagel)
博客因斯塔

在神经营销中要讨论的一个常见主题是样本量。没有“原型神经营销研究”之类的东西。使用了各种不同的技术,方法和组合。此外,研究的设计会影响样本量。我们请了一些专家详细介绍了这个主题。

艾丽莎·摩西(Elissa Moses): “许多人不了解神经统计规则”

所使用的技术:益普索根据每种研究类型的目标和需求使用完整的阵列。目前最需要的是隐式反应时间和面部编码,但也使用了大量的眼动仪,生物识别技术和EEG。

“对于需要哪种神经样本,业内存在困惑,因为每种工具都具有不同的转换点以实现统计稳定性。许多人不了解的是,统计能力,代表性和可靠性的规则不会改变,因为度量是“神​​经”而不是“认知”或传统问题。主题的数量因方法以及我们是否在线进行或面对面学习而​​异。对于在线用户,我们通常会寻找大约n = 100个消费者的完整最低样本量,但是根据子组分析的需要,样本量可能会有所不同。对于控制力更大的面对面CLT研究,我们发现较小样本的统计稳定性,例如大多数工具的n = 65。

我们通过讨论神经测量技术如何受与调查研究相同的统计定律来向客户解释样本量的准则,并解释每种方法如何得出样本量。最终,我们为客户提供了保证,因为益普索遵守统计标准的严格电源要求。”

Elissa Moses是BrainGroup Global的首席执行官&HARK Connect™的执行合伙人

伯恩德·韦伯教授: “样本量在很大程度上取决于客户的问题。”

使用的技术:功能性MRI方法学,同时进行眼动追踪。

“我们通常使用的样本量约为30至40个主题,但这在很大程度上取决于问题和客户。如果客户对个人差异或特定客户感兴趣,样本量也会增加。

我们会就适当的样本量咨询客户。如果客户仅对主题的“平均反应”感兴趣,则样本量可能小于需要考虑个体差异的情况。

我们向客户说明,他们必须清楚自己想从研究中获得什么。在与客户的讨论中,我们通常会在迭代过程中解决特定的问题和需求。我们详细讨论了将合理采用的方法以及如何导致所需样本量的差异。通常建议不要分析低于20位受试者的样品,因为这样会影响个体对观察到的总体效果的影响。”

伯恩德·韦伯(Bernd Weber)是波恩大学/ Life大学的教授&Brain gmbH

ThomasRamsøy博士: “我们很少发现客户询问分数差异”

使用的技术:移动式或固定式眼动仪和EEG。其他技术:NeuroVision(基于计算神经科学的基于云的系统),面部编码,fMRI和生理测量。

“我们的常规综合复制测试解决方案通常会测试100多名参与者。较小的,更专注的研究(例如店内或包装研究)通常会测试40至50个人。这一切都取决于研究的范围,小组的定义以及期望的代表样本是什么。

我们最常看到的问题是关于统计能力,以及我们的能力是否足够强大。神经科学方法通常具有不可思议的统计能力。借助EEG,我们每毫秒产生的数据量惊人。客户应该更关注样本的代表性,以及40、100或200人是否回答了他们的基本问题。我们经常看到的另一个问题与基准测试有关。这些反应如何影响某些规范性材料?什么构成“好”或“坏”广告?答案是专注于建立一个具有代表性的样本和子样本的良好数据库。

值得注意的是客户没有解决的问题。我们很少让客户询问分数的变化,即一群人以特定方式做出回应的一致性。例如,一组可能显示x的平均得分,但显示出巨大的差异(有些得分较高,有些得分较低)。另一组可能显示相同的x平均得分,但此处的方差很小。在第一组中,您应该非常谨慎地从均值中解释很多内容。在第二组中,您可以肯定自己观察到的分数是可靠的。重要的是要了解客户所提出的问题投入运营的后果。”

ThomasRamsøy是创始人& CEO of Neurons Inc

理查德·西尔伯斯坦教授: “神经科学不会改变统计定律”

使用的技术:稳态地形(SST)。该技术测量大脑不同部位的神经信息处理速度,以确定对交流的心理反应。

“我们的最小牢房是50人。因此,一个涉及特定品牌的顾客和非顾客的典型两室研究将涉及100人。我们在这个主题上没有很多问题,但是我们与以前使用过其他神经供应商的客户遇到的一个常见问题是``为什么有那么多人?''您需要的人数取决于您要询问的问题和统计强度您正在检查的效果。抽样理论用于确保我们的研究项目中使用的人口(以及所获得的见解)准确反映出我们客户所针对的消费者群体。

举一个简单的例子,对于汽车行业的客户,我们可能会看到一组有50名受访者正在购买新车。这是从中抽取样本的相当简单的标准。即使这样,也不能保证有购买意向的群体是同一个群体。虽然有购买意向的样品可能会根据其未来的购买意图进行“匹配”,但它们可能会在许多其他条件(例如品牌偏好,车辆偏好或社会经济地位)上不匹配。同样,我们可以通过仔细招募来控制这些附加条件-但是总会有其他未知的生物学和认知因素使表面上同质的组非常异质。这些其他因素通常在样本中的个体之间差异很大-这就是样本大小很重要的地方。通过使用足够大的样本,由于这些不同且不相关的其他因素导致的方差趋于平均,从而减小了其影响。保留结果以更准确地反映客户的真实目标群体。正如我们所说,神经科学不会改变统计定律。”

理查德·西尔伯斯坦(Richard Silberstein)是Neuro-Insight董事长

Jaime Romano博士: “如果客户不熟悉推论统计,就很难解决关于统计错误的问题”

使用的技术:事件相关电位,定量脑电图,眼电图,皮肤电反应,心电图,血容量脉搏,神经心理学评估

“我们使用用于检验实验假设的统计工具来证明样本量的合理性。如果我们正在寻找一个相关性r>在P300实验中为0.85,样本大小仅为18个对象。另一方面,如果我们要比较四个不同广告系列之间的购买意愿,并进行年龄差异的分析,则该样本最多可有96个参与者。

客户关于研究设计的问题可以通过推论统计和描述性统计之间的差异来解释。第一个是NMKT用于“拒绝有关人口的索赔”的方法,而后者是在调查中用于“描述有关人口的索赔”的方法。如果客户不熟悉推论统计,就很难解决客户关于统计错误的问题。我们通常会解释说,NMKT所使用的I型错误0.05意味着我们有5%的机会得到错误的答案,而调查中5%的错误意味着我们所代表的人口不足或超过5%。

我们为客户提供统计常见问题解答,可使用公式解决最常见的问题,我们
具有Java小程序,供数学上更高级的客户使用。我们使用的最著名的例子是“我需要多少人接受X物质杀人的说法”这一问题。客户的直觉答案是“好,只有一个”,但是当我们重新考虑问题时,客户就会理解统计数据在认识到专业且准确的样本计算的相关性方面所起的作用。”

Jaime Romano是NEUROMARKETING MX的总监

Hirak Parikh博士: “对25到40位受试者的脑部扫描可提供重要的结果”

使用的技术:64通道Biosemi EEG系统(频率为8 kHz)。眼动追踪,皮肤电反应(GSR),呼吸频率,激素和酶分析方面的其他专业知识。另外,与Neurensics合作提供了功能磁共振成像。

“根据我们在领域的经验和多项研究,对25至40个受试者的脑部扫描(取决于具体问题以及目标人群的多样性)可提供可预测神经行为的重要结果。
更大的人口。扫描合适数量的主题始终是我们的头等大事,以为客户提供具有统计意义的可靠结果。在大多数情况下,我们还需要来自客户的验证数据。

正如最近许多科学研究所证明的那样,如果您使用脑部扫描而不是问卷调查,那么这种小样本可以预测整个人群的行为。 Berns和Moore的一项研究表明,对27位青少年进行的脑部扫描能够更好地预测整个人群中流行歌曲的市场成功(销售额),并且与从问卷中收集的数据相比,销售额与销售额之间的关系更为紧密[Berns&Moore,文化流行的神经预测器,《消费者心理学杂志》 2011年]。在The Neuromarketing Labs在2012年进行的一项研究中,使用拿铁玛奇朵咖啡自动售货机进行了研究,结果显示,对35名大学生的大脑扫描足以预测整个大学生的购买行为。与问卷调查的自我报告相比,这些预测更符合实际的购买行为。 [巴尔多&Müller,“神经营销实验室进行的“拿铁玛奇朵研究”,2013年。”

Hirak Parikh博士早期风险基金经理& Entrepreneur

Christophe Morin博士: “我们确定准确性的水平,并让我们的客户愿意为数据承担风险”

使用的技术:语音分析,生物特征研究和面部成像

“我们使用语音分析对深度访谈(ILI)中引起的情绪进行定性探索。样本通常从6到24个主题不等。我们也使用面部成像进行定性探索(24个主题)和定量研究(200多个)。我们仅进行定量生物特征研究(从72个主题开始,最好是200多个)

有关样本量的问题始终与我们收集的数据的统计意义有关。我们使用的某些技术涉及对数据进行聚类,这是一种揭示可能具有共同特征的主题(集群)子组的方法。当我们这样做时,群集的大小很重要,否则每个群集之间方差的重要性就会受到影响。

我们确定准确性的水平,并让客户愿意承担使用数据的风险,然后提出最佳建议。我们的科研团队拥有4名博士学位,因此我们非常确信我们可以在样本量,统计有效性和成本之间做出很好的选择。”

Christophe Morin博士是SalesBrain的首席执行官兼联合创始人

马丁·德·蒙尼克(Martin de Munnik): “基于MRI的研究的目标人群的适当人数明显低于传统研究的目标人群”

使用的技术:功能性MRI方法学,同时进行眼动追踪

“神经科学研究的独特之处之一是,只有相对较少的主题,就可以获得有关产品,品牌,广告,包装设计或促销的质量的可靠结果。一个简单的原因是,一个群体作为一个整体的真实观点存在于该群体中只有少数几个代表的大脑中。

Emily Falk(2012)通过仅扫描30名吸烟者的大脑活动来预测美国反吸烟运动的有效性。 Neurensics使用称为E es(Lamme)的行之有效的有效基准测试,预测了全国电视商业成功率高达88%&Scholte,2013年)。仅约20名受试者就获得了电视广告效果方面的显着差异。基于MRI的研究可以使用较小的目标人群,因为受试者之间的大脑激活差异远小于主观调查得分的差异。”

Martin de Munnik是Neurensics的创始合伙人

Arnaud Petre教授: “按照随机效果设计进行实验对我们来说至关重要。”

使用的技术:fMRI(3、7和9.4 Tesla)。有时会与嵌入式眼动仪,嵌入式脑电图,心率测量,皮肤电导和/或嗅觉仪结合使用以闻香。

“我们不需要很多人,但是每个测试细分至少需要12个人。这是MRI的优点之一。例如,使用EEG-ERP,您需要更多的主体和更多的重复,因为信号嘈杂。

我们的设计始终与事件相关,我们的分析始终遵循随机效应模型。关于个体特定效应,有两个共同的假设,即随机效应假设和固定效应假设。我们在研究中使用的随机效应假设是个体特异性效应与自变量无关。相反,固定效应假设假设特定个体效应与自变量相关。

我们对随机效应模型坚持很多。对我们来说,这比样本量本身更重要。当我们在样本中添加更多人时,随机效果设置的结果不会有太大变化。在我们之前进行的大规模研究项目中,样本12和样本48的样本之间的差异小于2%。

我们将段数乘以12得出最小样本量,从而可以在数据分析之间进行划分。通常,我们的样本在36至72个主题之间。”

Arnaud Petre是Brain Impact-Consumer Neuroscience的首席执行官

杰玛·卡尔弗特教授: “如果客户以前没有统计经验,那么说明样本和效应量可能会具有挑战性”

使用的技术:隐式启动范例和fMR

“对于隐式研究,我们通常需要400名受访者(或每个单元格或数据切割100名)才能达到95%的置信区间和0.8的效应量。对于功能磁共振成像,这取决于范例。理想情况下,如果一项研究与之前的一项研究相似,则可以对先前的数据进行功效计算,以确定需要多少受试者才能在初始研究中获得结果。这样就可以估算出效应的大小,并将为后续研究提供样本量。

我们在隐式研究中使用的样本量通常与客户熟悉的标准定量在线小组中使用的样本量一致。

使用fMRI,最经常出现的问题是我们如何才能将研究对象概括为正常人群。如果客户没有统计经验,要对此进行解释是一个复杂的挑战。但是,我们解释说,大脑反应的可变性远不及显式量度,在这种情况下,您需要更少的对象来检测效果。这是因为检测组或条件之间的统计差异取决于响应的方差。如果差异很大(人们的明确反应可能相差很大),则每个组中都需要有大量数字,以便发现明显的组差异。如果方差很小(fMRI BOLD信号模式经常出现这种情况),那么简单地增加更多的受试者就不会影响激活的大脑区域的检测,也不会影响fMRI信号相对于基线噪声的大小。”

Gemma Calvert是南洋商学院消费者神经科学教授

本文最初发表在Insights中。 成为会员 并访问完整的Insights存档!