From red flags to KPIs: how we're embedding brand safety into campaign forecasting models

We’ve been trying to solve this for a while: how do you actually forecast whether an influencer campaign will be both performant AND brand-safe?

For years, we treated these as separate problems. You’d vet for brand safety (usually a yes/no gate), and then you’d model for performance metrics like engagement, reach, conversion. But that’s backwards. Brand safety is a performance metric.

Lately, we’ve been working on integrating brand safety directly into our campaign ROI forecasts. Instead of asking “will this campaign hit our engagement targets?”, we’re asking “will this campaign hit our engagement targets while meeting our brand safety thresholds?

Here’s what we’re doing:

1. Defining brand safety as a measurable dimension. This sounds obvious, but it’s harder than it seems. We started by listing brand risks: fake followers, inauthentic engagement, content misalignment, audience quality issues, past controversies. Then we assigned each a weight based on how much it actually impacts brand trust and campaign outcomes.

2. Building forecasting models trained on cross-market data. We’re using historical campaign data from both US and Russian markets. For each campaign, we have: creator profile data, content characteristics, audience composition, actual engagement outcomes, and post-campaign brand feedback about safety and satisfaction.

3. Treating brand safety as a constraint, not a filter. Instead of saying “this creator fails brand safety, rejected”, we’re saying “this creator has a 72% brand safety score and a predicted 3.2x ROI. Given our risk tolerance, should we do this?”

This shifts the conversation from binary (safe/unsafe) to probabilistic (what risk are we willing to take?).

4. Cross-market validation. Here’s where the bilingual aspect matters. We train the model on what brand safety looks like in each market, but we validate against the other market. A creator who looks safe in the US but risky in Russia gives us signal that we’re missing something.

The tricky part is getting the weighting right. What’s more important—a creator’s audience quality or their past content? If an influencer has great engagement but iffy audience composition, what’s the actual risk?

We’re still learning. Early results suggest that audience authenticity and content consistency are the strongest predictors of both brand safety and campaign performance. But we keep finding exceptions.

My question: when you forecast campaign performance, how much weight are you giving to brand safety? Are you modeling it as part of the ROI calculation, or is it still a separate gate? And how do you decide on your risk tolerance when the data doesn’t give you a clear answer?

Мне очень нравится этот подход—рассматривать безопасность бренда как измерение, а не как препятствие. Это меняет динамику.

У меня есть наблюдение из моей работы: когда вы говорите с инфлюенсерами и брендами о партнёрствах, те, кто наиболее ценят долгосрочные отношения, также наиболее сосредоточены на соответствии ценностям. Они не просто думают о метриках; они думают о том, какой смысл несет контент.

Может быть, при создании вашей модели вы также должны включить элемент«культурного соответствия»? Не просто цифры, но также: разделяют ли инфлюенсер и бренд похожие ценности? Это может быть сложно количественно, но это часто предсказывает успех и безопасность.

Мне было бы интересно услышать, пробовали ли вы включить это.

Это интересный подход, но я вижу проблему с методологией. Вы говорите, что используете исторические данные кампаний, но дайте мне примеры:

  • Какие метрики бренд-безопасности вы отслеживаете постфактум? Вы полагаетесь на самоотчёты брендов?
  • Как вы управляете «подвижной целевой линией»? Определение бренд-безопасности может измениться, когда появляется новый скандал или новые требования регулирования.
  • Есть ли у вас исторический период, на котором вы проверили эту модель? Например, вы встреча смотрели на кампании, проведённые год назад, предсказывали результаты с вашей моделью и验证了?

Также: вы упомянули, что трактуете бренд-безопасность как вероятностное, а не бинарное. Это хорошо, но требует очень чёткого определения того, что означает 72% бренд-безопасности. Для финансового директора, утверждающего бюджет, это не достаточно конкретно.

Как вы коммуницируете результаты модели заинтересованным сторонам? Если вы говорите «этот инфлюенсер имеет 3.2x ROI, но 72% бренд-безопасности», как бренд принимает решение?

Ещё вопрос—вы упомянули кросс-маркетную валидацию. Как вы справляетесь с радикально разными нормами по рынкам? Например, что считается приемлемым контентом в России, может быть запрещено в США. Как модель узнает об этих политико-культурных различиях?

I’m intrigued by this model, but I have a practical concern: who owns the risk decision?

In my agency, when we present a campaign opportunity to a client, they want a recommendation, not a probability distribution. If we say “this creator forecasts at 3.2x ROI with 72% brand safety,” half the clients will ask “so should we do it or not?”

Your model might catch the data, but it doesn’t capture the client’s actual risk tolerance. For a FMCG brand, 72% might be unacceptable. For a DTC startup, it might be totally fine.

How do you customize the model to account for different clients’ risk profiles? Or do you require clients to define their own thresholds upfront?

Also—when you say you’re training on cross-market data, how are you handling the fact that market regulations different? GDPR affects what data you can use in Europe. Russian regulations are different from US. Are you building separate models for different jurisdictions, or are you trying to create one unified model?

This is a sophisticated approach, but I’d challenge one assumption: that brand safety and performance are linked the same way across different campaign types.

In my experience, the relationship between audience authenticity and performance depends on what you’re selling. For brand awareness, authentic audiences matter less than reach. For DTC conversion, audience quality is critical. For brand-building campaigns, misalignment on values is a huge risk.

So rather than one unified model, you might need a suite of models—one for awareness campaigns, one for conversion, one for brand-building. How are you segmenting by campaign type?

Also, I’d stress-test your cross-market validation logic. You said you train on one market and validate on another, but markets are structurally different. Creator economics are different. Platform algorithms are different. So a pattern that appears in US data might simply not exist in Russian data, not because the pattern is invalid, but because the markets are different. Have you accounted for that?