When AI flags a pattern and you're not sure what to do: lessons from our real-world anomaly detection workflow

This is a story about building an anomaly detection system for influencer vetting and realizing that the technical problem is actually the easy part. The hard part is: what do you do when the AI finds something weird?

We built a system to flag unusual patterns in creator behavior—sudden follower spikes, engagement patterns that don’t match historical norms, audience composition shifts, that kind of thing. The AI works great. It catches real anomalies.

But then what?

Early on, we’d flag an anomaly and immediately escalate to a human reviewer. The reviewer would look at it, try to figure out if it’s a red flag or just normal variance, and make a judgment call. Problem: different reviewers would come to different conclusions about the same anomaly. We’d have inconsistency.

So we built decision trees. If anomaly type A + context B + risk score > C, then escalate. Otherwise, auto-pass. This helped with consistency. But it also meant we were now making automated decisions based on rules that were essentially arbitrary.

We got burned. Twice. We auto-passed creators who later turned out to have engaged in coordinated inauthentic behavior. Our decision tree didn’t catch them because the anomaly didn’t align with our pre-defined patterns. The tactics had evolved.

So we changed the approach. Now we:

1. Flag everything that’s even slightly anomalous. Don’t try to pre-judge what matters. Let humans see the full picture.

2. Give reviewers context, not just the flag. Instead of showing “engaging rate = 7.8%, historical avg = 4.2%, anomaly score = 0.78”, we show: “This creator posted a viral video 3 days ago. Engagement spike is proportional to virality. Audience composition stable. No red flags.” Context helps judgment.

3. Track what we get wrong. When a creator we pass ends up being problematic, or a creator we flag ends up being fine, we log it. We’re building a feedback loop to understand where our judgment is failing.

4. Update decision rules quarterly, not once and done. Fraud tactics change fast. Legitimate behavior patterns change fast. If your decision framework is stale, it’s going to fail.

The biggest insight: anomalies aren’t automatically problems. They’re just deviations from expected patterns. Most anomalies have explanations. A creator who suddenly gets 10x engagement probably went viral. That’s not fraud; that’s success. The AI flags it because it’s unusual. You need humans to understand why it’s unusual and whether that matters.

We’re getting to a place where the workflow works reasonably well:

  • AI provides the signal (here’s what’s unusual).
  • Humans provide the judgment (here’s why it probably matters or doesn’t).
  • We learn together (when we get it wrong, we update).

But it’s not perfect, and I don’t think it ever will be. Fraud evolves. Tactics shift. You’re always going to have edge cases.

For anyone building similar systems: don’t expect AI anomaly detection to be a magic bullet. It’s a tool that helps you focus human attention. But it requires thoughtful integration with human judgment, and it requires continuous learning.

Have you built anomaly detection into your vetting workflow? What does that actually look like when you operationalize it? And what are the edge cases that keep tripping you up?

Это очень практичный пост, спасибо. Одна вещь, которая выделяется для меня: вы говорите о том, что нужна обратная связь и обучение вместе.

В моей сетевой работе, я вижу это так часто—люди делают суждения на основе неполной информации. AI может помочь с этим, но только если система построена с пониманием того, как люди работают.

Мой совет: когда вы даёте контекст рецензентам, убедитесь, что это контекст, который они действительно могут использовать. Не просто цифры. Где получено это видео? Может ли быть историческое объяснение? Был ли недавний важное событие в жизни этого инфлюенсера?

Когда я звоню инфлюенсеру, чтобы узнать, почему произошло что-то необычное, часто появляется простое объяснение. Модель не знает этого контекста, потому что он не в данных. Но человек может попросить его.

Может быть, часть вашего процесса должна быть: когда AI флагирует что-то двусмысленное, человек просто спрашивает инфлюенсера, что произошло?

Это хороший кейс о том, как системы могут не сработать. Вы упомянули, что дважды автопаспи создателей, которые позже оказались проблемными. Цифры:

  • Каков был процент ложных отрицательных результатов?
  • Как долго вы не ловили мошенничество?
  • Какие потери это стоило вам?

Потому что если это случается часто, ваша система не работает. Если редко, может быть, это просто издержки ведения бизнеса.

Также: вы говорите, что обновляете правила квартально. Как вы решаете, когда обновление стоит того? Есть ли метрика, которая говорит вам: “дельта производительности достаточно большая, чтобы переобучить”?

И последнее: вы отслеживаете время, затрачиваемое рецензентами? Потому что добавление контекста может замедлить рецензию. Это компромисс скорости vs. качества. Как вы его управляете?

Как основатель, я ценю эту прагматичность. Звучит как вы много раз ошибались и учились на ошибках.

Для моего стартапа, это важно: я не могу позволить себе иметь переоцненное развертывание AI. Даже небольшое количество неправильных решений может разрушить доверие партнёров.

Со ваей системой: когда вы даёте рецензентам полный контекст, какое среднее время требуется для рецензии одного флага? И при каком объёме флагов это становится невозможным масштабировать?

Потому что это звучит как система, которая требует очень хорошего состава команды. И мне не ясно, как это масштабируется, когда вы растёте.

This is exactly what we’re struggling with. We built an anomaly detection system, deployed it, and then realized our reviewers didn’t have the context to make good decisions.

So we started adding context—historical profiles, recent content, audience shifts. But this meant each review took longer. We hit a throughput wall.

We’re now experimenting with tiering. Low-confidence anomalies (probably fine, but slightly unusual) go to auto-review with different thresholds. High-confidence anomalies (very unusual) get human review. This helps us scale.

But I’m curious about your feedback loop. When you say you track what you get wrong—how heavily does that feedback weight on retraining? Because I suspect there’s a lag. You don’t find out about a problematic creator for weeks or months after you passed them. By that time, you’ve already passed hundreds of others. So the signal is noisy.

Also—have you thought about tier-2 escalation? Not everything that’s anomalous needs immediate human review. Some stuff can be monitored over time. If a creator’s behavior looks slightly off, you can flag it for monitoring and re-evaluate in a week. That way, you’re not burning reviewer time, but you’re also not making irreversible decisions on incomplete signal.

This is a textbook example of the real cost of AI in operations: it doesn’t just replace human judgment, it changes the information structure.

Before AI, your reviewers probably had intuition built on experience. They’d see a creator and just “know” if something was off. Now, AI is generating signals, and reviewers have to translate those signals into decisions. That’s a different skill.

My observation: companies that do this well invest heavily in reviewer training. They teach reviewers how to think about AI signals, how to spot when the signal is misleading, how to combine signal with domain knowledge.

Your quarterly retraining is good, but I’d also recommend: monthly calibration sessions where reviewers discuss edge cases. Have them vote on “should this be escalated?” and then show them what actually happened. This keeps judgment sharp and gives you signal for model updates.

One more thing: be careful about feedback loops that reinforce bias. If your reviewers are mostly flagging creators in one demographic or market, your system will learn to flag that demographic/market more aggressively. This is a known failure mode. You need to actively monitor for this drift.