ROI

Lead-Scoring mit KI: Vom Hype zum messbaren ROI.

17. April 2026 · Philipp R. Stegmann · 7 Min. Lesezeit

Lead-Scoring ist eine der ältesten Sales-Disziplinen und gleichzeitig eine der am schlechtesten umgesetzten. Die klassische Variante — Punkte für Job-Titel, Firmengröße, Formular-Downloads — liefert in der Realität selten belastbare Priorisierung. Die KI-basierte Variante kann das ändern. Aber nur, wenn drei Bedingungen erfüllt sind, die in den meisten Mittelstandsteams noch nicht stehen.

Warum klassisches Scoring versagt

Regelbasierte Scoring-Systeme sind statisch. Sie vergeben Punkte nach Annahmen, die vor Jahren in einem Workshop festgelegt wurden: „Geschäftsführer = 20 Punkte", „über 500 Mitarbeiter = 15 Punkte", „Whitepaper heruntergeladen = 10 Punkte". Diese Annahmen veralten schnell und reflektieren selten das tatsächliche Kaufverhalten. Eine Auswertung über 18 Monate hinweg zeigt oft, dass die höchstbepunkteten Leads eine niedrigere Close-Rate haben als das Mittelfeld — weil die Regeln historisch gewachsen sind und nicht auf Outcomes kalibriert wurden.

Was KI-basiertes Scoring anders macht

Ein ML-Modell (klassisch: Gradient Boosting, neuere Ansätze mit Transformer-Embeddings für Textsignale) lernt aus tatsächlichen Abschlüssen. Es identifiziert Merkmalskombinationen, die Menschen kaum manuell festlegen würden — etwa: Ein Lead aus einem 120-Mitarbeiter-Unternehmen mit einer bestimmten Technologie-Signatur, der innerhalb von 48 Stunden nach einem webinarbezogenen E-Mail-Klick eine Preisseite besucht, schließt mit 4-facher Wahrscheinlichkeit gegenüber dem Durchschnitt.

Wichtig zu verstehen: Die KI ersetzt nicht die Vertriebsintuition. Sie macht sie skalierbar und auditierbar.

Die drei Voraussetzungen

1. Ausreichend gelabelte Historie. Ein ML-Modell braucht Signale über Closed-Won und Closed-Lost, idealerweise über die letzten 18–24 Monate. Wer seine Opportunity-Status nicht konsistent pflegt, hat keine Trainingsdaten. Das ist die harte Voraussetzung, an der Projekte oft scheitern — und es ist eine Prozess-, keine Technik-Frage.

2. Verhaltenssignale, nicht nur Stammdaten. Klassisches Scoring nutzt vor allem Firmen- und Personen-Merkmale. Der große Hebel liegt aber bei Verhaltensdaten: Besuchsfrequenz auf der Website, E-Mail-Engagement, Meeting-Zeitpunkte, Download-Verhalten. Ohne diese Daten bleibt auch die KI flach.

3. Feedback-Loop mit dem Vertrieb. Jeder Score muss vom aufnehmenden Rep bestätigt oder korrigiert werden können. Das ist der Unterschied zwischen einem ML-Modell, das sich verbessert, und einem, das nach sechs Monaten für unbrauchbar erklärt wird.

Realistische Wirkung

In Implementierungen im deutschen B2B-Mittelstand lassen sich über 12 Monate hinweg zwei Effekte belastbar messen: Die MQL-zu-SQL-Conversion-Rate steigt um 1,5 bis 3 Prozentpunkte — das ist viel, bei gleicher Lead-Menge. Die durchschnittliche Antwortzeit auf hochbepunktete Leads sinkt, weil die Priorisierung sichtbar wird. Beides zusammen bewegt die Pipeline-Qualität spürbar.

Was selten passiert: eine Verdoppelung der Gesamt-Conversion. Wer mit solchen Zahlen wirbt, hat entweder schlecht gemessen oder vergleicht unsaubere Baselines.

Der häufigste Implementierungspfad

Pragmatisch: Mit einem einfachen Gradient-Boosting-Modell auf Basis vorhandener CRM-Daten starten. Parallel Website-Tracking und E-Mail-Engagement-Signale strukturiert einsammeln. Nach drei Monaten die ersten Trainings-Iterationen mit echten Outcome-Labels. Erst in Monat 6–9 wird das Modell wirklich tragfähig — vorher ist es ein sinnvoll informierter Schätzer, keine Prognose.

Die wahre Hürde ist fast nie das Modell. Sie ist die Daten- und Prozess-Disziplin dahinter. Wer diese Disziplin etabliert, bekommt aus KI-Scoring einen der stabilsten Vertriebshebel. Wer sie nicht etabliert, bekommt eine weitere Dashboard-Oberfläche ohne Wirkung.

Bereit für Ihr Scoring-Audit?

Im „The Automatic Agent"-Deep-Dive prüfen wir, ob Ihre Daten- und Prozessbasis für KI-Scoring trägt.

Deep Dive ansehen

Weiterlesen

Integration