Joint Lead Scoring: Ein gemeinsames Scoring-Modell für Marketing und Sales

Das Marketing-Team hat drei Monate damit verbracht, das Scoring-Modell zu entwickeln. Es hat Sales befragt, Closed-Won-Daten analysiert und die MAP-Regeln eingerichtet. Dann wurde es live gestellt.
Sales warf einen Blick auf die ersten hoch bewerteten Leads, rief ein paar an und kehrte zur eigenen Liste zurück. Der Score, so hieß es, spiegele nicht das wider, was sie beim Kunden tatsächlich sehen.
So enden die meisten Lead-Scoring-Projekte. Nicht wegen eines schlechten Modells. Sondern weil niemand dem Modell vertraut.
Das Problem liegt selten in der Mathematik. Es liegt im Prozess. Wenn Marketing ein Scoring-Modell entwickelt und es Sales übergibt, hat Sales keine Eigenverantwortung für das Ergebnis. Sales hat nicht entschieden, welche Signale wichtig sind. Sales hat die Gewichtungen nicht validiert. Wenn das Modell einen Lead produziert, den Sales nicht angerufen hätte, gibt es keinen Grund, ihm zu vertrauen.
Ein gemeinsam entwickeltes Modell – eines, bei dem beide Teams zu den Gewichtungen beigetragen, es gegen reale Closed-Won-Daten getestet und die Schwellenwerte gemeinsam festgelegt haben – ist die einzige Variante, die den Kontakt mit dem Sales-Team überlebt. Bevor das Modell entwickelt wird, sollten beide Teams das gemeinsame ICP-Framework vereinbart haben – die Scoring-Gewichtungen sind nur so gut wie die zugrunde liegende Definition des Idealkunden.
Wichtige Fakten: Wirksamkeit von Lead Scoring
- Unternehmen, die Lead Scoring einsetzen, erzielen laut MarketingSherpa-Forschung zu B2B-Qualifizierungspraktiken einen um 77 % höheren ROI bei der Lead-Generierung als Unternehmen ohne Scoring.
- Nur 44 % der Unternehmen berichten, dass Marketing und Sales die Lead-Scoring-Kriterien formal gemeinsam vereinbaren, so eine Demand-Gen-Report-Studie.
- Unternehmen mit ausgereiftem Lead-Management und Scoring generieren 50 % mehr vertriebsbereite Leads zu 33 % niedrigeren Kosten pro Lead, so Forrester Research.
- Sales-Teams, die an der Entwicklung des Scoring-Modells beteiligt waren, nutzen Lead Scores bei der Priorisierung dreimal häufiger als Teams, die nur ein fertiges Modell erhalten haben, so eine SiriusDecisions-Studie zu funktionsübergreifender Abstimmung.
- Scoring-Modelle mit Decay-Regeln übertreffen statische Modelle bei der SQL-to-Opportunity-Conversion um 28 %, laut einer Analyse von Aberdeen Group.
Das Scoring-Modell, das niemand verwendet
Bevor wir zum Aufbau kommen, lohnt es sich, ehrlich zu sein, warum die meisten Scoring-Modelle scheitern. Forresters Übersicht zum Individual Interest Scoring beschreibt die zentrale Herausforderung treffend: Ein Score ist nur dann nützlich, wenn die Teams, die er bedienen soll, den Eingaben vertrauen.
Problem 1: Marketing definiert das Modell einseitig. Sales war nicht dabei, als die Gewichtungen festgelegt wurden. Sales hat keinen Kontext dafür, warum ein Besuch der Pricing-Seite 25 Punkte wert ist, die Teilnahme an einem Webinar aber nur 15. Wenn das Modell kontraintuitive Ergebnisse liefert, vertraut Sales nicht genug darauf, um seinem Bauchgefühl zu widersprechen.
Problem 2: Das Modell gewichtet Engagement stärker als Fit. E-Mail-Öffnungen, Blog-Besuche, Social-Media-Klicks: Diese Signale inflationieren die Scores für Personen, die sich für Inhalte interessieren, aber nie kaufen werden. Ein Marketing Manager in einem 10-Personen-Unternehmen, der jede E-Mail liest, erzielt einen höheren Score als ein VP of Operations in einem 300-Personen-Zielunternehmen, der einmal die Pricing-Seite besucht hat. Der höher bewertete Lead ist nicht der bessere Lead.
Problem 3: Keine Decay-Regeln. Ein Lead, der vor 14 Monaten einen Leitfaden heruntergeladen hat, trägt diesen Score noch immer. Alte Engagement-Signale spiegeln keine aktuelle Kaufabsicht wider. Ohne Decay verstopfen alte hohe Scores die Spitze der Prioritätsliste.
Problem 4: Das Modell wird nie neu kalibriert. Märkte verändern sich. Der ICP verschiebt sich. Neue Kanäle generieren Leads unterschiedlicher Qualität. Ein Scoring-Modell, das auf Closed-Won-Daten vom Vorjahr basiert, kann nach 18 Monaten Betrieb aktiv falsch liegen.
Gemeinsame Verantwortung löst Problem 1 strukturell, weil Sales am Aufbau des Modells beteiligt ist und den Kontext für die Gewichtungen kennt. Die anderen Probleme erfordern spezifische Designentscheidungen – darum geht es im Rest dieses Artikels. Wenn Sie unsicher sind, ob Ihr Unternehmen überhaupt ein formales Scoring benötigt, behandelt der Artikel Wann kein Lead Scoring nötig ist die Fälle, in denen einfachere Qualifizierung ein Scoring-System übertrifft.
Das Drei-Dimensionen-Modell
Das Fit + Intent + Behavior Scoring-Dreieck
Das Fit + Intent + Behavior Scoring-Dreieck ist ein Lead-Scoring-Modell mit drei Dimensionen, bei dem jede Achse eine eigenständige Qualität eines Leads misst – unabhängig bewertbar, unabhängig berichtbar und unabhängig kalibrierbar.
- Fit (wer sie sind): Statische firmografische und rollenbasierte Signale. ICP-Match, Titel, Tech-Stack, Unternehmensgröße. Zerfällt nicht schnell.
- Intent (was sie gerade recherchieren): Aktive Signale für ein Kaufzeitfenster. Demo-Anfragen, Pricing-Besuche, G2-Kategorierecherche, Bombora Topic Surges. Zerfällt innerhalb von Tagen bis Wochen.
- Behavior (wie engagiert sie mit Ihnen sind): Tiefe Engagement-Signale. Webinar-Teilnahme, Content-Downloads, Trial-Nutzung. Zerfällt über 30–90 Tage.
Ein Lead muss auf mindestens zwei Dimensionen Mindestschwellenwerte überschreiten, bevor er MQL-Status erreicht. Hohes Behavior allein qualifiziert einen Lead nicht. Hoher Fit allein qualifiziert einen Lead nicht. Das Dreieck braucht mindestens zwei Seiten, um zu stehen.
Ein Scoring-Modell, das auf drei separaten Dimensionen (Fit, Intent und Behavior) basiert, ist transparenter und wartbarer als ein einzelner Composite Score, weil jede Dimension für sich genommen verständlich ist.
Fit Score: Wer das Unternehmen und die Person sind. Statische oder sich langsam verändernde Signale, die widerspiegeln, ob dieses Konto in Ihrem Zielmarkt liegt.
Intent Score: Was sie gerade aktiv recherchieren. Signale, die darauf hindeuten, dass ein Kaufzeitfenster offen ist oder bevorsteht.
Behavior Score: Was sie mit Ihrem Content und Produkt gemacht haben. Engagement-Signale, die auf die Tiefe des Interesses hinweisen.
Jede Dimension kann separat bewertet, separat berichtet und separat kalibriert werden. Wenn ein Lead einen hohen Fit, aber einen niedrigen Intent hat, ist das ein nützliches Signal, das in einer einzigen Composite-Zahl verloren geht.
Der Artikel Fit vs. Intent Scoring geht tiefer auf die Abwägungen zwischen diesen beiden Dimensionen ein. Dieser Artikel konzentriert sich darauf, wie alle drei gemeinsam aufgebaut werden.
Fit Scoring: Was einbezogen werden sollte
Fit-Signale beantworten die Frage: „Ist das die Art von Unternehmen und Person, an die wir verkaufen sollten?"
Firmografische Signale (Unternehmensebene):
| Signal | Punkte (Beispiel) | Quelle |
|---|---|---|
| Unternehmensgröße: 50–500 Mitarbeitende | +20 | Formularfeld, Clearbit, ZoomInfo |
| Zielbranche passend | +15 | Formularfeld, Anreicherung |
| Geografie: betreute Region | +10 | IP, Formularfeld |
| Unternehmensgröße: 501–2.000 Mitarbeitende | +10 | Anreicherung |
| Unternehmensgröße: außerhalb des Zielbereichs | -15 | Anreicherung |
Rollen-/Titel-Signale (Personenebene):
| Signal | Punkte (Beispiel) | Quelle |
|---|---|---|
| VP oder C-Level in relevanter Funktion | +25 | Formularfeld, LinkedIn-Anreicherung |
| Director in relevanter Funktion | +15 | Formularfeld, LinkedIn-Anreicherung |
| Manager in relevanter Funktion | +5 | Formularfeld |
| IC in relevanter Funktion | 0 | Formularfeld |
| Außerhalb der Zielfunktion | -10 | Formularfeld |
Tech-Stack-Signale: Wenn Ihr Produkt in bestimmte Tools integriert oder diese ersetzt, ist ein Kontakt, dessen Unternehmen diese Tools verwendet, besser geeignet als einer, der das nicht tut.
| Signal | Punkte (Beispiel) | Quelle |
|---|---|---|
| Nutzt Ziel-Integrationspartner | +15 | Clearbit, G2, Anreicherung |
| Nutzt das Tool, das Sie ersetzen | +10 | Clearbit, selbst angegeben |
| Kein relevanter Tech-Stack-Überlapp | 0 | — |
Negative Fit-Signale (Disqualifikatoren): Diese sind entscheidend und werden häufig übersprungen.
| Signal | Punkte | Wirkung |
|---|---|---|
| Bekannte Wettbewerber-Domain | -100 | Effektive Disqualifikation |
| Studenten-E-Mail / akademische Domain | -50 | Unterdrückt |
| Außerhalb der bedienten Geografie | -30 | Reduziert Score erheblich |
| Unternehmen zu klein (< 10 Mitarbeitende) | -20 | Deprioritisiert |
Die negativen Signale sind genauso wichtig wie die positiven. Ein Scoring-Modell ohne Disqualifikatoren produziert hohe Scores für Personen, die nie kaufen werden.
Intent Scoring: Third-Party- und First-Party-Signale
Intent-Signale beantworten die Frage: „Suchen sie gerade aktiv nach einer Lösung für dieses Problem?"
First-Party-Intent-Signale stammen von Ihren eigenen Kanälen. Sie sind die zuverlässigsten, weil Sie das Verhalten direkt beobachtet haben.
| Signal | Punkte (Beispiel) | Warum |
|---|---|---|
| Demo-Anfrage eingereicht | +50 | Explizites Kaufsignal |
| Besuch der Pricing-Seite (3+ Seiten) | +35 | Aktive Evaluierung |
| ROI-Kalkulator verwendet | +30 | Kaufabsicht |
| Wettbewerbervergleichs-Seite | +25 | Evaluierungsmodus |
| Free Trial gestartet | +40 | Starkes Produktinteresse |
| Besuch der Pricing-Seite (einzeln) | +15 | Recherchesignal |
Third-Party-Intent-Signale stammen von Datenanbietern, die das Rechercheverhalten über mehrere Websites hinweg verfolgen: G2, Bombora, TechTarget und ähnliche Plattformen. Gartners Leitfaden zu B2B Lead Scoring mit Intent-Signalen zeigt, dass Unternehmen, die Intent-Daten zusammen mit firmografischen Fit-Kriterien nutzen, doppelt so häufig eine Top-of-Funnel-Conversion-Rate von 10 % oder mehr erzielen.
| Signal | Punkte (Beispiel) | Quelle |
|---|---|---|
| Topic Surge: relevante Kategorie (Bombora) | +30 | Bombora |
| G2-Profilaufrufe für Ihre Kategorie | +25 | G2 Buyer Intent |
| Kategorie-Recherche-Spike | +20 | TechTarget, Bombora |
Third-Party-Intent-Daten sind leistungsstark, erfordern aber Budget und Integrationsaufwand. Falls diese nicht vorhanden sind, können First-Party-Signale allein ein funktionierendes Modell aufbauen. Proxy-Signale funktionieren ebenfalls: Wenn ein Kontakt innerhalb von 30 Tagen mehr als 4 Bottom-of-Funnel-Inhalte konsumiert hat, ist das ein vertretbares Intent-Signal – auch ohne externe Daten.
Wie Intent gegenüber Fit gewichtet werden sollte: Bei den meisten inbound-getriebenen B2B-Bewegungen sollte Intent stärker gewichtet werden als Fit, wenn beides vorhanden ist. Ein perfekt geeignetes Unternehmen, das aktiv recherchiert, ist wertvoller als ein perfekt geeignetes Unternehmen, das einen einzigen Blog-Beitrag heruntergeladen hat. Aber Intent ohne Fit ist immer noch Rauschen – gewichten Sie entsprechend.
Behavior Scoring: Engagement-Tiefe
Behavior-Signale beantworten die Frage: „Wie engagiert ist diese Person speziell bei uns?"
Content-Engagement:
| Signal | Punkte (Beispiel) | Hinweise |
|---|---|---|
| Webinar besucht (live) | +20 | Live-Teilnahme > aufgezeichnete Ansicht |
| Leitfaden oder E-Book heruntergeladen | +10 | |
| Blog-Besuch (3+ Seiten) | +8 | |
| Webinar registriert, nicht erschienen | +3 | Schwaches Signal |
| Newsletter-Öffnung | +2 | Sehr schwach; nicht zu stark gewichten |
| E-Mail-Klick (Link zu Inhalt) | +5 | Stärker als Öffnung |
Produkt-Engagement (falls zutreffend):
| Signal | Punkte (Beispiel) | Hinweise |
|---|---|---|
| Trial-Konto erstellt | +30 | Starkes Intent-Signal |
| Feature im Trial genutzt | +15 pro Feature | |
| Trial-Nutzungslimits überschritten | +25 | Kapazitätssignal |
Decay-Regeln (unverzichtbar):
Alte Behavior-Signale sollten zerfallen. Ein Lead, der vor 14 Monaten Ihren Blog besucht hat, ist derzeit nicht engagiert. Wenn der alte Behavior-Score weitergezählt wird, vergiftet er das Modell.
| Signalalter | Score-Multiplikator |
|---|---|
| 0–30 Tage | 100 % |
| 31–60 Tage | 75 % |
| 61–90 Tage | 50 % |
| 91–180 Tage | 25 % |
| 180+ Tage | 0 % (oder Beitrag begrenzen) |
Die meisten MAP-Plattformen unterstützen Decay-Regeln nativ. Wenn Ihre Plattform das nicht tut, führen Sie monatlich einen Batch-Job aus, der Scores mit einem Alterungsfaktor neu berechnet.
Der Artikel Lead Scoring Model Decay behandelt dies ausführlicher.
Die drei Dimensionen kombinieren
Drei Ansätze zur Kombination von Fit, Intent und Behavior zu einem nutzbaren Score:
Option 1: Composite Score. Alle drei Dimensionen werden zu einer einzigen Zahl addiert. Einfach zu berichten, leicht zu vergleichen. Aber dabei geht die Sicht auf die einzelnen Dimensionen verloren. Sie können nicht erkennen, ob ein Score von 85 auf hohen Fit/niedrigen Intent oder niedrigen Fit/hohes Behavior zurückzuführen ist.
Option 2: Schwellenwert-Logik (für die meisten Teams empfohlen). Definieren Sie Mindestschwellenwerte pro Dimension. Ein Lead erreicht nur dann MQL-Status, wenn er auf mindestens zwei von drei Dimensionen Mindestwerte erreicht. Dies verhindert, dass ein hoch engagierter, aber schlecht passender Lead als MQL eingestuft wird.
Beispiel für Schwellenwert-Logik:
- MQL erfordert: Fit Score ≥ 30 UND (Intent Score ≥ 20 ODER Behavior Score ≥ 25)
- Hot MQL: Fit ≥ 40 UND Intent ≥ 30
Option 3: Matrix-Modell. Fit und Intent werden als separate Achsen berichtet. Hoher Fit/hoher Intent = sofortige Kontaktaufnahme. Hoher Fit/niedriger Intent = Nurturing. Niedriger Fit/hoher Intent = sorgfältig behandeln. Niedriger Fit/niedriger Intent = unterdrücken. Dies gibt Sales den nützlichsten Kontext, erfordert aber UI-Unterstützung, um praktikabel zu sein.
Für Teams mit einem MAP und CRM, die mehrere Score-Felder anzeigen können, bietet die Schwellenwert-Logik mit separater Dimensionsberichterstattung das Beste aus beiden Ansätzen.
Zitat: Unternehmen mit ausgereiftem Lead-Management und Scoring generieren 50 % mehr vertriebsbereite Leads zu 33 % niedrigeren Kosten pro Lead als Unternehmen mit Ad-hoc-Qualifizierung, so Forrester Research zur B2B Demand Generation.
Zitat: Sales-Teams, die an der Entwicklung des Scoring-Modells beteiligt waren, nutzen Lead Scores bei der täglichen Priorisierung dreimal häufiger als Teams, die ein ausschließlich von Marketing entwickeltes Modell erhalten haben, so eine SiriusDecisions-Studie zur funktionsübergreifenden Abstimmung.
Sales-Buy-in für das Modell gewinnen
Gemeinsame Verantwortung ist kein Abhaken einer Checkliste. Sie erfordert konkrete Schritte.
Schritt 1: 3–5 Sales-Reps vor dem Aufbau befragen. Fragen Sie sie: „Was ist das Erste, was Sie bei einem neuen Lead prüfen? Was bringt Sie dazu, sofort anzurufen statt nächste Woche? Was waren Ihre besten Leads in den letzten 6 Monaten, und was hatten sie gemeinsam?"
Ihre Antworten zeigen Ihnen, welche Signale in der Praxis wichtig sind. Nicht welche Signale Marketing für wichtig hält.
Schritt 2: Entwurfsgewichtungen teilen und Widersprüche einladen. Präsentieren Sie die Scoring-Logik mit den Gewichtungen. Laden Sie zur Diskussion ein. „Marketing hat Pricing-Seiten-Besuche mit 35 Punkten bewertet. Entspricht das dem, was Sie sehen? Wenn jemand die Pricing-Seite besucht, wie oft führt das zu einem echten Gespräch?"
Wo Sales widerspricht, erklären Sie entweder die Daten, die die Gewichtung stützen, oder passen Sie sie an. Beide Ergebnisse stärken das Modell. Die MQL-to-SQL-Score-Schwellenwerte müssen aus demselben Grund gemeinsam festgelegt werden – sie sind das Output des Modells, und Sales muss dem vertrauen, was diese Schwellenwerte produzieren.
Schritt 3: Gegen bekannte gute und schlechte Leads validieren. Holen Sie 20–30 Closed-Won-Deals aus den letzten 12 Monaten. Wenden Sie die Scoring-Logik auf ihre Lead-Datensätze an und prüfen Sie ihre Scores. Wenn Ihre besten Deals unter dem Modell niedrig bewertet hätten, haben Sie ein Kalibrierungsproblem. Dieselbe Übung mit Closed-Lost: Die besten verlorenen Leads sollten niedriger bewertet werden als die besten gewonnenen. Die Lead Qualification Frameworks in der Lead-Management-Sammlung bieten zusätzliche Perspektiven dazu, welche Signale tatsächlich abschlussbereite Leads von Rauschen unterscheiden.
Schritt 4: Einen Pilot laufen lassen, bevor das Modell live geht. Bewerten Sie eine Charge neuer Leads mit dem neuen Modell. Sales bewertet die 20 am höchsten bewerteten Leads und beurteilt, ob sie der Priorisierung zustimmen. Kalibrieren Sie auf Basis des Feedbacks, bevor Sie das Modell breit ausrollen.
Dieser Prozess dauert 4–6 Wochen. Das ist langsamer als ein Modell selbst zu entwickeln. Aber es ist der Unterschied zwischen einem Modell, das übernommen wird, und einem, das ignoriert wird.
Rework-Analyse: Der vierstufige Buy-in-Prozess (Reps befragen, Entwurfsgewichtungen teilen, gegen Closed-Won-Daten validieren, Pilot durchführen) dauert typischerweise 4–6 Wochen und ist die einzelne wichtigste Investition in die langfristige Akzeptanz eines Scoring-Modells. Teams, die direkt zum „Einfach launchen und später anpassen" übergehen, berichten durchgehend nach 3–6 Monaten dasselbe Ergebnis: Sales schaut nicht mehr auf die Scores und arbeitet wieder mit der eigenen Liste. Der Pilot-Schritt ist am wichtigsten – 20 echte Leads mit Sales-Review vor dem Go-live zu scoren deckt Kalibrierungsfehler auf, bevor sie das Vertrauen beschädigen.
Score-Governance: Wer ändert die Gewichtungen
Ein Scoring-Modell ohne Governance zerfällt. Jemand fügt einen Punkt für das Öffnen eines Newsletters hinzu, weil es einfach war. Marketing aktualisiert eine Produktseite, das Klickverhalten ändert sich, aber niemand aktualisiert die Scoring-Logik. Gewichtungen, die vor sechs Monaten noch stimmten, sind jetzt falsch.
Governance muss nicht bürokratisch sein. Sie muss klar sein. Das Marketing-Sales-SLA-Template ist ein guter Ort, um die Governance-Regeln zusammen mit den übergeordneten Alignment-Verpflichtungen zu dokumentieren, auf die beide Teams sich verpflichten.
| Entscheidung | Verantwortlich | Genehmigung erforderlich |
|---|---|---|
| Gewichtungen für bestehende Signale | Marketing Ops | VP Marketing-Freigabe; VP Sales informieren |
| Neue Signalkategorie hinzufügen | Marketing Ops | Freigabe beider VPs (Marketing und Sales) |
| MQL/SQL-Schwellenwerte ändern | Marketing Ops | Freigabe beider VPs; Änderung im SLA dokumentieren |
| Disqualifikator-Änderungen | Marketing Ops | Freigabe beider VPs |
| Notfallkorrektur (Modell klar defekt) | Marketing Ops | Mündliche Freigabe beider VPs; formelle Freigabe innerhalb von 1 Woche |
Quartalsweise Review-Meeting: 45 Minuten. Conversion-Daten nach Dimensionsscore auswerten. Alle hinzugefügten oder geänderten Signale überprüfen. Bestätigen, dass das Modell noch mit aktuellen Closed-Won-Daten kalibriert ist. Beide VPs nehmen teil.
Das Modell testen und validieren
Ein gegen Closed-Won-Daten validiertes Modell ist der Mindeststandard für das Vertrauen in dasselbe.
Korrelationsanalyse: Berechnen Sie für jedes Signal im Modell die Korrelation zwischen dem Vorhandensein dieses Signals und dem späteren Abschluss als „Won". Führen Sie diese Analyse segmentweise durch (SMB vs. Mid-Market), wenn Ihr ICP variiert. Signale mit niedriger Korrelation zu Closed-Won sollten niedriger gewichtet oder entfernt werden. Signale mit hoher Korrelation sollten stärker gewichtet werden.
Diese Analyse erfordert kein Data-Science-Team. Eine Tabelle mit Closed-Won- vs. Closed-Lost-Daten und Spalten für Signalvorhandensein/-abwesenheit zeigt die benötigten Korrelationen.
Quartalsweise Neukalibrierung:
- Letzte 90 Tage der SQLs auswerten
- SQL-to-Opportunity-Conversion-Rate nach Score-Band prüfen (60–70, 70–80, 80–90, 90+)
- Wenn Conversion-Raten nicht mit Score-Bändern korrelieren, benötigt das Modell eine Neukalibrierung
- Alle im letzten Quartal hinzugefügten Signale prüfen und ihre individuelle Korrelation mit der Conversion auswerten
- Die Conversion-Rate-Analyse des Pipeline-Teams fließt direkt in diese Prüfung ein – Score-Bänder, die nicht mit dem Stage-Fortschritt korrelieren, werden dort deutlich sichtbar
Jährlicher Neuaufbau: Alle 12–18 Monate das Modell von Grund auf neu aufbauen, basierend auf den aktuellsten 12 Monaten Closed-Won-Daten. Gartner-Forschung zu Predictive Lead Scoring bestätigt, dass auf frischen Daten neu aufgebaute Modelle statisch gebliebene Modelle konsistent übertreffen – selbst kleine Verschiebungen im ICP oder Channel-Mix können 18 Monate alte Gewichtungen aktiv irreführend machen. Märkte verändern sich. Der ICP kann sich verschoben haben. Alte Modelle, die auf veralteten Daten basieren, liefern schlechtere Ergebnisse, ohne dass es jemandem auffällt, weil die Verschlechterung schrittweise erfolgt.
Das MQL-Definition-Framework und die Scoring-Schwellenwerte sollten bei jährlichen Neuaufbauten gemeinsam überprüft werden, da sie aufeinander abgestimmt sind.
Fazit
Das Scoring-Modell, das beide Teams gemeinsam entwickelt haben, ist mehr wert als das perfekte Modell, dem nur Marketing vertraut.
Das bedeutet nicht, dass Sie ein schlechtes Modell entwickeln sollten, um Akzeptanz zu erreichen. Es bedeutet, dass der Prozess der Einbeziehung von Sales in die Modellentwicklung – die Interviews, die Gewichtungsdiskussionen, die Pilot-Validierung – das Modell besser macht und gleichzeitig breiter akzeptiert.
Sales weiß, was einen Lead gut macht, in einer Weise, die Marketing aus Engagement-Daten nicht ableiten kann. Marketing weiß, was Intent-Signale generiert, in einer Weise, die Sales nicht beobachtet. Ein gemeinsam entwickeltes Modell kombiniert beides.
Gemeinsam entwickeln. Gegen echte Daten validieren. Explizit steuern. Quartalsweise neu kalibrieren.
Das Ziel ist kein Score. Es ist eine gemeinsame Sprache für die Priorisierung – eine, die beide Teams verwenden, weil beide Teams ihr vertrauen.
Häufig gestellte Fragen
Was ist Joint Lead Scoring?
Joint Lead Scoring ist ein Scoring-Modell, das gemeinsam von Marketing und Sales entwickelt wurde, bei dem beide Teams zu den Signal-Gewichtungen beigetragen haben, das Modell gegen Closed-Won-Daten validiert haben und die MQL/SQL-Schwellenwerte gemeinsam festgelegt haben. Das „Joint" ist nicht zeremoniell – es bedeutet, dass Sales Eigenverantwortung für das Ergebnis trägt, was die einzige Möglichkeit ist, dass ein Scoring-Modell den Kontakt mit einem echten Sales-Team überlebt.
Was sind die drei Dimensionen des Lead Scorings?
Die drei Dimensionen sind Fit (wer das Unternehmen und die Person sind – firmografische und rollenbasierte Signale), Intent (ob sie gerade aktiv nach einer Lösung suchen – Pricing-Besuche, Demo-Anfragen, Third-Party-Intent-Surges) und Behavior (wie engagiert sie mit Ihrem Content und Produkt sind). Jede Dimension zerfällt mit unterschiedlicher Geschwindigkeit: Fit ist nahezu statisch, Intent zerfällt innerhalb von Tagen, Behavior über 30–90 Tage.
Warum scheitern die meisten Lead-Scoring-Modelle?
Die meisten Scoring-Modelle scheitern, weil Marketing sie einseitig entwickelt hat (sodass Sales ihnen nicht vertraut oder sie nicht verwendet), sie Engagement-Signale stärker gewichten als Fit (sodass die „engagiert, kauft aber nie"-Persona zu hoch bewertet wird), sie keine Decay-Regeln haben (sodass alte Signale aktuelle Scores verfälschen) und sie nie gegen aktuelle Closed-Won-Daten neu kalibriert werden. Gemeinsame Verantwortung adressiert das erste Problem; die anderen drei erfordern bewusste Designentscheidungen.
Wie sollten Fit und Intent relativ zueinander gewichtet werden?
Das hängt von Ihrer Sales-Motion ab. Inbound-getriebene Bewegungen: Fit 50 %, Intent 35 %, Behavior 15 % – Fit ist das Unterscheidungsmerkmal, da Inbound bereits eine gewisse Intent-Vorfilterung leistet. ABM-Bewegungen: Fit 25 %, Intent 60 %, Behavior 15 % – Konten wurden bereits nach Fit vorgeprüft, sodass Intent der Auslöser ist. PLG-Bewegungen: Fit 25 %, Intent 25 %, Product Behavior 50 % – Trial-Nutzung sagt Conversion besser voraus als traditionelle Signale.
Was sind Decay-Regeln beim Lead Scoring, und warum sind sie wichtig?
Decay-Regeln reduzieren automatisch den Score eines Leads, wenn Behavior-Signale veralten. Ein Lead, der vor 14 Monaten Ihre Pricing-Seite besucht hat, befindet sich gerade nicht in einem Kaufzeitfenster – aber ohne Decay trägt dieses alte Signal noch immer zu seinem Score bei und kann ihn an die Spitze der Prioritätsliste schieben. Standard-Decay: Signale bei vollem Wert für 0–30 Tage, sinkend auf 75 % bei 31–60 Tagen, 50 % bei 61–90 Tagen, 25 % bei 91–180 Tagen und 0 % nach 180 Tagen.
Wie validieren wir, dass unser Scoring-Modell funktioniert?
Holen Sie Ihre letzten 90 Tage SQLs. Prüfen Sie die SQL-to-Opportunity-Conversion nach Score-Band (60–70, 70–80, 80–90, 90+). Wenn höhere Score-Bänder keine wesentlich höheren Conversion-Raten aufweisen, benötigt das Modell eine Neukalibrierung. Führen Sie auch die Closed-Won-vs.-Closed-Lost-Analyse durch: Ihre Top-50-gewonnenen Deals sollten deutlich höher bewertet worden sein als Ihre Top-50-verlorenen Deals. Wenn nicht, sagt das Modell die Ergebnisse nicht voraus.
Mehr erfahren

Senior Operations & Growth Strategist
On this page
- Das Scoring-Modell, das niemand verwendet
- Das Drei-Dimensionen-Modell
- Fit Scoring: Was einbezogen werden sollte
- Intent Scoring: Third-Party- und First-Party-Signale
- Behavior Scoring: Engagement-Tiefe
- Die drei Dimensionen kombinieren
- Sales-Buy-in für das Modell gewinnen
- Score-Governance: Wer ändert die Gewichtungen
- Das Modell testen und validieren
- Fazit
- Häufig gestellte Fragen
- Was ist Joint Lead Scoring?
- Was sind die drei Dimensionen des Lead Scorings?
- Warum scheitern die meisten Lead-Scoring-Modelle?
- Wie sollten Fit und Intent relativ zueinander gewichtet werden?
- Was sind Decay-Regeln beim Lead Scoring, und warum sind sie wichtig?
- Wie validieren wir, dass unser Scoring-Modell funktioniert?
- Mehr erfahren