AI-Agents-Services-Preismodelle im Vergleich (Abonnement, Outcome, Projekt)
Die vier Arten, wie Managed-AI-Agents-Services 2026 berechnen, mit realistischen Euro-Spannen, Anreiz-Trade-offs und Passungs-Muster für jedes. Vor jedem Sales-Call lesen.
AI-Agents-Services-Preise sind 2026 ein bewegliches Ziel. Vor zwei Jahren verrechnete jeder Anbieter stundenweise, weil niemand wusste, was die Arbeit ist. Heute berechnen die besseren Anbieter pauschal pro Workflow, weil sie genug ausgeliefert haben, um die Kosten zu prognostizieren. Der Übergang läuft in unterschiedlichen Geschwindigkeiten quer durch die Kategorien — Boutiquen haben gewechselt, Beratungen nicht, Freelancer variieren stark.
Das ist der Begleiter zu unserem Pillar-Guide Wie wählt man ein AI-Agents-Dienstleistungsunternehmen aus. Wir haben die Grundlagen dort behandelt; dieser Artikel geht je Preismodell tiefer in die Trade-offs und Failure-Modes.
Modell 1: Produktisiertes Abonnement (Monatspauschale pro Workflow)
Das dominante Modell für Managed-AI-Agents-Services 2026. Sie zahlen eine feste Monatsgebühr pro Workflow unabhängig vom Volumen (innerhalb eines Nutzungs-Envelope). Die Gebühr deckt Plattform, Agent-Runs, Modellkosten, Operator-Zeit, wöchentlichen Review, monatliches Tuning.
Typische Spannen (EU, 2026). Leichter Back-Office-Workflow: 2.000–3.500 €/Monat. Mittel-komplexer Umsatz- oder Operations-Workflow: 3.500–6.000 €/Monat. Anspruchsvoller Umsatz-Workflow (Outbound-Prospecting in Volumen, komplexe Content-Produktion): 5.000–8.000 €/Monat. Bundles aus 2–3 Workflows werden meist mit 10–20 % Rabatt bepreist.
Was enthalten ist. Alle Agent-Runs innerhalb einer angegebenen Obergrenze (z. B. „bis zu 5.000 Runs/Monat"; Überschreitungen zu einem veröffentlichten Satz), Modell-Inferenzkosten, Operator-Zeit, wöchentliche schriftliche Zusammenfassung, monatlicher Business Review, Wartung der Integrationen, Pflege der Eval-Suite, Zugriff auf das Observability-Portal.
Warum es gut ausgerichtet ist. Der Anreiz des Anbieters ist, den Workflow gut am Laufen zu halten, damit Sie nicht abwandern. Seine Marge kommt aus dem effizienten Betrieb (Modellkosten-Optimierung, Prompt-Tuning, Batch-Processing) — Verbesserungen, von denen auch Sie profitieren. Kostenvorhersagbarkeit für Sie ist hoch; Sie können eine einzige Zeile in den Jahresplan setzen.
Was schiefgehen kann. Volumendrift — Ihr Workflow wächst und die Nutzungsobergrenze wird gebrochen, was Überschreitungen oder eine Neuverhandlung auslöst. Scope-Drift — Sie bitten um „kleine Anpassungen", die sich zu einem Custom-Workflow akkumulieren, der nicht vom Abo gedeckt ist. Die Verteidigung ist ein sauberer Scope of Work als Anlage und eine ehrliche Neuverhandlung, wenn der Workflow sich wirklich geändert hat.
Modell 2: Projekt (Build-and-Handoff oder Build-and-Support)
Einmalige Gebühr zum Scopen, Bauen und Ausliefern eines Workflows. Manchmal gefolgt von einem kleineren monatlichen Retainer für Support.
Typische Spannen (EU, 2026). Boutique-Single-Workflow-Build: 15.000–80.000 €. Beratungs-Single-Workflow-Build: 100.000–500.000 €. Support-Retainer nach Go-live: 1.500–5.000 €/Monat (Boutique) oder 10.000–40.000 €/Monat (Beratung).
Was enthalten ist. Discovery, Design, Build, Test, Deployment, Schulung, Dokumentation, manchmal 30 Tage Post-Launch-Garantie. Nach der Garantie wechseln Sie in den Retainer oder betreiben es selbst.
Wann es passt. Der Workflow ist einmalig — eine einmalige Datenmigration, ein spezialisiertes Forschungsprojekt mit definiertem Endpunkt, eine Custom-Integration mit einem System, das der produktisierte Service des Anbieters nicht abdeckt. Sie haben ein internes Team, das den Workflow nach Übergabe betreiben kann.
Wann es nicht passt. Der Workflow ist laufende operative Arbeit. Projektpreise für laufende Arbeit schaffen den falschen Anreiz: Der Anbieter wird für Lieferung bezahlt, nicht für laufenden Betrieb. Der schnellste Weg, ein Projekt fertigzustellen, ist, etwas zu liefern, das die Abnahmekriterien besteht, und es danach nie wieder anzufassen. Ein kleiner Post-Launch-Retainer ändert dieses Kalkül kaum.
Modell 3: Outcome-basiert (Pay-for-Results)
Der Anbieter nimmt einen Anteil am inkrementellen Wert: Bounty pro qualifiziertem Lead, Prozentsatz der über einer Baseline eingezogenen Rechnungen, Gebühr pro gelöstem Support-Ticket über einem Schwellenwert.
Typische Spannen (EU, 2026). 30–200 € pro qualifiziertem Lead, 5–15 % der inkrementell eingezogenen Rechnungen, 1–5 € pro gelöstem Ticket über Baseline. Fast immer mit einer monatlichen Untergrenze von 1.500–5.000 € gepaart, damit der Anbieter Sie in schwachen Quartalen nicht abhängt.
Warum es schön klingt. Perfekte Ausrichtung in der Theorie: Der Anbieter gewinnt nur, wenn Sie gewinnen. Kein Risiko für Sie in schwachen Monaten. Der Anbieter ist angereizt, unermüdlich zu optimieren.
Warum es in der Praxis bricht. Attributionsstreitigkeiten sind ständig. „War das der Lead des Agents oder des Formulars?" „Wurde diese Rechnung wegen der Mahnsequenz oder weil der Kunde sowieso gezahlt hätte beglichen?" Die Baseline verschiebt sich mit Ihrem Geschäft, und der Anbieter will sie fest, während Sie sie schwebend wollen. Der Anbieter pickt sich einfache Kunden und Sie werden der schwierigere. Bis Monat neun verhandeln Sie jedes Quartal neu, und die Beziehung ist überwiegend Meta-Gespräch über den Vertrag.
Wann es trotzdem passt. Ein eng instrumentierter Funnel ohne andere Touchpoints (selten). Ein Inkasso-Workflow, in dem die Baseline echt messbar ist (plausibler). Ein spezialisierter Content-Workflow, bei dem Output die Wert-Einheit und Quantität die einzige Dimension ist. In allen anderen Fällen als Falle behandeln.
Modell 4: Hybrid (Abonnement plus kleine variable Komponente)
Feste Grundpauschale plus kleiner Performance-Kicker, gebunden an ein messbares Ergebnis. Wird zum dominanten Modell bei den besseren Boutiquen, weil es das Beste vom Abonnement (Vorhersehbarkeit, Ausrichtung) liefert, ohne das Schlechteste von Outcome (Attributionskriege).
Typische Struktur. 3.000–5.000 €/Monat Basis. Plus 30 € pro qualifizierter Opportunity über einer Baseline von 30/Monat. Oder 500 € Bonus pro Quartal für das Erreichen eines einzigen KPI (z. B. DSO-Reduktion). Variable Komponente bei 20–30 % der Basis gedeckelt, damit Attributionsstreitigkeiten nicht das ganze Gespräch dominieren.
Warum es funktioniert. Die Basis deckt die Kosten des Anbieters und gibt Ihnen Vorhersehbarkeit. Die Variable signalisiert dem Anbieter, was Ihnen wichtig ist, und gibt ihm Upside für die Lieferung. Der Variable-Cap hält das Gespräch gesund, wenn die Metrik sich aus Gründen bewegt, die keine Partei kontrolliert.
Worauf zu achten ist. Die Variable-Metrik sollte eine Zahl sein, nicht drei. Die Baseline sollte vorab vereinbart und jährlich zurückgesetzt werden, nicht jedes Quartal neu verhandelt. Die Attributionsregel für die Variable sollte einfach genug sein, in einem Satz erklärt zu werden — „jede in HubSpot erstellte Opportunity mit ai-agent im Quellfeld" — sonst ist die Streitkurve unvermeidlich.
Versteckte Kosten, die jedem Angebot zuzurechnen sind
Unabhängig vom Preismodell ist die veröffentlichte Zahl selten der All-in-Kosten. Planen Sie diese ein.
Zeit Ihres internen Owners. 2–6 Stunden pro Woche. Bei voll belasteten 80 €/Stunde sind das 1.000–2.000 €/Monat an Opportunitätskosten.
Einmalige Integrationsarbeit. 3.000–15.000 € in Jahr eins für die Konnektoren, die Ihr Stack nicht out-of-the-box hat. Manche Anbieter absorbieren das; viele nicht.
Modell-API-Überschreitungen. Wenn das Abo eine Nutzungsobergrenze hat und Sie sie überschreiten, können Überschreitungen in einem starken Monat 30–50 % der Grundgebühr ausmachen. Klären Sie Obergrenze und Überschreitungssatz vorab.
Migrationskosten beim Austritt. Wenn Ihr Workflow portabel ist, nahe null. Falls nicht, 6–10 Wochen interner Zeit plus Onboarding-Gebühr eines neuen Anbieters.
Was zu ignorieren ist
Zwei Preisstrukturen tauchen auf, die Sie als Warnsignale, nicht als ernsthafte Angebote behandeln sollten.
„Pro Seat"-Preise für Managed Services. Ein AI-Agent ist kein Seat. Aus SaaS importierte Per-Seat-Preise sind entweder faul oder eine Methode, Kosten mit Wachstum aufzublasen.
„Pro Token" oder „pro API-Call"-Durchreichung mit Aufschlag. Wenn der Anbieter Ihnen Cost-plus auf Modellnutzung mit Multiplikator berechnet, zahlen Sie seine Marge auf eine Ware, deren Preis jedes Quartal sinkt. Eine Pauschale absorbiert diese Volatilität und ist besser ausgerichtet.
Wie sich Preise in den letzten 18 Monaten bewegt haben
Zwei Trends, die als Käufer wissenswert sind. Erstens sind Modell-Inferenzkosten seit Anfang 2024 für gleichwertige Qualität um 40–70 % gefallen. Anbieter, die ihre Pauschalen seit 12+ Monaten nicht angepasst haben, stecken entweder die Differenz ein oder fahren auf dünneren Margen, als sie sollten. Fragen Sie jeden Anbieter, welches Modell und welche Inferenzkosten hinter seiner Monatsgebühr stecken — die Antwort verrät, ob er eine echte Plattform betreibt oder eine Modell-API teuer weiterverkauft.
Zweitens hat sich produktisierte Abonnement-Preisgestaltung zu einer engeren Spanne komprimiert, während die Kategorie gereift ist. Ein Workflow, der 2024 bei einer Boutique 8.000–12.000 €/Monat kostete, liegt 2026 für das gleiche Ergebnis näher an 4.000–7.000 €. Anbieter, die noch die älteren Zahlen verlangen, sollten dies mit Plattformfeatures oder Domänentiefe rechtfertigen — manchmal können sie es, oft nicht.
Wie man Angebote äpfel-zu-äpfel vergleicht
Normalisieren Sie jedes Angebot auf jährliche All-in-Kosten für einen einzelnen Workflow bei erwartetem Volumen. Inklusive aller Posten: Abo, anteilig amortisierte Projektgebühr über 12 Monate, erwartete Variable, Integrationsarbeit, Sub-Auftragsverarbeiter-Durchreichungen, Zeit Ihres internen Owners.
Dann teilen Sie durch eine Einheit, die zum Workflow passt: pro qualifiziertem Lead, pro verarbeiteter Rechnung, pro gelöstem Ticket, pro veröffentlichtem Artikel. Der Kosten-pro-Einheit-Vergleich ist viel ehrlicher als die monatliche Schlagzeile und verengt das Feld meist schnell.
Für den tieferen Rahmen zu Preisen und ROI siehe Managed AI agents pricing guide und AI agents ROI calculation.
Wo Logitelia hineinpasst
Logitelia berechnet pauschal pro Workflow ohne Per-Seat-Steuer, ohne Per-Token-Aufschlag, mit einem klaren Überschreitungssatz, wenn Volumina die Obergrenze überschreiten. Für komplexe Engagements bieten wir eine hybride Struktur mit kleiner KPI-gebundener Variable, gedeckelt bei 25 % der Basis. Wenn Sie ein Logitelia-Angebot mit anderen Optionen vergleichen wollen, buchen Sie einen Intro-Call — wir teilen die Posten und die Kosten-pro-Einheit-Mathematik.
Für den breiteren Rahmen lesen Sie die Säule Wie wählt man 2026 ein AI-Agents-Dienstleistungsunternehmen aus. Für die Lieferseite des Gesprächs siehe Was liefert ein AI-Agents-Dienstleistungsunternehmen wirklich?.
Vergleichen Sie Angebote von AI-Agents-Services-Anbietern? Wir teilen annotierte Posten in einem 30-minütigen Call, damit Sie Äpfel mit Äpfeln vergleichen.
Book intro call