Effektive Agenten bauen: KI-Agenten sind in aller Munde ... schließlich sind sie auch ein Thema für uns hier, die wir vielleicht sogar schon an unserer Frontier-Firma oder am AI-first-Unternehmen werkeln.

Und dabei sind KI-Agenten für viele Aufgaben tatsächlich nicht die ideale Besetzung. In diesem Beitrag betrachten wir drei Kernideen aus „How We Build Effective Agents“ (von Eric & Barry, Anthropic) und vertiefen sie mit praktischen Leitgedanken und der Frage: “Agent oder Workflow?”

  1. Baue nicht für alles Agenten.

  2. Halte es radikal einfach.

  3. Denke wie dein Agent.

Agents fühlen sich wie Magie an, wenn sie richtig implementiert sind. Plötzlich lassen sich komplexe Aufgaben dauerhaft und automatisch bewältigen. Früher (im Sinne von vor Monaten) waren bereits Zusammenfassungen und Klassifizierungen beeindruckend.

Heutzutage sind diese Nutzungsmöglichkeiten für jeden zugänglich und eher die Basis, von der aus wir arbeiten. Schnell wurden Workflows gestaltet, die verschiedene KI-Chat-Anfragen zusammengebracht haben, um ein bestimmtes Ergebnis zu erreichen.

Kurz für Einsteiger:innen: KI-Agenten sind Programme, die ein Sprachmodell mit Werkzeugen (z. B. Suche, E-Mail, Browser) verbinden und dadurch Arbeitsschritte selbst planen und ausführen. Das ist hilfreich bei offenen, verzweigten Aufgaben (recherchieren, navigieren, Entscheidungen mit Feedback) - weniger sinnvoll bei einfachen, klar definierten Routinen.

Jetzt sind wir bei domänenspezifischen Agenten angekommen. Das bedeutet: Sie entscheiden ihre Richtung selbst und agieren mit Umgebungsfeedback. Trend: Mehr Agency = mehr Nutzen, aber auch höhere Kosten, Latenz und Fehleranfälligkeit.

How We Build Effective Agents: Barry Zhang, Anthropic; Bild von https://www.ai.engineer/

Baue nicht für alles Agenten. Agenten sind ein Skalierungsvehikel für komplexe, wertvolle Aufgaben - keine Drag & Drop Lösung für jeden Prozess.

Checkliste: Wann lohnt sich ein Agent?

  • Aufgabenkomplexität: Agenten glänzen bei großen Problemen, wenn sich der gesamte Entscheidungsbaum sauber modellieren lässt.

  • Wert der Aufgabe: Es wird schnell teuer, wenn ein Agent hunderte Male tausende von Token benötigt um einfache Aufgaben abzuarbeiten. Der Business-Wert muss das tragen. Achte genau auf den Verbrauch und filter ggf. nach häufgen Einsatzzwecken.

  • Kosten von Fehlern: Wie dramatisch und ggf. kostspielig wird es, wenn Fehler passieren und wann werden diese erkannt? Hier lohnt es sich, früh daran zu denken, Menschen in der Schleife zu bewahren oder andere Schutzmaßnahmen zu ergreifen. Vielleicht ist aber auch der genau definierte Workflow stabiler und weniger fehleranfällig als ein frei arbeitender Agent.

Denke wie dein Agent: Modelle wirken schlau, handeln aber Schritt für Schritt und nur auf Basis eines begrenzten Kontextfensters.

Perspektivwechsel: Eine Minute im Leben eines Agenten

Stell dir vor, du bist kein Mensch am Rechner, sondern ein KI-Agent. Einer der teuren, neuen, smarten. Dein Arbeitstag beginnt nicht mit einem Desktop voller Fenster, sondern mit einem einzigen, stummen Bild: ein Screenshot. Keine Bewegung, kein Cursor, nur ein eingefrorener Moment. Dazu ein knapper Satz, der dir sagt, was zu tun ist. Nicht mehr als ein Post-it am Bildschirmrand.

Du entscheidest dich für eine Handlung. Ein Klick. Wie verrückt, dass du inzwischen selbst klicken darfst. In dem Moment gehst du sprichwörtlich „mit geschlossenen Augen“ weiter. Drei, vier, fünf Sekunden lang ist die Welt schwarz. Du weißt nicht, ob du das Richtige getroffen hast, ob ein Menü aufklappt oder ob du versehentlich das Fenster geschlossen hast. Dann öffnet sich die Welt wieder. Neuer Screenshot. Manchmal hat es geklappt. Manchmal nicht. Manchmal hast du etwas ausgelöst, das du nicht geplant hattest.

So geht es weiter: sehen, handeln, warten, hoffen. Jeder Schritt ist ein kleines Wagnis, jedes Bild ein neuer Anfang. Mit jedem Zyklus lernst du ein bisschen mehr über diese Oberfläche. Doch ohne Maßstab, ohne Linien, ohne klare Anleitung tappst du leicht in Sackgassen. Es ist nicht böser Wille, wenn du dich verläufst, es ist die Natur deiner Wahrnehmung.

In dieser Welt sind Kleinigkeiten groß: Ein Hinweis auf die Bildschirmgröße ist plötzlich Gold wert, weil du dann weißt, wohin ein Klick führt. Ein kurzer Leitfaden, was hier erlaubt ist und was nicht, spart dir endlose Umwege. Und eine klare Beschreibung deiner Werkzeuge ist wie Licht im Flur: Du erkennst, welcher Schlüssel in welches Schloss passt und wofür er besser nicht gedacht ist.

Wenn du stolperst, hilft dir kein Bauchgefühl, sondern Klarheit. Eine Aufgabe, die eindeutig formuliert ist. Ein Werkzeug, dessen Parameter verständlich sind. Ein zurückverfolgbarer Weg, warum du dich für A und nicht für B entschieden hast. All das macht aus blindem Probieren ein gezieltes Vorgehen.

Fazit: Weniger Rätsel, mehr Klarheit, so werden Agenten nützlich 😋 Ohne richtig gutes Onboarding wirfst du Geld zum Fenster raus.

  • Der Mensch schreibt die Regeln der Welt, in der der Agent arbeitet. Ein Agent scheitert eher selten am „Denken“, sondern meist am fehlenden Kontext. Deshalb gilt: Investiere in das, was der Agent sieht und versteht, bevor du erwartest, was er leisten soll.

  • Präziser Input schlägt smarte Tricks. Maße, Parameter, sinnvolle Startpunkte, klare Ziele, erlaubte und unerlaubte Aktionen; all das ist kein Beiwerk, sondern die Grundlage. Je eindeutiger der Rahmen, desto seltener verheddert sich der Agent in unnötiger Exploration. Gilt für Text, Browsersteuerung, Bildgenerierung, etc etc.

  • Werkzeuge brauchen Sprache, nicht Magie. Beschreibe Tools so, dass sie einsehbar sind: Was können sie, welche Parameter, welche Beispiele? Ein gutes Tooling ist die halbe Entscheidung und verhindert die andere Hälfte der Fehler.

  • Tipp: Qualität entsteht im Dialog. Lass deine eigenen Anweisungen gegenlesen vom Modell. Wo ist die Aufgabe mehrdeutig? Welche Information fehlt? Bitte den Agenten, seinen Weg zu erklären: „Warum hast du hier so entschieden? Was hättest du gebraucht?“ Aus dieser Rückkopplung werden Anleitungen, die tragen. Verbessere die Prompts kontinuierlich.

  • Denke in Budgets, nicht nur in Möglichkeiten. Freiheit kostet: Zeit, Tokens, Nerven. Je unklarer der Pfad, desto teurer die Suche. Setze Grenzen (Zeit/Geld/Klicks) und mache sie sichtbar. Ein Agent, der sein Budget kennt, handelt gezielter und ist produktionsreif.

  • Zusammenarbeit kommt danach. Mehrere Agenten können sich Aufgaben teilen und parallel arbeiten – aber nur, wenn jeder seinen Auftrag versteht und weiß, wie er mit den anderen spricht. Das ist der nächste Schritt, nicht der erste.

  • Die drei Regeln, die bleiben: Baue nicht für alles Agenten, wähle Fälle mit echter Komplexität und erkennbarem Wert. Halte die Architektur schlank, Umgebung, Tools, Ziel, dann erst Optimierung. Denke wie dein Agent, reduziere die Welt auf sein Kontextfenster und schließe die Lücken im Input, nicht im Output.

Am Ende ist es eher einfach: Agenten sind keine Zauberer. Sie sind fleißige Kolleg:innen, die in einer von uns definierten, kleinen Welt arbeiten. Je weniger diese Welt ein Rätsel ist, desto verlässlicher liefern sie Ergebnisse. Unsere Aufgabe ist nicht, ihnen ständig mehr Fähigkeiten anzudichten, sondern ihnen den Weg freizuräumen: klare Sicht, klare Werkzeuge, klare Grenzen. Dann wird aus „vielleicht“ ein „ja“, und aus einer Aneinanderreihung von Texten und Screenshots ein verlässlicher Prozess.

Keep Reading

No posts found