#5 Der große AI-Agent Deep Dive

Transkript anzeigen

00:00:00: Hallo und herzlich willkommen zu einer weiteren Folge von AI-Brainstorming. Hier bekommst du Wissen, das du morgen schon umsetzen kannst. Du erfährst auf welche Trends du aufspringen solltest und welche du besser liegen lässt. Dazu gibt es Anwendungsbeispiele, die nicht nur auf dem Papier funktionieren. Und selbstverständlich kommt alles aus erster Hand. Expertenwissen direkt aus der Praxis. Lass uns also loslegen. Hallo Philipp. Jetzt hat es eine Zeit gedauert, dass wir wieder Zeit gefunden haben, shame on us, aber wir haben einiges über Weihnachten weitergebracht, einiges bei Brainy weitergebracht, einige Haben sie finalisiert darum heute auch mal vielleicht ein kurzes Review, was so die letzten Wochen und Monate bei uns los war. Sehr viel passiert. Definitiv.

was haben wir gemacht? Der Brainy kann: mittlerweile Agents Wir haben Agent-Demos schon drei Stück gehabt, die alle restlos ausverkauft wurden. haben viele Kooperationen aufgegriffen Präsentationen entsprechend, dass man auch diese Agent-Thematik Kunden, Interessenten und bei diversen Vorträgen Runden was Investoren betrifft Die hat aber zum Glück nicht gefällt, in der Nacht und an Wochenenden weiterzutun. Und eigentlich die ganze Mannschaft hat. War eine total coole spannende Zeit. Und ich glaube, gerade mit dem Thema Agenten ist ja jetzt wirklich in aller Munde... muss wirklich sagen, war jetzt auch immer bei den Agentendemonstrationen dabei und bin ja sehr tief in der Bubble und es ist total faszinierend wie geflasht man eigentlich immer wieder selbst ist, wenn man sieht, was da möglich ist oder was die können.

Also es ist meines Erachtens total absurd. Ja, absolut und ich habe es sehr: oft in den letzten Wochen und Monaten auch gesagt, sind jetzt wirklich bei dem Punkt, wo jetzt KI nicht irgendwie ein Tool ist, sondern tatsächlich eine Technologie von unseren Zuhörern werden das auch kennen, aber ich gebe euch einfach immer das Beispiel mit dem Internet. Ihr werdet heute nicht gefragt, ob ihr Internet habt und wahrscheinlich stellt sich ja keiner mehr die Frage, was er denn mit diesem ominösen Internet tut. Es ist... Einfach Infrastruktur und jeder nutzt es jeder nutzt es auch auf seine Art und Weise. Und der Sprung jetzt von einem KI-Assistenten zu einem AI-Agent Manifestiert dieses Bild einfach noch einmal. gefällt der Infrastrukturvergleich total. Man wird einen Wettbewerbsnachteil haben, wenn man zukünftig nicht auf diese Technologie setzt. Man muss das machen. Das ist genauso, wenn du heute ein Unternehmen hast und Internet, Smartphone etc. Dann wirst du auch keine Kunden oder keine Aufträge haben.

Genau. Und es geht wahrscheinlich im ersten Schritt nicht darum, da jetzt möglichst viele Use Cases heraus: zu kristallisieren wie ich es denn in meinen alten Abläufen denn so habe, sondern es geht einfach darum, dass man die Technologie einsetzt, nutzt, natürlich, auch wir immer sagen, sicher nutzt Aber was haben wir heute am Programm? Wir werden am Anfang ein paar Begrifflichkeiten erklären. Das heißt, welche Wordings oder um es böse zu sagen, welche Passwords in Zukunft bzw. schwirren jetzt schon herum, dass man die einfach ein bisschen einordnen kann, wir werden ein den letzten Demos haben, kurz ansprechen. Wir werden uns über die Entwicklung der Technologie unterhalten und vielleicht auch ganz spannend am Schluss, wir werden uns über das Thema Kosteneinschätzung für solche Agents unterhalten, Weil es auch ein wichtiges Thema ist, mit dem man sich beschäftigen muss.

Wir erleben es selbst, was wir KI-Kosten intern für die Entwicklung haben. Und Hannes wir haben uns die letzten Wochen darüber: unterhalten und haben gesagt, würde es das doppelte kosten, würden wir es auch zahlen. Ja, definitiv Also die Zeitersparnis ist immens. ist echt selten dass man gerne Rechnungen zahlt muss ich ganz ehrlich sagen. Weil... Man einfach so viel Mehrwert hat, das ist unfassbar und ich so eigentlich noch nie erlebt oder selten erlebt, dass man mit einer Technologie oder mit einem Produkt so happy ist, dass man sagt, okay, das ist jeden Cent wert. Also zumindest bei uns in der Firma, wir haben hohe Budgets bei uns darf ein Mitarbeiter über 1.000 Euro an KI-Kosten im Monat verbrauchen und das ist es hundertprozentig wert.

Ja, also der Output steigt massiv, wir sehen das auch an den Entwicklungsschritten. Da sind Themen dabei, da hätten wir wahrscheinlich vor einem Jahr, ein Monat gebraucht und jetzt geht es halt in ein, zwei Wochen und Und diese zwei Wochen sind eigentlich auch nur, weil diese Code-Reviews entsprechend und exakt und im Vier-Augen-Prinzip durchgeführt werden, damit man halt den so sehr wichtigen: Sicherheitsstandards entspricht. Ja, ist nach wie vor das oberste Gut. Und wenn wir dann auch zu den Agenten kommen, gibt es da schon ein paar Themen, auf die man einfach aufpassen muss. Das kann schnell zum Sicherheitsalbtraum werden, wenn man dann nicht klare Struktur gibt und das Ding auch führt. Wenn man das aber im Kopf hat, wie gesagt, die Arbeitsersparnis ist immens. Ja, da vielleicht auch ein Thema, das uns jetzt letzte Woche alle beschäftigt hat. hat es ja im Standard und in der ZIP 2 gesehen, das Thema Claw. Wo ich eigentlich Schad gefunden habe, dass nur nach diesem könnte denn alles passieren gefragt wurde und nicht eigentlich was ist denn alles möglich. Freilich muss man sich die Sicherheitsfrage stellen und die steht bei uns auch ganz oben. Aber grundsätzlich geht es einmal darum diese Technologie auch so auszurollen in einer sicheren Umgebung dass man tatsächlich den Mehrwert merkt.

Weil das wissen: wir ja von unseren Kunden, die dann sagen, ja, jetzt muss ich mir aber das wieder rauskopieren in ein Word oder wieder rauskopieren in eine Excel. Das sind Themen, die laufen jetzt selbst. Ja, also ich sage es immer wieder so, man kann sich das vorstellen, ein Agent, das ist das wirklich auf den Computer Zugriff hat und wirklich selbstständig Aufgaben erfüllen kann. Und wirklich jegliche Art von repetitiven Aufgaben kann ein Agent übernehmen. sind wir vielleicht eh schon bei der Begrifflichkeitserklärung, ich fange einmal mit dem einfachsten an, die schwierigen Sachen, das darfst du dann machen, der erste vom Assistenten zum Agent, also der Assistent war im Endeffekt ein reaktives System, ich habe eine Frage gestellt, habe eine Antwort bekommen.

Ist ein proaktives System, heißt, der kriegt ein übergeordnetes Ziel und versucht dann dieses Ziel mit eigenem Hinterfragen, eigenem Überlegen, mit Plugins, und wie auch immer, und Commands dann: auch Durchzuführen und zu diesem Ziel zu kommen. Und ich habe jetzt natürlich absichtlich diese Passwörter in diesen einen Satz gepackt weil die werden wir jetzt im Detail beleuchten. Genau, also vielleicht noch kurz Wir sehen, dass das Thema doch viele Leute noch schwierig ergreifbar ist, weil man da ein paar und Kanten einfach kennen muss, um gute Agenten zu schreiben. Und da haben wir gedacht, das ist vielleicht eine kleine Special-Folge auch, Dass wir mal wirklich so ein bisschen in die Tiefe gehen und das ein entmystifizieren. Also wie funktioniert ein Agent, was sind so die Eckpfeiler, wie stellt sich der zusammen etc. Es ist wie bei unserer letzten Folge angeteasert so der Agent-Deep-Dive und sich heute sehr gut an, weil wir am heutigen Tage mehrere Stunden damit verbracht haben, auch selbst Agents zu schreiben und Use Cases herauszuarbeiten.

für auch ein Wochenende gewählt, wir wirklich in Ruhe über: diese Themen nachdenken. Hannes, ich würde gerne anfangen gibt für jeden Agent ein AgentMD-File. Genau. Das ist, glaube ich das Einfachste auch zum Verstehen. Ich möchte kurz das erklären. MD, was ist MD? MD steht für Markdown. ist quasi die Ausgabe wie die KI Text formatiert. Also eine KI gibt ja quasi nur Text zurück. Und man sieht ja in diesen Chatbots, dass die dann alle schön formatiert sind, mit Smilies, mit Auflistungen etc. Und Markdown ist quasi einfach das Format um... Formatierten Text zu beschreiben meisten Agenten haben quasi Im Root-Verzeichnis ein sogenanntes agents.md-File, wo der System-Prompt hinterlegt ist. Darf mir das ein bisschen so vorstellen wie in der Assistentenzeit dieser Prompt oder diese Anweisung in Brainy? Genau, also das ist genau das.

Die: System-Instruction ist quasi dieses agents.md-File. Das wird quasi bei jeder Nachricht die man an einen Agenten gibt, wird dieses File in den Kontext geladen. gibt man dann die Themen, die man jetzt nicht immer dann in den Prompt geben möchte. Also das ist wirklich, wie gesagt, die System Instruction und wird es nämlich spannend. Denn wenn man jetzt in das Zeitalter der Assistenten zurückdenkt und quasi die System Instruction beschreibt, jetzt dieses Agents File ist, dann Wissen wir ja, dass je größer der Kontext ist, desto schlechter wird die KMU. Man sollte ja wirklich schon, dass jede Aufgabe wirklich nur einen speziellen Kontext hat. kommen wir jetzt dann zu die weiteren Drehregler die man hat, um quasi performante, gute Agenten zu bauen, man möchte ja quasi den Kontext immer klein halten und dieses Diese System Instruction oder dieses Agents File nicht überfüllen mit allen Tätigkeiten, die der Agent eventuell machen könnte.

Denn wenn ich jetzt nach A: frage, dann möchte ich nicht den Kontext von B haben und umgekehrt Ich möchte immer spezifisch für meine Aufgabe das Notwendigste in dem Kontext haben, um die Aufgabe zu erfüllen. Damit der Agent gut funktioniert, habe ich dieses Agent-MD-File mit der System Instruction quasi und habe jetzt mit einer weiteren Agent-Funktionalität die Möglichkeit, dass ich dann unterschiedliche Use Cases herausbriche und das sind die Skills.

Zum Beispiel, ja genau. Ich würde aber sagen, bevor wir in die Skills reingehen würde ich noch ganz kurz die Commands erklären. Das ist auch eine Funktionalität, die ist glaube ich, für die meisten greifbar. Und zwar, kann man sich vorstellen, das ist eine Prompt-Bibliothek. Also man kann dann mit einem, besser bei vielen Agenten mit einem Slash, Dann einen prompt vordefinierten prompt quasi laden das heißt du hast dann einen sehr coolen stand up von dir ja quasi deinen kalender und alles mögliche zusammen fasst und stattdessen dass du das jetzt jedes mal den: prompt gibst hey laden bitte alle meine kalender einträge schau bitte was ziemlich meine kainius sie meine kainius wie Welche Termine habe ich, welche Vorzeit muss ich rechnen und so weiter und so fort. Stattdessen dass du das jedes Mal in dem Prompt ausformulierst schreibst du einfach nur slash daily enter und dann ist dieser Prompt hinterlegt und das ist immer dasselbe. Das Coole ist, dass ich diesen Command eigentlich mit dem Agent erstellen kann. Das heißt, ich kann sagen, mache mir diese Daily Routine, ziehe mir meine KI-News, schaue nach, welche Termine ich habe, schaue meinen Kalender nach, trage mir irgendwelche Abfahrtszeiten in den Kalender ein, lade nächsten Mittwoch bei dem Kalender-Termin noch Inhannis dazu ein, weil da fahren wir gemeinsam wohin Und dann könnte ich sagen, und das merkst du jetzt bitte als Command Daily.

Genau, das ist ja die große Magic an den Agenten Und da muss ich ganz ehrlich sagen, es hat bei mir auch eine Zeit gedauert bis ich das in meinen Kopf reingebracht habe. Ich kämpfe jetzt noch.: Unser altes Arbeiten ist ja quasi so, dass man dann der Fallen Artefakte der Fallen Pfeils raus und dann ist man in seinem Kopf, okay, dann muss ich dieses Pfeil aufmachen, muss den Content lesen und schreibt dann manuell rein. Aber der Agent ist ja dafür da, dass er auch sich selbst schreiben kann. Das heißt, ich muss eigentlich nur diese Passwörter, diese Eckpfeiler wissen und kann mir dann nur mit natureller Sprache mit dem Agenten mir meinen Agenten bauen. Und das ist... Für mich die große Magie. Das ist quasi die Sprachfernbedienung für alle Dinge, die mir halt so einfallen halt alle Skills und Modalitäten die halt ein Agent für mich erledigen kann. Genau. Und jetzt habe ich das Wort schon wieder gesagt. Genau Was ist ein Skill? Skill ist jetzt ganz spannend. Wie ich vorher gesagt habe, man sollte nicht alles in das Agents-File beziehungsweise in die System Instruction reingeben.

Man sollte immer den Kontext gezielt haben. Und jetzt gibt es da eine tolle Implementierung, das nennt sich Skills. Und ein Skill ist: quasi ein eine dynamische Kontext-Erweiterung eigentlich, sehr schön gesagt, eine dynamische Kontext-Erweiterung. Ein Skill besteht aus einer Kurzbeschreibung. Was macht der Skill? Für was ist er gut? Und dann, wenn man der KI, zum Beispiel wir haben heute einen Skill gebaut für eine Prozessanalyse, Und in diesem Skill steht sehr detailliert wie eine aussieht, wie man die behandeln muss, was man beachten muss, etc Welche unterschiedlichen Fragen aufgrund unterschiedlicher Branchen gestellt werden müssen und so weiter und so fort.

Und wenn man das jetzt natürlich jedes Mal in den Kontext laden müsste und dann fragt quasi aber nur, hey, was sind meine Termine morgen, das Fragen die man eigentlich nicht benötigt und die KI könnte auch leichter halluzinieren und deswegen hat man einen Skill und in diesem Skill gibt es eine Beschreibung und da steht drin, wenn der User nach einer Prozessanalyse fragt lade diesen Skill und die KI versteht das dann: und wenn dann wirklich nach einer Prozessanalyse gefragt wird, wird dieser Skill dynamisch in den Kontext geladen und wir haben dann wieder die Optimierung des Kontextes Dass wirklich nur das im Kontext steht, was für meine aktive Aufgabe benötigt wird. Ich habe das auch viel interessant gefunden, weil diese Prozessanalyse ja naturgemäß sehr, sehr lange ist. diesem Prozessanalyse-Skill steht drinnen, sobald der Agent merkt, dass... User quasi ungeduldig wird oder sagt, er hat jetzt keine Zeit mehr und so weiter, würde er quasi so eine Breakout-Session starten wo er halt sagt, die zwei Fragen brauche ich noch ganz dringend und dann wäre quasi eine rudimentäre Prozessanalyse fertig, gibt mit, dass man dann noch einen Deep Dive in diesen und jenen Bereichen braucht, Wir haben das dann auch so weit vorangetrieben, dass man dann zum Beispiel von dieser Prozessanalyse gleich eine E-Mail kriegt mit dem Inhalt drinnen, beziehungsweise auch ein Word-Datei abgelegt wird von dieser Prozessanalyse.

Und diese ganzen Schritte wie du zuerst richtig gesagt hast,: bräuchte der Agent nicht durchlaufen, Wie wird das Wetter morgen? Und das würde er tun, würde diese Anweisung in diesem Agent-MD-File drinnen stehen und nicht extra in einem Skill ausgekoppelt sein. Genau. waren glaube ich dann die Subagents oder? Genau, Subagents ist ähnlich, hat aber einen wichtigen Unterschied. Subagents sind quasi, wie es der Name schon sagt, Subagenten die der Agent ausführen kann. Und das funktioniert so, wir eine Aufgabe haben und diese Aufgabe übergibt der Agent an einen weiteren Agenten um, Zwei Vorteile sich zu holen.

Das ist Vorteil 1, eventuelle Parallelisierung. Das heißt, man könnte zum Beispiel sagen, A durchsucht einen Folder Subagent B durchsucht den Folder B und so weiter. Und der Subagent C schaut live im Internet nach irgendwelchen aktuellen Informationen? Dann drei Agenten parallel: und wenn diese dann fertig sind, geben die quasi die Antwort wieder an den Master Agent, der konsolidiert die Antworten und gibt dann ein raus. Voll interessant bei dem Thema, weil man ja dann auch immer sagt, KI halluziniert, vielleicht ab und zu fehlerhafte Informationen aus. Für genau so einen Anwendungsfall würde ich mir einen Subagent machen und zwar der eine Beantwortet mir Fragen, ob da jetzt auf irgendwelche Dateisysteme irgendwelche oder SQL-Datenbanken Zugriff hat, sei dahingestellt und ich habe zeitgleich quasi einen Control-Agent, der halt mit einem anderen KI-Modell erläuft der würde sich dieselben Informationen holen und nur wenn die beiden Informationen ident sind, würde Die Informationsübergabe an den Hauptagent erfolgen.

Genau. Und das ist cooles Szenario, wo man eine der größten Ängste beim Arbeiten mit KI eigentlich mit diesen Subagents auch: aushebelt, weil man dann immer sagt, okay, es ist immer ganz unterschiedlich wie die Antworten sind, es wird irgendwo was nicht richtig gerechnet und was übersehen, wie auch immer. Und das kann man halt mit dem vorbeugen. Der zweite große Vorteil den Sub-Agents ist die Sub-Agents einen eigenen Kontext haben. Ansonsten wenn man jetzt wieder bei den Skills das vergleichen würde, dann wird das immer jede Antwort, Routine, jede Turn vom Agenten wäre quasi im eigenen Kontext.

Und so könnte man quasi Aufgaben definieren. Diese Sub-Agents haben dann einen eigenen Kontext und geben wirklich nur das Ergebnis zurück, aber nicht... Unter Anführungszeichen den rechten Weg. heißt, dieses agent.md-File gilt für den Master-Agent sozusagen. Skills gelten auch für den Master-Agent und die Sub-Agents haben quasi einen eigenen Prompt? Genau, die Subagents sind auch wieder definiert in einem anderen File. Und Content von diesem: File ist dann die System Instruction für diesen Subagent. Okay. heißt, Subagents beim... Gleichzeitigen Abfeuern von Fragen, beziehungsweise Hauptagent baut sich halt so seine Mitarbeiter in Form dieses Subagents, beaufschlagt jeden mit einem gewissen Ziel und wenn die fertig sind, liefern sie an einen Masteragent Und da vielleicht noch eine kurze Anekdote, die bekannten chinesischen Modelle die werden ja auch immer besser, haben eine viel kleinere Anzahl an Parametern, können aber mittlerweile...

Foundation-Modellen von den ganz großen Anbietern sehr gut mithalten und die haben oft eine Technologie, die nennen sie Agent Swarm und da ist quasi immer derselbe oder ein ähnlicher Prompt aber immer mit einem anderen Hut. Also dass halt wirklich Aufgabe auf zig verschiedenen Arten gemacht wird und ganz zum Schluss Konsultiert man dies zu einer perfekten Antwort zusammen?: Okay, das heißt, der baut sich quasi nur zwei, drei im herkömmlichen Sinn, zwei, drei Agents die halt Unterarbeiten für ihn machen, sondern der eine Agent hat halt den Hut drauf des HR-Spezialisten, der andere hat den Hut auf eines Controllers und so weiter und so fort. Und egal welche Aufgabe man gibt, es arbeiten dann immer alle sage jetzt trotzdem Abteilungen, ihrer speziellen Expertise daran, optimalen Output für die Frage oder für das Ziel zu finden. Man betrachtet das Problem auf ganz viele verschiedene Ansichten Und das ergibt dann in der Regel sehr gute Ergebnisse. Muss man aber auch aufpassen, denn man kann es vielleicht schon zwischen den Zeilen rauslesen, sehr viele Parallele erkennt man, bedeutet im Regelfall auch sehr hohe Tokenverbräuche und hohe Kosten.

Also das sollte man schon gezielt einsetzen und nicht immer quasi mit einer ein E-Mail beantworten Macht durchaus Sinn, ja. Würde man im richtigen: Leben auch nicht machen. Schon ein bisschen länger begleitet uns der Begriff des MCPs, Model-Context-Protokoll. Genau, Model-Context-Protokoll das ist die Schnittstelle zu allem anderen. Also wenn die KI jetzt mit externen Tools spricht, mit Cloud-Lösungen jeglicher Art, gibt es mittlerweile schon für fast alle seinen MCP, dann kann man die toll integrieren. Also das ist wirklich eine Schnittstelle In die Welt nach außen. Also von einem ERP-Programm bis zu Google Maps, bis zu Google Mail, bis zu, ja, muss ich jetzt aber die ein bisschen frustrieren wenn der Hannes sagt, zu fast ALM gibt es eine Schnittstelle fast allem, was jetzt aktuelle oder neue Software bzw.

auch in der Cloud gehostete Lösungen betrifft natürlich auch ein Punkt, auf den uns wir dann auch spezialisieren werden, dass man halt Programme sage ich das jetzt vorsichtig, in den letzten 5 Jahren wurden, eben auch solche Konnektoren: bzw. MCPs zur Verfügung stellt, weil da natürlich wahnsinnig viel Zeitersparnis verbunden ist, darf man vielleicht auch ganz kurz sagen, wir arbeiten jetzt gerade an einem MCP zu DATEV. Der natürlich auch mit sehr sehr viel Aufwand und sehr sehr viel Sicherheitsgedanken ausgeprägt wird und entwickelt sich sehr sehr gut, halten wir euch natürlich auch gerne am Laufenden, was sich da in die Richtung tut. gibt es noch den Begriff der Plugins. Genau, Plugins, da muss man jetzt wieder aufpassen, welche Agenten nutzt man, müssen wir jetzt glaube ich nicht allzu tief reingehen, im Endeffekt ist ein Plugin Ein Set von diesen Themen, die wir gerade gesprochen haben, gebundelt, dass man z.B.

gewisse Subagents, gewisse Commands gewisse Skills einfach schon vordefiniert hat, ohne dass man sie sich jetzt selbst erstellen muss. Also jeder, der jetzt zugehört hat und sich gerade den Kugelschreiber besorgt hat, weil er sich denkt, Dinge muss ich dann alle auch mal selbst machen und selbst können, Schadet natürlich nicht, wenn man das selbst kann, aber: wenn man mit zusammenarbeitet, dann wird solche Einstellungen und solche Skills, Agent-MD-Files und so weiter halt dann gebundelt in sogenannten Plugins geben, damit man jetzt die Bürde vom User einfach ein bisschen wegnimmt und der wirklich eine Plug-and-Play-Lösung hat, eine sichere. Und da möchte ich aber auch etwas ganz Wichtiges dazu sagen und das sieht man jetzt gerade auch mit dieser Open-Cloud-Thematik Nicht einfach aus dem Internet irgendwelche Plugins installieren. Das ist, glaube ich, wie damals vor 20 Jahren, nicht einfach irgendwas aus dem Internet runterladen. Da könnte ein Virus drin sein. Das ist bei der KI mittlerweile auch wirklich gang und gäbe Wirklich aufpassen, was man sich da installiert, was man sich da reinholt. kann auch natürlich in dem Fall oder auch Schadsoftware mit dabei sein Entweder selbst prüfen, beziehungsweise zum Distributor des Vertrauens gehen.

Genau. Also alles das, was man jetzt so in den letzten: Jahren, beziehungsweise Jahrzehnten im Umgang mit Internet so gelernt hat, sollte man jetzt nicht verwerfen Ganz im Gegenteil ist natürlich auch für... Menschen die es jetzt nicht immer gut meinen, das Angriffsziel Nummer eins, dass man halt dann auch sagt, okay, da gibt es jetzt irgendwelche tollen MCPs und Integrationen kosten nichts, lassen sich einfach integrieren und dann plötzlich ist der Zugang auf den Computer nicht nur für den User, sondern für Personen, die man nicht möchte eben auch Darum da auch an dieser Stelle der Aufruf, wenn Fragen habt, wie auch immer, gerne auch eine E-Mail schreiben oder einen Kommentar dazu.

Und natürlich sind wir mit regelmäßigen Webinaren Vorträgen immer fest unterwegs, damit wir genau auf diese Dinge hinweisen. viel sei auch vorweggenommen, es wird jetzt im Brainy nicht diese allgemeine Möglichkeit geben, jeden der hergelaufenen MCP zu installieren, sondern... Das wird dann von uns auch entsprechend überprüft für gut befunden oder: auch selbst geschrieben, damit wir dahinterstehen können. sehr gut. Sollen wir uns das Compact auch noch anschauen? den Kontext wieder zu verkleinern. Wir haben jetzt sehr viele KI-Agenten jetzt mittlerweile einfach schon dabei. Man kennt es man schreibt sehr, sehr lange mit einem Assistenten und irgendwann sagt der Assistent, hey, ich bin out of context, ich kann nicht mehr weiterschreiben. Und jetzt gibt es die Möglichkeit des Compacten und der nimmt komplette Historie des Chatverlaufs und schreibt eine kurze Zusammenfassung und dann hat man nicht mehr 200 Seiten Kontext, sondern nur eine halbe Seite, die auf die Kernelemente der Konversation wird. Und das Tolle ist, dass ein Agent das automatisch macht.

Das heißt, wir wissen ja das auch von unseren Usern, vielleicht sehr lange und sehr gerne mit einem Chat chatten der ist halt dann irgendwann aus. Ein Agent hat dieses Problem nicht mehr und da kommen wir eigentlich dann zu einer Entwicklung, was Agents: betrifft. Man hat jetzt mit diesem Compacten die Möglichkeit, dass man halt ein Chat länger bedient und man entkoppelt im Endeffekt die Token Sizes. das hat natürlich dann auch einen dementsprechenden Vorteil man jetzt zum Beispiel von sehr überdimensionalen Excel-Dateien und so spricht. Kannst du uns kurz mitnehmen, was denn da ein Agent anders macht, Ja, also ein Agent hat halt einfach dann Tools im Hintergrund, um einfach effizienter zu arbeiten. Also ein Agent kann sich zum Beispiel auch Programmierskripte schreiben, um effizienter durch sehr große Listen zu gehen, um Auswertungen zu schreiben, Auch zum Beispiel, man kennt es ja, KIs können nicht gut rechnen aber sie können sehr gut Programmcode schreiben und Programmcode kann sehr gut rechnen.

Und dadurch ist halt Mathematik um ein Wesentliches besser, denn anstattdessen dass man quasi die KI selbst rechnen lässt und nur über Wahrscheinlichkeiten zum Ergebnis kommt, so funktioniert ja die KI, schreibt die KI einen Programmcode,: der das exakte Ergebnis ausgibt. das ist einfach Zauberei. Dass immer wieder, das ist ein Mensch unter Anführungszeichen der eine Aufgabe bekommt, diese Aufgabe in kleine Pakete zerteilt um effizient zum Ziel zu kommen. Und das ist wirklich faszinierend. Also wir haben bei einer Agent-Demo Hannes du erinnerst dich, die eine Excel-Datei mit 10.000 Zeilen gehabt, das waren im Endeffekt 10.000 fingierte Kunden mit Kundenadressen und Kundenansprechpartnern. Und wir haben aus Demo-Zwecken dann einfach den Agent einmal angewiesen dass er da bitte eine Wegeoptimierung für die Kundenbetreuer macht. Könnte kein Mensch machen. Könnte kein Mensch machen, außer mit einem großen Geografiestudium und einigen Wochen Zeit. Der Agent ist zwei, drei Minuten gelaufen und hat mir dann tatsächlich eine korrigierte Excel-Datei abgelegt und hat mir dann noch nett geschrieben, wie viele tausende Kilometer gespart wurden, wenn man davon ausgeht dass ein Kundenbetreuer einmal im Jahr jeden Kunden besucht.

Habe ich einen sehr coolen: Demo-Ansatz gefunden, der auch dem einen oder anderen Zuseher ein leichtes Staunen ins Gesicht gezaubert hat. Kurz zusammengefasst können wir jetzt aus Passwörterklärung und der Der Tatsache, dass der Agent das tut, was ich ihm sage mitnehmen, im er wirklich das tut, was ich ihm sage. heißt, ich kann jetzt nicht nur einfach etwas diktieren und ihm sagen, fasse mir das zusammen, sondern greife halt wirklich auf Ordner zu, extrahiere irgendwelche Informationen und so weiter und so fort. Und ich glaube, das ist so ein Skill. Ein menschlicher Skill, den man sich zukünftig einfach auch mitnehmen kann, einfach präzise zu formulieren, was ich denn möchte und dann schaue ich halt einfach dem KI-Agent beim Arbeiten zu oder starte von mir aus den nächsten Agent, weil die laufen ja auch parallel.

Das heißt, auch das ist ein Thema, das mir in den letzten Wochen öfter aufgefallen ist. Du bist ja noch viel länger da der Thematik dass man: halt einfach 4, 5, 6 Aufgaben Nacheinander wegschickt und halt dann, wenn die erste Aufgabe fertig ist, dann mit dem Ergebnis entsprechend weiterarbeitet. Ja so ist es. Und das ist auch ein bisschen auch Umgewöhnung Wir haben es, glaube ich schon mal in einer älteren Folge besprochen. Dieses parallele Arbeiten ist der absolute Wahnsinn, aber es fordert ein bisschen, seine Ansichten und seine Arbeitsweisen der letzten Jahrzehnte quasi halt zu ändern, also die Ja, also eigentlich so ganz konträr zu dem, was man gelernt hat, mach eine Sache fertig und dann mach die nächste. man jetzt ein bisschen einen geistigen Spagat zusammenbekommen, dass man halt sagt, okay, ich fange halt eine Aufgabe mal an und der andere macht es fertig. Ja, das ist auch wieder menschlicher Skill der Zukunft, bin ich davon überzeugt Diese Agents zu koordinieren, das ist egal in welcher Berufsgruppe Das wird der meist benötigsten menschlichen Skills der Zukunft werden.

Man muss nicht mehr selbst: alles 100% ausprogrammieren oder alles 100% aber man muss koordinieren. Und dann wirklich sein eigenes Team aus. Zig Agenten kann dann quasi wirklich Aufgabe wie in einer großen Abteilung. Jeder wird zum Manager. Jeder wird zum Manager, ja genau. Herausforderung dass er diese unterschiedlichen Lösungen die er dann präsentiert kriegt auch dann entsprechend verarbeitet und das dann auch in der Auswertung dieser Lösungen nichts verloren geht und natürlich auch in diesen Zwischenschritten immer wieder die menschliche Kontrolle einfließt das menschliche Know-how und die Expertise, einfach den Output, wir können es nicht oft genug sagen, auch entsprechend zu verifizieren.

Komplett ja. Und auch natürlich effizientes Arbeiten. Mit diesen Begriffen, die wir vorher genannt haben, die einfach hören, auch mal vielleicht einen Assistenten oder Agenten nochmal im Detail: erklären lassen und wirklich die Wege Das ist einfach komplett wichtig, wenn ist jetzt wie bei einem schlechten Manager, wenn der Arbeit schlecht an die Abteilung koordiniert oder unnötige Anweisungen gibt, dann ist das nicht gut, dann kommt man vielleicht auch zum Ziel, aber langsam und da muss man einfach mit den Agenten auch ein bisschen aufpassen effizient arbeiten, gute, Anweisungen Ergebnisse zu bekommen.

Perfekt. Und wenn wir jetzt gerade von den Ergebnissen reden, wir wollen ein paar so Use Cases einfach auch besprechen, uns glaube ich in letzter Zeit auch sehr geflasht Use Case ist immer wieder eine Thematik mit Texte übersetzen mit Word-Dateien übersetzen, also generell Multilingualität ist natürlich ein Thema und man kann jetzt dem Agent einen Ordner geben, da liegen Word-Dateien, da liegen PDF-Dateien, da liegen Excel-Tabellen drinnen und man kann quasi dann Auf Befehl diesen Agent anweisen, dass er alle diese: Dokumente entsprechend übersetzt in Englisch in Spanisch, in Mandarin, je nachdem wo die präferierte Sprache liegt oder die benötigte Sprache liegt und er würde dann diese Dokumente vollständig übersetzen und auch wieder in so einem Dateiformat, also Word wird Word, Excel bleibt Excel und so weiter Entsprechend ablegen und das stelle ich mir gerade für Firmen interessant vor, die halt einfach für mehrere Sprachen irgendwelche Sicherheitshinweise, irgendwelche User-Manuals irgendwelche innerbetrieblichen Anweisungen auf unterschiedliche Sprachen übersetzen müssen, dass man halt das auch in Form einer Routine, einmal in der Woche, einmal am Tag, einmal im Monat durchlaufen lässt und hat halt dann immer, Up to date alle Dokumente in allen benötigten Sprachen abgelegt.

Denkt einfach auch nur weiter an Rechnungsordner, wo halt irgendwelche Eingangsrechnungen abgelegt werden, die halt dann entsprechend in einem Excel aufbereitet werden müssen. Das: kann der Agent mit einer Routine oder eben auf Anweisung immer zum Monatsletzten machen. Und das Ganze dann gleich per Mail an einen Steuerberater schicken Viele kennen es, die meisten hassen es, monatsende die Rechnungen zusammentragen. Und da gibt es tolle oder Muster, dass man wirklich sagt, man hat einen Ablagefolder da zieht man alle Rechnungen rein. Einmal am Tag wird das kategorisiert mit Kostenstelle im richtigen Folder im richtigen... Feil eingetragen oder gleich vielleicht mit schnittstelle direkt an den steuerberater und dann wird aus eventuell einem halben tag tag auf einmal freizeit richtig ganz von selbst habe eine Funktion sehr cool gefunden und zwar ist das Fahrtenbuch-Erstellung.

Das heißt, ich sage, wann fahre ich weg, wo fahre ich hin. Ich kann mir dann von mir aus auch über Google Maps die Entfernung raussuchen lassen. Das heißt einfach nur so eine Übersicht wo bin ich denn unterwegs. Wetter.: Alle möglichen Integrationen. Automatisiertes Wetter oder irgendwelche Verkehrsnachrichten und so weiter. diese Routenplanung oder Ich nenne es jetzt allgemein Arbeitsvorbereitung, je nachdem, was man halt dann auch braucht. Der eine ist viel im Auto unterwegs, der andere hantiert sehr viel mit Rechnungen, nächste muss up to date bleiben, was jetzt irgendwelche rechtlichen Änderungen betrifft irgendwelche aktuellen Nachrichten betrifft und so weiter und so fort. Alles das kann man sich. Mit Agents lösen lassen und mit Routinen auch zu gewünschten Zeitpunkt auch dann präsentieren lassen. Ob ich mir da eine Mail schicken lasse oder ob ich mir das dann direkt im Chat ausgeben lasse ist dann eigentlich jedem selbst überlassen.

Integration in Bestandslösungen. Wir reden ja immer wieder davon, dass so auch die Fernbedienung für bestehende KI-Infrastruktur sein wird. Wir haben jetzt einen Agent gebaut, der auf unser CRM-System Zugriff hat, wo ich mir aufbereiten lassen: kann, wo ich mir Telefonnotizen ablegen kann, wo ich mir Termine hinterlegen kann und so weiter und so fort. Bugs aufnehmen, das ist Tickets anlegen, priorisieren, alles der Agent mittlerweile. Ganz genau, ja. Ein Thema war auch noch grafische Aufbereitung von Excel-Tabellen, das heißt es gibt mittlerweile auch Excel-Integrationen für Agents die mir dann eine entsprechend visualisierte Statistik ablegen und so weiter und so fort. wird der Excel-Profi sagen, das kann ich selbst. Ja, ich kann mir auch selbst heraussuchen wie lange ich von hier nach Wien fahre.

Wenn ich diese Vorbereitung entsprechend automatisiert bekomme, spare ich mir halt Zeit und wenn mir dann der Agent noch meinen Abfahrtszeitpunkt im Kalender einträgt, ich sicher, dass ich trotz etwaiger Wetterverhältnisse oder wie auch immer rechtzeitig du in der Programmierung für Routinen, beziehungsweise für Automatisierungen? Ja das ist jetzt, glaube ich schwierig, ohne völlig den Rahmen: zu sprengen weil es ja sehr, sehr technisch ist. Grupp gesagt, ja, die ganzen Review-Prozesse. Automatisches Anlegen und Verwalten von Programmiertickets etc. Ich möchte da gar nicht zu tief reingehen, weil da kommen jetzt dann sehr viele Fremdwerte und da möchte ich nicht nach heute noch mehr unsere Zuhörer eventuell verlieren. Es ist ein Deep Dive, wir haben es vorher angedroht. vielleicht eine Frage... Die jeden interessiert und die mir jetzt auch in den letzten Wochen gerade noch den Agent-Demos immer wieder gestellt bekommen haben. Was muss ich denn jetzt tun, damit so ein Agent bei mir läuft? Das heißt, beginnen einfach einmal mit einer rudimentären Prozessanalyse. Was möchte ich denn gerne automatisiert haben? Ich glaube, das Wichtigste ist, mal nachzudenken, was sind Arbeiten, die mich nerven die repetitiv sind. theoretisch ein Praktikant machen könnte, wenn ich es ihm ganz genau beschreibe.

Und diese Aufgaben: oder Probleme den Agenten sagen und sagen, hey, finde bitte eine Lösung in Form eines Skills, Commands etc., dieses Problem zu lösen. Und dann macht der Agent eigentlich wieder Magie und schreibt sich selbst. wer das jetzt dann so mit diesen ersten Berührungsängsten jetzt vielleicht nicht selbst machen möchte, da sind wir gerne mit Rat und Tat zur Seite, dass wir eben auch diese repetitiven Tätigkeiten beleuchten diese Prozesse analysieren und dann entsprechend diesen Agent sicher, funktionell und kosteneffizient dann entsprechend bei unseren Kunden auszurollen. Und da bin ich eigentlich schon beim angeteaserten Punkt und zwar das Thema Kosten. merkt jetzt bei JetGPD, die führen Werbung ein. Man merkt, dass KI-Modelle, die jetzt ohne Werbung auskommen, immer haben.

hast es zuerst schon gesagt, ein: Agent, der von mir aus dann auch mit Sub-Agents arbeitet und so weiter, braucht halt sehr viele Tokens das heißt sehr viel Rechenleistung. Man muss da jetzt wirklich eine Lanze brechen für diese Zeitersparnis die Effizienzsteigerung oder auch die freie Zeit oder halt von mir aus auch einen doppelten dreifach oder vierfach so hohen Output eines Mitarbeiters, der halt mit Agent-Unterstützung einfach mehr weiterbringt. mal ein paar Zahlen gesagt, man wirklich Hardcore-User ist, also wenn ich da jetzt von dir ausgehe, was du in der Programmierung an KI-Kosten verursachst, liegen wir ungefähr am Tag wo? Man sagt, dass man so circa der normale User, ich bin da wieder ein schlechtes Beispiel, ich habe einen sehr hohen Verbrauch, ich bin aktuell bei einer halben Milliarde Tokens im Monat.

Servus. Aber das ist jetzt auch sehr sehr tief schon in dieser Bubble drin. Im Endeffekt glaube ich kann man: sagen, Pro Agent bzw. pro Mitarbeiter ist ein guter Richtwert zwischen 10 und 30 würde ich sagen, ist ein Richtwert, wenn man es gut und viel nutzt. Täglich? Täglich, ja. Wenn man täglich wirklich viel mit dem Agenten arbeitet. Das Tolle ist er kostet nur dann Geld, wenn man ihn nutzt. wie diese mit dem Output da entsprechend nicht zu nutzen, würde ich als grob fahrlässig abstempeln. Philipp, jetzt erzähl mal, bei dir tut sich ja auch abseits der ganzen Agent-Entwicklung immer viel.

Wo bist du denn unterwegs? für spannende Tätigkeiten hast du denn? Ja, das ist eine perfekte Frage, also mich hat ja völlig überwältigt das Interesse an diesen Agents. Ich habe es zuerst gesagt, wir haben jetzt drei Agent-Webinare gehabt, auf unserer Homepage findet man auch noch einmal weitere, wir werden jetzt auch das Agent-Webinar, weil wir leider nicht jede Woche zwei Stunden Zeit haben, unserer Homepage: veröffentlichen ist jeder gerne dazu angehalten, sich das mal anzusehen. Und wir haben natürlich auch jetzt weitere Veranstaltungen. wir sind am 23. und 24.2. in auf der Legal Tech und auf der Text Tech Konferenz. Diese Konferenz ist dann sozusagen in Form einer Roadshow auch am 17.3. in St. Pölten und am 18.3. in Linz. muss ich nicht zu weit hinfahren. Ich habe vor zwei Wochen für die VWT ein Webinar halten dürfen. Das mit 250 Plätzen restlos ausverkauft war. Wir haben da jetzt auch eine zweite Auskopplung aufgelegt. Dieses VWT-Seminar, also für alle Steuerberater sehr interessant, wird am 11.03. um 16 Uhr stattfinden. Und eben unsere Agent-Webinare mit allen Neuerungen, die es bis dahin auch noch gibt, haben wir jetzt einmal für den 4.5.

und für den: 20.5. jeweils von 16 bis 17 Uhr geplant. Unsere Webinare kann man kostenlos auf unserer Homepage buchen. Wir freuen uns. Sehr, wenn da Interessenten kommen und wir halten diese Runden auch absichtlich etwas kleiner. Das heißt, wir sprechen da von bis zu 30 Teilnehmern, die wir ermöglichen weil wir auch den Diskurs sehr schätzen, dass man sich einfach unterhaltet, was denn für jeden Teilnehmer per Wichtigkeit ist.

Wir nehmen uns wie nach jeder Aufnahme dieses Mal wirklich vor, das jetzt wieder regelmäßiger zu machen. Also ich hoffe, wir kommen wieder mit unserem 14-Tages-Rhythmus hin. Aber nachdem jetzt in nächster Zeit kein Weihnachten, kein Neujahr und keine unerwarteten Termine anstehen und wir das Jahr eigentlich schon sehr gut aufgeplant sind, ich auch, dass wir die Podcasts entsprechend wieder fix: einplanen können. Gerne in die Kommentare eure Anregungen schreiben beziehungsweise Wünsche für die nächsten Folgen. Wir wünschen eine gute Zeit. Auf alle Fälle. Und bleiben Sie uns gewogen. Vielen Dank. Bis zum nächsten Mal.

Neuer Kommentar

Dein Name oder Pseudonym (wird öffentlich angezeigt)
Mindestens 10 Zeichen
Durch das Abschicken des Formulars stimmst du zu, dass der Wert unter "Name oder Pseudonym" gespeichert wird und öffentlich angezeigt werden kann. Wir speichern keine IP-Adressen oder andere personenbezogene Daten. Die Nutzung deines echten Namens ist freiwillig.