Davon, dass die in 30 Sekunden von der KI erzeugte Persona „Tim“ nichts taugt, habe ich Sie hoffentlich im letzten Newsletter überzeugt. Erkenntnis entsteht nicht durchs Lesen, sondern durch eigene Auseinandersetzung mit dem Thema – durchs Kneten, wie Jared Spool sagt.
Was aber, wenn es keine Nutzenden gibt, mit denen Sie sprechen könnten? Wenn diese in der Zukunft leben und noch nicht jetzt?
Vor kurzem stand ich vor genau so einer Frage: Nutzen wir bald gar keine Websites mehr? Ende 2025 testete Google generative User Interfaces in der Suche – speziell für jede Suche erzeugte Nutzungsoberflächen, die nicht nur Ihre Frage beantworten, sondern gleich eine interaktive Anwendung liefern. Sie fragen etwa: „Wie lange muss ich arbeiten, damit mir im Alter die Rente reicht?“ Statt einer Trefferliste mit allgemeinen Artikeln bekommen Sie eine interaktive Renten-Simulation. Ich wollte wissen: Ist das der Todesstoß für Websites, wie wir sie seit Jahrzehnten nutzen und bauen?

Sie selbst stehen sicher immer wieder vor solchen Zukunftsfragen: Lohnt sich die Investition in eine Plattform, deren Halbwertszeit niemand kennt? Gibt es meinen Beruf in zehn Jahren noch? Was tut man, wenn man auf so eine Frage eine wirklich belastbare Antwort braucht – nicht nur ein Bauchgefühl?
Verhalten vs. Bewertung
Im letzten Newsletter war meine Diagnose klar: KI kann uns nicht sagen, was Menschen tun werden, synthetische Personas sind kein Ersatz für Nutzerforschung. Die KI hat zwar viele Daten und kann sehr überzeugend formulieren – aber sie hat nie auf einem Sofa gesessen und einer Nutzerin beim Scheitern zugesehen oder sie fluchen gehört. Verhalten und Einstellungen kann sie simulieren – aber nicht vorhersagen, wenn es Neues betrifft.
Mit rationalen Bewertungen ist das eine andere Sache.
Bitte ich die KI, sich in eine 36-jährige Käuferin hineinzuversetzen, muss sie Dinge erfinden. Bitte ich sie aber, sich in eine UX-Forscherin hineinzuversetzen und eine Hypothese gegen den Forschungsstand zu prüfen, kann sie ihren Wissensschatz nutzen. Was sagen Studien? Wo gibt es Konsens, wo Streit? Im einen Fall verlangen wir, dass sie Verhalten simuliert. Im anderen lassen wir sie Wissen auswerten. Und das läuft wesentlich besser.
Milliardengeschäft Prognosen

Die Zukunft zu kennen, wäre eine Superkraft – gerade für wirtschaftliche Entscheidungen. Das hat schon Thales von Milet im 6. Jahrhundert vor Christus vorgemacht. Der Philosoph soll im Winter eine reiche Olivenernte vorausgesehen haben – und mietete sämtliche Olivenpressen der Gegend. Als die Bauern im Spätsommer ihre vielen Oliven pressen wollten, vermietete er ihnen die Pressen weiter. Natürlich mit saftigem Aufschlag.
Der Psychologe Philip Tetlock untersucht seit bald 20 Jahren, warum manche Menschen besser darin sind, Vorhersagen zu treffen. Sein Ergebnis: Es ist nicht Fachwissen, sondern eine bestimmte Denkweise. Sie denken in Wahrscheinlichkeiten („75 Prozent“ statt „ziemlich sicher“), zerlegen große Fragen in kleinere, passen ihre Schätzungen an neue Informationen an und suchen aktiv nach Argumenten, die ihre Position widerlegen. Tetlock nennt diese Personen „Superforecaster“.
Daraus ist eine ganze Forecasting-Szene entstanden. Auf Plattformen wie Metaculus werden konkrete Zukunftsfragen gestellt – „Gerät das Land X bis 2027 in eine Rezession?“ – und Tausende geben Wahrscheinlichkeitsschätzungen ab. Die kollektive Schätzung schlägt regelmäßig Einzelmeinungen. Seit zwei, drei Jahren machen auch KI-Bots mit – dazu gleich mehr.

Was die Zukunfts-Branche aktuell anbietet
Solche Bots sind nur eines von vielen KI-Werkzeugen für Zukunftsfragen. Die Unterscheidung zwischen Verhalten und Bewertung erklärt, warum manche funktionieren, andere nicht.
Synthetische User: Anbieter wie Synthetic Users oder Simile lassen KI Personas spielen, die Sie zu Ihren Produktideen befragen können. Befürworter berufen sich meist auf eine Stanford-Studie von 2024, in der KI-Agenten die Meinung ihrer menschlichen Vorbilder zu 85 Prozent korrekt wiedergaben. Das misst aber nur, wie konsistent ein Agent etwas sagt – nicht, wie ein Mensch sich tatsächlich verhält. Auch in 100 Varianten bleibt unsere KI-Persona Tim ein Phantom.

KI als Foresight-Partner. Wer mit KI Zukunftsfragen bearbeitet, nutzt sie meist als generischen Sparringspartner: für Recherche, Hypothesen-Vorschläge, als Gegenstimme. OECD und Weltwirtschaftsforum haben Ende 2025 einen Bericht zur KI-gestützten Zukunftsforschung veröffentlicht: Die meisten Befragten arbeiten ad hoc, ohne klares Verfahren. Größere Strategieberatungen und Konzern-Foresight-Abteilungen sind weiter und etablieren strukturierte Workflows mit klar getrennten Rollen: Die KI scannt Tausende Studien, sortiert Trends, schlägt erste Synthesen vor. Der Mensch entscheidet, was relevant ist, prüft die Plausibilität, trägt die Verantwortung. Manche setzen die KI sogar gezielt als Kritikerin ein, die in Workshops die eigenen Annahmen infrage stellt. Aber: Die Rollenverteilung klingt einfach – in der Praxis ist sie es nicht. Wer Tausende plausibel formulierte KI-Synthesen sichten soll, ermüdet schnell und winkt durch, was harmlos klingt. Ohne klares Verfahren wird aus dem Sparringspartner ein Zulieferer, deren Ergebnisse der Mensch nur noch abnickt.

KI-Forecasting-Bots: Auf Plattformen wie dem genannten Metaculus treten autonome Bots gegen menschliche Superforecaster an. Sie kombinieren aktuelle Nachrichten mit historischen Basisraten und erreichen mittlerweile das Niveau erfahrener Forecaster. Aber sie liefern nur eine Zahl auf eine fertige Frage – sie erzeugen keine Hypothesen und zeigen keine Streuung im Diskurs. Für strategische Fragen wie „Wie sieht UX in fünf Jahren aus?“ sind sie nicht zu gebrauchen.

Eine Frage, 22 Brillen – die Delphi-Maschine
Für komplexe Fragestellungen brauchen Sie ein Verständnis dafür, warum etwas plausibel ist, wer es anders sieht und wo die eigenen blinden Flecken liegen. Für meine Google-Frage habe ich deshalb ein anderes Verfahren gewählt – eines, das es schon fast 60 Jahre gibt. Die Delphi-Methode wurde in den 1960ern entwickelt, als das US-Militär strategische Zukunftsfragen strukturiert bearbeiten wollte. Das Prinzip: Man formuliert Hypothesen über die Zukunft. Ein Panel von Expert:innen bewertet die Hypothesen unabhängig voneinander nach Plausibilität, Einfluss und eigener Gewissheit. In einer zweiten Runde sehen die Expert:innen das anonymisierte Feedback der anderen und können ihre Position überdenken. Am Ende sieht man: Wo gibt es Konsens, wo Dissens, was überrascht?
Das Verfahren ist vielfach bewährt – aber aufwendig. Die richtigen Expert:innen finden, durch zwei Runden führen, bezahlen: Das dauert Wochen und kostet schnell vier- bis fünfstellige Summen.
Genau das macht die Delphi-Maschine. Die KI übernimmt nicht „die Aufgabe“ – sie übernimmt klar definierte Rollen und bewertet aus deren Perspektive. UX-Forscherin, VC-Investor, Accessibility-Expertin, Frontend-Entwickler, Regulierungsfachfrau, Medienethiker – je nach Fragestellung 15 bis 25 Rollen.
Eine Einschränkung: Alle Rollen basieren auf denselben Trainingsdaten – und haben damit möglicherweise dieselben blinden Flecken. Eine Regulierungsexpertin, die seit 20 Jahren in Brüssel arbeitet, weiß Dinge, die in keiner Publikation stehen. Die Delphi-Maschine bildet den Stand der veröffentlichten Fachdiskussion ab – nicht das implizite Wissen einzelner Insider.
Die KI ist also kein simulierter Mensch, sondern ein strukturierter Zugriff auf den im Training aufgesogenen Wissensschatz – sortiert nach disziplinären Brillen. Es geht nicht darum, neue Ansichten zu erzeugen, sondern vorhandene Perspektiven, Einschätzungen und auch Vorurteile sichtbar zu machen.
In der akademischen Forschung gibt es parallel einen verwandten Ansatz, Real-Time AI Delphi, bei dem die KI ein Panel echter Expertinnen in Echtzeit moderiert. Näher am Original – aber genauso aufwendig in Vorbereitung und Vergütung. Die Delphi-Maschine geht den umgekehrten Weg: Sie ersetzt die Expertinnen durch KI-Rollen. Schneller, günstiger – und für die meisten strategischen Fragen zu elektronischen Produkten, Websites und Apps ausreichend.
Was die Brillen für die Zukunft des Webs sehen
Ich wollte ja herausfinden, ob Google Websites die Existenzberechtigung nimmt mit dem Ansatz, keine Treffer mehr auf Suchanfragen zu liefern, sondern speziell für jede einzelne Anfrage erstellte Mini-Anwendungen. Dazu habe ich eine KI-Delphi-Studie mit 25 Hypothesen und 22 Rollen aufgesetzt. Die Ergebnisse kennen Sie schon aus dem Newsletter 12/2025 – Suchmaschinen als Webdesigner. Hier nur die zwei Ergebnisse, die meine Meinung am stärksten verändert haben:
Ergebnis 1: Die Disruptions-These ist nicht haltbar – aber nicht aus technischen Gründen. Die Hypothese „80 Prozent der Webnutzenden erledigen ihre wichtigen Online-Aufgaben bis 2030 in dialogischen, KI-generierten Interfaces“ kam nur auf 35 Prozent Plausibilität. Es scheitert nicht an der Technik, sondern an Datenschutzregeln, Haftungsfragen, fehlendem Vertrauen und der Trägheit etablierter Systeme – und der Trägheit von uns Menschen. Eine treffende Analogie aus dem Panel: Auch mobile Apps haben klassische Websites nicht ersetzt, sondern ergänzt.
Ergebnis 2: Auch Google bekommt nicht den ganzen Kuchen. Die Hypothese „Google dominiert genUI mit über 80 Prozent Marktanteil“ kam sogar auf nur 25 Prozent Plausibilität. Realistischer scheint ein Oligopol von drei bis fünf Plattformen. Das ist eine wichtige Korrektur des öffentlichen Diskurses, in dem oft so getan wird, als sei Googles Vormachtstellung nicht zu brechen. Ist sie nicht – Regulierung und Marktdynamik wirken dagegen.
Die Antwort auf meine Ausgangsfrage lautet also weder „Websites verschwinden“ noch „Websites bleiben, wie sie sind“. Sie lautet: Es kommt eine längere Phase der Koexistenz, dominiert von einem Oligopol, mit erheblichen Marktanteilen für klassische Websites in regulierten und Vertrauens-sensitiven Bereichen. Mit dieser Antwort kann ich planen.

Der eigentliche Wert: Klarheit, nicht Glaskugel
Zur Einordnung: Natürlich sind die Befunde aus der Delphi-Maschine keine gesicherte Prognose. Niemand kann heute mit Sicherheit sagen, ob 2030 wirklich nur ein Drittel der Webnutzenden in dialogischen KI-Interfaces unterwegs ist. Jedes Panel kann sich irren, erst recht eines, das letztlich aus einer einzigen Quelle gespeist wird – den Trainingsdaten der KI.
Aber für gesicherte Prognosen ist die Methode gar nicht gedacht. Der eigentliche Wert einer Delphi-Studie liegt nicht in den Zahlen. Er liegt davor und danach – mithilfe der Delphi-Maschine durchdringen wir ein Thema tief: Davor müssen wir Hypothesen scharf formulieren, über unsere eigene Erwartung nachdenken. Aus dem vagen „GenUI wird wichtig“ wird konkret:
Bis 2030 starten mindestens 80 % der Webnutzenden komplexe Online-Aufgaben wie Reisen, größere Anschaffungen oder Behördengänge überwiegend in genUI-basierten, dialogischen Oberflächen statt über klassische Website-Navigation und Webformulare.
Das ist detailliert, ist messbar und zwingt uns, darüber nachzudenken, wie wir glauben (oder fürchten?), dass die Zukunft aussehen könnte.
Zum danach: Wenn der Report auf dem Tisch liegt, sehen Sie das Ganze aus drei Perspektiven: Erstens die Hypothesen, bei denen sich die Rollen einig sind – das sind Ihre Pflöcke, an denen Sie die Strategie festmachen können. Zweitens die Hypothesen, die das Panel als unplausibel verwirft – das ist Entlastung, weil Sie sich um diese Szenarien weniger sorgen müssen. Und drittens die Hypothesen mit hoher Streuung, aber starkem Einfluss auf Ihr Geschäft, auf Ihr Produkt: Hiervon hängt Ihre Strategie wirklich ab. Welche Investition lohnt sich heute, welche besser in zwei Jahren? Welche Plattform-Wette gehen wir ein, welche nicht? Wo bauen wir Kompetenz auf, wo kaufen wir sie ein? Die Studie liefert das Material. Was es für Sie bedeutet, entscheidet Ihr Team.
Die KI nutzen wir bei der Delphi-Maschine also nicht als Glaskugel. Mit ihr ersetzen wir Bauchgefühl durch begründete Argumente. Wenn sich Ihre Vorannahme am Ende bestätigt, haben Sie jetzt gute Belege dafür – mit klar benannten Gegenstimmen. Wenn nicht, können Sie Ihren Kurs korrigieren, bevor es teuer wird. Beides ist mehr wert als die Scheinsicherheit einer eindeutigen Zukunftsvorhersage, die ohnehin niemand belastbar liefern kann.
Drei entscheidende Stellschrauben für die Qualität der Studie
Eine Delphi-Studie ist nur so gut, wie ihre Vorbereitung. Drei Stellschrauben entscheiden über die Qualität – und alle drei müssen Sie selbst justieren.
Hypothesen formulieren. Eine Hypothese braucht eine Zahl, einen Zeithorizont und eine klare Schwelle. „GenUI wird wichtig“ ist keine Hypothese. „Bis 2030 erledigen 80 Prozent der Webnutzenden komplexe Online-Aufgaben in dialogischen Interfaces“ ist eine. Wer zu schwammig formuliert, bekommt schwammige Antworten.
Expert:innen auswählen. Wer 22 Webdesigner:innen fragt, bekommt 22-mal fast dasselbe Ergebnis. Die Brillen müssen sich ergänzen, idealerweise gegenteilige Sichten haben. Bei meiner genUI-Studie war zentral, dass die VC-Brille mit der Accessibility-Brille kollidiert, dass die Regulierungs-Brille auf das schaut, was die UX-Brille übersieht.
Auswertung mit Sinn für Streuung. Ein Mittelwert von 65 Prozent kann harmlos aussehen – und doch zwei verfeindete Lager mit 30 und 95 Prozent verstecken. Die spannenden Punkte sind oft nicht die mit hohem Konsens, sondern die mit hoher Streuung. Dort steckt die strategisch wichtige Frage: Wo bleibt das Panel uneins, und warum?
Das Verfahren ist Handwerk. Erfahrung hilft: Wie scharf muss ich die Hypothesen formulieren? Welche Rollenkombination deckt blinde Flecken auf? Wann ist hohe Streuung ein Warnsignal – und wann der interessanteste Befund der ganzen Studie?
Auch hier gilt: Ohne Kneten kein Verständnis
Im letzten Newsletter habe ich Jared Spools Bild von Teig und Kuchen aufgegriffen: Erkenntnis entsteht beim Kneten, nicht beim Essen. Die KI, die Ihnen die fertige Persona „Tim“ liefert, nimmt Ihnen den Prozess ab – und damit auch einen wesentlichen Teil der möglichen Erkenntnisse.
Bei der Delphi-Maschine ist das anders: Sie liefert keinen fertigen Kuchen, sondern Material zum Weiterarbeiten. Was daraus wird, entsteht in Ihrem Kopf, in Ihrem Team, im Gespräch mit anderen. Die KI hilft uns also, den enormen Wissenskorpus von Zehntausenden Whitepapers und Studien zu verarbeiten. Was Sie damit machen, bleibt Ihnen überlassen. Bei den größeren Studien gehört für mich die gemeinsame Einordnung der Ergebnisse aber selbstverständlich dazu.
Wenn Sie das selbst probieren wollen – einen Ausschnitt aus dem Beispielreport mit den 25 Hypothesen, aus dem die Befunde oben stammen, finden Sie hier: Delphi-Studie: Generative User Interfaces 2030. Das Verfahren lässt sich auf jede strategische Frage übertragen, bei der Ihr Team unter Unsicherheit entscheiden muss. Ich setze solche Studien inzwischen auch für andere auf – von der kompakten Variante mit 5 Hypothesen bis zur vollständigen Analyse mit 25 Hypothesen, professionellem Report und gemeinsamer Einordnung. Mehr dazu: benutzerfreun.de/zusammenarbeit/die-delphi-maschine




