Ein Browser zeigt eine Seite fuer Menschen und fuehrt JavaScript sofort aus. Ein Crawler wie Googlebot ruft erst rohen HTML ab und rendert JavaScript spaeter in einem separaten, ressourcenbeschraenkten Schritt, ohne Klicks, Scrollen oder Login. Genau diese Luecke erklaert, warum Inhalte fuer Bots fehlen koennen.
Crawler vs Browser ist der Unterschied zwischen der automatisierten Bot-Sicht eines Suchmaschinen-Crawlers und der visuellen Sicht eines menschlichen Nutzers im Browser.
Was im Browser sichtbar ist, sieht ein Suchmaschinen-Bot nicht automatisch genauso. Googlebot ruft Seiten in zwei Phasen ab, kennt Ressourcen-Limits und verzichtet auf jede Nutzeraktion. Dieser Leitfaden zeigt, wie sich Bot-Sicht und User-Sicht technisch unterscheiden, warum Inhalte fuer Bots fehlen koennen und wie sich die Differenz pruefen laesst. Wer diese Mechanik versteht, baut Seiten, die in beiden Welten funktionieren, und legt damit ein Stueck der Grundlagen des technischen SEO, auf denen die Indexierbarkeit aufbaut.
Verwandtes Thema: wie du SEO-Daten per API direkt ziehst statt manuell im Tool zu klicken.
Praktisch dazu: wie du mit den Chrome DevTools technisches SEO pruefst.
Was ist der Unterschied zwischen Crawler und Browser?
Ein Browser laedt eine Seite fuer einen Menschen, fuehrt JavaScript sofort aus und stellt das Ergebnis sichtbar dar. Ein Crawler ist ein Programm, das das Web systematisch und automatisiert nach Inhalten durchsucht, um sie fuer eine Suchmaschine zu indexieren. Beide rufen dieselbe URL ab, verfolgen aber gegensaetzliche Ziele: Darstellung fuer einen Nutzer auf der einen Seite, maschinelle Erfassung fuer den Index auf der anderen.
Ein Web-Crawler ist ein automatisiertes Programm, das das Internet systematisch durchsucht, typischerweise betrieben von Suchmaschinen zum Zweck der Indexierung von Webseiten.
Der praktische Effekt: Der Browser optimiert auf Erlebnis, der Crawler auf Effizienz und Skalierung. Ein Crawler verarbeitet Milliarden URLs und muss seine Ressourcen verteilen, ein Browser bedient nur einen einzigen Nutzer und darf grosszuegig laden. Aus diesem Unterschied entstehen fast alle SEO-Probleme, bei denen eine Seite im Browser perfekt aussieht, in der Suche aber unvollstaendig erfasst wird. Die Bot-Sicht ist die eigentlich relevante, wenn es um Rankings geht.
Wie sieht Googlebot eine Webseite?
Googlebot verarbeitet eine Seite in zwei getrennten Phasen: Crawling und Rendering. In der ersten Phase ruft Googlebot den rohen HTML-Quelltext ab, den der Server ausliefert, und folgt den darin enthaltenen Links. In der zweiten Phase uebergibt Google die Seite an den Web Rendering Service, der sie mit einer aktuellen Chromium-Engine rendert und dabei JavaScript ausfuehrt. Erst der so entstandene gerenderte DOM bildet die Grundlage fuer die Indexierung.
Googlebot identifiziert sich dabei ueber einen festen User-Agent. Es gibt eine Smartphone- und eine Desktop-Variante, wobei Google laengst nach dem Prinzip Mobile-First indexiert, also primaer die mobile Version bewertet. Der entscheidende Unterschied zum Browser liegt im Verhalten: Googlebot scrollt nicht, klickt nicht, fuellt keine Formulare aus und meldet sich nirgends an. Er bewertet ausschliesslich den Zustand der Seite, der ohne jede Interaktion entsteht.
Googlebot crawlt zuerst die rohe HTML-Antwort und rendert Seiten in einem spaeteren Schritt mit einer aktuellen Version von Chromium, weshalb sich gerenderter und initialer Inhalt unterscheiden koennen.
Warum unterscheidet sich gerenderter HTML vom rohen HTML?
Roher HTML ist der Quelltext, den der Server direkt ausliefert, gerenderter HTML ist das Ergebnis, nachdem der Browser oder Renderer JavaScript ausgefuehrt hat. Bei einer statischen Seite sind beide nahezu identisch. Bei einer modernen JavaScript-Anwendung kann der rohe HTML fast leer sein und der eigentliche Inhalt erst clientseitig entstehen. Googlebot indexiert den gerenderten Zustand, doch der Weg dorthin ist die eigentliche Fehlerquelle.
Der Grund liegt in der Architektur vieler Single-Page-Anwendungen mit Frameworks wie React, Angular oder Vue. Sie liefern oft nur ein Geruest und holen Texte, Produktdaten oder Links erst ueber Schnittstellen nach. Im Browser passiert das fuer den Nutzer unsichtbar in Millisekunden. Fuer den Crawler haengt das Ergebnis davon ab, ob das Rendering vollstaendig gelingt, ob die benoetigten Ressourcen erreichbar sind und ob der Inhalt ohne Interaktion erscheint. Wie sich diese Architekturen suchmaschinenfreundlich gestalten lassen, behandelt der Leitfaden zum Umgang mit JavaScript-SEO ausfuehrlich.
Warum sieht Googlebot manche Inhalte nicht?
Inhalte fehlen fuer Googlebot vor allem dann, wenn sie erst durch eine Nutzeraktion entstehen oder wenn das Rendering scheitert. Da Googlebot weder klickt noch scrollt noch sich anmeldet, bleibt alles unsichtbar, was hinter solchen Aktionen liegt. Die folgenden Ursachen treten in der Praxis am haeufigsten auf und lassen sich fast immer beheben.
- Inhalt nach Klick: Tabs, Akkordeons oder „Mehr laden“-Buttons, deren Inhalt erst nach einem Klick in den DOM gelangt, sieht der Bot nicht.
- Lazy Loading per Scroll: Was erst beim Scrollen nachgeladen wird, fehlt, weil Googlebot nicht scrollt, sondern mit einem hohen Viewport rendert.
- Login oder Paywall: Inhalte hinter einer Anmeldung sind fuer den Crawler unerreichbar, da er sich nicht authentifiziert.
- Blockierte Ressourcen: Per robots.txt gesperrte JavaScript- oder API-Dateien verhindern, dass der Renderer den Inhalt aufbauen kann.
- Render-Fehler: Ein JavaScript-Fehler oder eine zu langsame Schnittstelle laesst das Rendering ins Leere laufen, sodass die Seite leer indexiert wird.
Inhalte, die erst nach einer Nutzerinteraktion wie Klick oder Scroll geladen werden, erfasst Googlebot in der Regel nicht, da der Crawler den Seitenzustand ohne solche Aktionen bewertet.
Wie wirken sich Ressourcen-Limits des Crawlers aus?
Rendering kostet deutlich mehr Rechenleistung als reines HTML-Crawling, deshalb arbeitet Googlebot mit Limits und einer Warteschlange. Die erste Crawling-Phase ist guenstig: Der Bot laedt den HTML und folgt Links. Die zweite Phase, das Rendering mit JavaScript-Ausfuehrung, ist ressourcenintensiv und kann sich verzoegern, weil Google die verfuegbaren Ressourcen ueber das gesamte Web verteilen muss. Inhalte, die ausschliesslich vom Rendering abhaengen, erreichen den Index daher oft spaeter.
Hinzu kommt das Crawl-Budget: die Menge an URLs, die Google fuer eine Domain in einem Zeitraum abruft. Langsame Server, viele Weiterleitungsketten oder unnoetige Parameter-URLs verbrauchen dieses Budget, ohne Mehrwert zu liefern. Eine schnelle Auslieferung des rohen HTML ist deshalb nicht nur ein Tempo-Vorteil, sondern entlastet auch den Crawler. Der Zusammenhang zwischen Ladezeit und Crawl-Effizienz ist eng mit Massnahmen zum Verbessern der Ladezeit einer Seite verknuepft.
Wie unterscheidet sich die Bot-Sicht konkret von der User-Sicht?
Bot-Sicht und User-Sicht weichen in mehreren technischen Dimensionen voneinander ab. Der Browser ist auf einen einzelnen Menschen und maximale Darstellung ausgelegt, der Crawler auf maschinelle Erfassung im grossen Massstab. Die folgende Tabelle stellt die wichtigsten Unterschiede gegenueber und zeigt, wo typische SEO-Probleme entstehen.
| Dimension | Browser (User-Sicht) | Crawler (Bot-Sicht) |
|---|---|---|
| Zweck | Darstellung fuer einen Menschen | Indexierung fuer die Suche |
| JavaScript | sofort ausgefuehrt | verzoegert, in separater Render-Phase |
| Interaktion | Klick, Scroll, Login moeglich | keine Aktion, nur initialer Zustand |
| Ressourcen | fuer einen Nutzer, grosszuegig | Crawl-Budget, ueber das Web verteilt |
| Identitaet | User-Agent des echten Browsers | fester Googlebot-User-Agent |
| Grundlage | gerenderte, interaktive Seite | gerenderter DOM ohne Interaktion |
Wer die Tabelle als Checkliste nutzt, erkennt schnell die Risikostellen: alles, was Interaktion, spaetes Nachladen oder blockierte Ressourcen voraussetzt. Diese Punkte greifen direkt in die Bewertung der Nutzererfahrung ein, die sich unter anderem in den Messwerten der Core Web Vitals niederschlaegt und damit sowohl Nutzer als auch Crawler betrifft.
Wie pruefe ich, was Googlebot statt des Browsers sieht?
Der direkteste Weg ist der Vergleich von rohem Quelltext und gerendertem DOM. Beide getrennt zu betrachten, deckt sofort auf, welche Inhalte erst durch JavaScript entstehen. In fuenf Schritten laesst sich pruefen, ob die Bot-Sicht die wichtigen Inhalte enthaelt.
- Rohen Quelltext oeffnen: Den initialen HTML ohne JavaScript-Ausfuehrung ansehen und nach den Kerntexten und Links suchen.
- Gerenderten DOM abrufen: Mit der URL-Pruefung der Google Search Console den gerenderten HTML und einen Screenshot der Bot-Sicht laden.
- Differenzen markieren: Inhalte identifizieren, die nur nach Klick, Scroll oder Login auftauchen.
- Ressourcen pruefen: Sicherstellen, dass keine benoetigte JavaScript- oder API-Datei per robots.txt blockiert ist.
- Kritisches serverseitig liefern: Wichtige Texte und Links bereits im rohen HTML ausgeben, statt sie erst clientseitig nachzuladen.
Bei wiederkehrenden Render-Problemen empfiehlt Google, Inhalte serverseitig oder vorgerendert auszuliefern und blockierte Ressourcen freizugeben. Die Vorgehensweise zur Fehlerbehebung beschreibt die offizielle Dokumentation im Detail.
Mit dem Tool zur URL-Pruefung in der Search Console laesst sich der gerenderte HTML ansehen, um zu erkennen, ob JavaScript-Inhalte korrekt fuer die Indexierung verarbeitet wurden.
Welche Mythen halten sich ueber Crawler und Browser?
Rund um die Bot-Sicht kursieren Annahmen, die zu falschen Entscheidungen fuehren. Drei davon sind besonders verbreitet und kosten in der Praxis Sichtbarkeit.
Welcher User-Agent gehoert zu Googlebot und wie verifiziert man ihn?
Googlebot identifiziert sich ueber einen festen User-Agent-String, der den Namen Googlebot enthaelt und zwischen einer mobilen und einer Desktop-Variante unterscheidet. Dieser String allein ist jedoch kein Echtheitsbeweis, denn jede beliebige Software kann sich als Googlebot ausgeben. Genau das tun viele Scraper, um Zugriffsregeln zu umgehen, die nur fuer echte Bots gelten sollen.
Die verlaessliche Pruefung erfolgt ueber einen Reverse-DNS-Lookup der zugreifenden IP-Adresse. Loest diese auf eine Domain wie googlebot.com auf und bestaetigt ein anschliessender Forward-Lookup dieselbe IP, ist der Zugriff echt. Diese Verifikation ist relevant, wenn man Bots gezielt anders behandeln will als Nutzer, etwa beim Logging oder beim Schutz von Ressourcen. Wichtig: Inhalte je nach Besucher unterschiedlich auszuliefern, gilt als Cloaking und verstoesst gegen Googles Richtlinien.
Googlebot ist der Web-Crawler, mit dem Google Dokumente fuer den Suchindex sammelt, und arbeitet sowohl mit einer Desktop- als auch mit einer mobilen Variante.
Wie baut man Seiten, die fuer Crawler und Browser funktionieren?
Die sicherste Strategie liefert die wichtigsten Inhalte bereits im rohen HTML aus, statt sie ausschliesslich clientseitig zu erzeugen. So sehen Browser und Crawler dieselben Kerntexte und Links, unabhaengig vom Rendering-Erfolg. JavaScript bleibt erlaubt, sollte aber Inhalte ergaenzen statt sie zu ersetzen. Dieses Prinzip wird als progressive Verbesserung bezeichnet und reduziert die Abhaengigkeit von der verzoegerten Render-Phase.
Konkret heisst das: serverseitiges Rendering oder statisches Vorrendern fuer Inhaltsseiten, echte Links mit href-Attribut statt klickbarer Elemente ohne Ziel, und Texte, die ohne Interaktion im DOM stehen. Wichtige Ressourcen duerfen nicht per robots.txt blockiert sein, damit der Renderer die Seite vollstaendig aufbauen kann. Diese Massnahmen kosten einmalig Aufwand, machen die Bot-Sicht aber robust und sorgen dafuer, dass die Seite indexiert wird, wie sie im Browser erscheint.
Haeufige Fragen zu Crawler vs Browser
Was ist der Unterschied zwischen Crawler und Browser?
Ein Browser laedt eine Seite fuer einen Menschen, fuehrt JavaScript sofort aus und stellt das Ergebnis visuell dar. Ein Crawler wie Googlebot ruft Seiten automatisiert ab, um sie zu indexieren. Er rendert JavaScript nur in einem separaten, ressourcenbeschraenkten Schritt und ohne Klicks, Scrollen oder Cookies eines echten Nutzers.
Wie sieht Googlebot eine Webseite?
Googlebot ruft zuerst den rohen HTML-Quelltext ab. In einer zweiten Phase rendert der Web Rendering Service die Seite mit einer aktuellen Chromium-Engine und fuehrt dabei JavaScript aus. Erst der gerenderte DOM bildet die Grundlage fuer die Indexierung. Inhalte, die erst nach einem Klick erscheinen, sieht Googlebot in der Regel nicht.
Warum sieht Googlebot Inhalte nicht, die im Browser sichtbar sind?
Inhalte fehlen fuer Googlebot meist, wenn sie erst nach einer Nutzeraktion wie Klick, Scroll oder Login erscheinen, wenn benoetigte JavaScript- oder API-Ressourcen blockiert sind oder lange laden, oder wenn das Rendering an einem Fehler scheitert. Googlebot scrollt nicht, klickt nicht und meldet sich nicht an, sondern bewertet nur den gerenderten Zustand der initialen URL.
Fuehrt Googlebot JavaScript aus?
Ja, Googlebot fuehrt JavaScript aus, aber nicht beim ersten Abruf. Das Rendering laeuft in einem zweiten Schritt ueber den Web Rendering Service auf Basis einer aktuellen Chromium-Version. Dieser Schritt ist ressourcenintensiver als reines HTML-Crawling und kann sich verzoegern. Inhalte sollten daher nicht ausschliesslich von clientseitigem JavaScript abhaengen.
Wie pruefe ich, was Googlebot sieht?
Das Tool zur URL-Pruefung in der Google Search Console zeigt den gerenderten HTML-Code und einen Screenshot, wie Googlebot die Seite verarbeitet hat. Zusaetzlich laesst sich der rohe Quelltext mit dem gerenderten DOM vergleichen, um zu erkennen, welche Inhalte erst durch JavaScript entstehen und ob alle wichtigen Elemente fuer den Bot vorhanden sind.
Welcher User-Agent gehoert zu Googlebot?
Googlebot identifiziert sich ueber einen festen User-Agent-String, der das Wort Googlebot enthaelt und auf eine mobile oder Desktop-Variante hinweist. Echtheit laesst sich nicht am String allein pruefen, da dieser faelschbar ist, sondern ueber einen Reverse-DNS-Abgleich der zugreifenden IP-Adresse auf eine von Google bestaetigte Domain.
