Newsletter 12/2003 – Umsetzung der Suchfunktion für die eigene Site

Im letzten Newsletter ging es darum, wie Sie die Suchfunktion Ihrer Site optimal anlegen. Diesmal wenden wir uns der Technik zu: Wie kommt die Suchfunktion auf die Site? Das ist einfacher, als Sie denken.

Technische Möglichkeiten

Für die Suchfunktion auf der eigenen Site haben Sie zwei Möglichkeiten: Sie greifen auf einen Provider zurück, der die Funktion über seinen Server zur Verfügung stellt, oder Sie installieren die dazu nötigen Programme bzw. Skripts auf dem eigenen Server.

1) Externe Suchmaschine

Nehmen Sie einen Dienstleister in Anspruch, besuchen dessen Suchroboter Ihre Site und legen einen Index mit den gefundenen Begriffen an. Diesen durchsuchen sie, wenn ein Benutzer eine Frage in das Suchfeld eingibt, das Sie auf Ihren Seiten einbauen. Zurückgeliefert wird eine Seite mit allen Dokumenten Ihrer Site, für die auf die Anfrage passende Indexeinträge gefunden wurden.

Vorteil dieser Variante ist, dass Sie keine Skripts oder Programme auf Ihrem Server installieren müssen. Die Suche wird komplett über den Server des Dienstleisters abgewickelt. Das heißt aber auch, dass Ihre Besucher zwischenzeitlich auf der Site der Suchmaschine landen, wenn sie die Ergebnisseite ansehen. Das fällt aber kaum auf, und wird auch sicher von den meisten Benutzern akzeptiert. Außerdem sind die Ergebnis-Seiten bei den kostenlosen Angeboten sowieso stets mit dem Logo der Suchmaschine geschmückt. Gegen eine Monatsgebühr zwischen 5 und über 1.000 Euro (!) kann man sich bei den Dienstleistern von dieser und anderen Einschränkungen befreien. Wichtigste ist die Begrenzung der Zahl beziehungsweise der Gesamtgröße der indizierten Seiten. Geht Ihre Site über das Limit der Suchmaschine hinaus, indiziert der Robot nur einen Teil der Seiten. Das Limit liegt zwischen 400 und 1.500 Seiten bzw. 32 MB (siehe Tabelle weiter unten).

Einrichtung

Alle folgenden Beispiele sind in der Grundversion kostenlos, erfordern aber eine Registrierung. Diese ist online in wenigen Minuten erledigt.

Sie erhalten einige Zeilen HTML, die Sie dort in Ihre Seiten einbauen, wo Sie die Suchfunktion haben möchten. Sie sehen dann ein Eingabefeld, einen „Suchen!“-Knopf und das Logo des Suchmaschinen-Providers auf der Seite.

Wie häufig Ihre Seiten von den Suchrobotern besucht und indiziert werden, ist unterschiedlich. Es sollte möglichst oft sein, damit die Einträge im Index der Suchmaschine auch dem aktuellen Inhalt Ihrer Seiten entsprechen. Wichtig ist die Möglichkeit, sofort eine Neuindizierung zu starten – was nicht bei allen Anbietern geht.

Alle stellen einfache Einstellungsmöglichkeiten per Browser bereit, so dass Sie bei geringem Anspruch an Aussehen und Qualität der Ergebnislisten fast ohne HTML-Kenntnisse und in ein paar Minuten die Suchfunktion in Ihre Site integrieren können. Bei den meisten Suchdiensten können Sie auch in der kostenlosen Variante eigene Vorlagen (templates) für die Ergebnisseiten anlegen.

Sie sollten die paar Stunden investieren, um die Suchfunktion so gut wie möglich auf die Bedürfnisse Ihrer Benutzer anzupassen. Sonst kann die Suchmaschine mehr Schaden stiften als Nutzen – und der Usability-Experte Jared Spool ist wieder in seiner Meinung bestätigt: „On-site search stinks!“ (Siehe dazu den letzten Newsletter vom November!)

Nun einige Suchdienstleister mit kostenloser Grundversion und leicht nachvollziehbarer Einrichtung im Test. Unter https://www.benutzerfreun.de/suchtest.html können Sie alles selbst mit der Site benutzerfreun.de ausprobieren.

Auswahlkriterien für Suchdienste & -Skripte

Achten Sie bei der Auswahl auf Folgendes:

  • Design & Text der Ergebnisseiten anpassbar

  • dem Aktualisierungs-Intervall der Site entsprechende Indizierungs-Häufigkeit

  • Indizierung der relevanten Dokumenttypen (html, doc, pdf…)

  • Logfiles, um die Suchwörter der Benutzer einzusehen

  • Indizierung von Frames und dynamischen Seiten, wenn verwendet

  • Unterstützung der Sprachen, in denen die Texte Ihrer Site verfasst sind

  • Unterstützung von Zahlen und Umlauten

  • Indizierung des Meta-Tags KEYWORDS

Atomz

Atomz gibt die Ergebnisse auf Wunsch mit Sternchen und einem Prozentwert entsprechend ihrer Relevanz aus. Teile der Seite, auf denen die Suchworte auftauchen, werden in der Liste angezeigt. Das Änderungsdatum der Dokumente kann ebenfalls mit aufgeführt werden. Bei Atomz haben Sie die umfangreichsten Einstellungsmöglichkeiten für solche Details bei der Ausgabe der Treffer – und auch beim Design.

Die Suchergebnisse schienen mir beim Test mit der Site benutzerfreun.de am besten zu sein. Positiv auch, dass Atomz die Navigations-Links nicht indiziert – die anderen Suchmaschinen machen dies schon. Das führt dazu, dass Seiten in der Trefferliste weit vorne auftauchen, die lediglich einen Link zu einer Seite enthalten, die den gesuchten Inhalt erhält. (Beispiel: Suchen Sie unter https://www.benutzerfreun.de/suche.html mit Picosearch oder Google nach „Sitemaps“ – 26 Treffer, wo Atomz sinnvollerweise nur 7 findet.)

Der Suchroboter indiziert Schlüsselwörter (Keywords), auch wenn sie nicht im Seitentext vorkommen.

Ausschalten sollte man im Konfigurationsmenü bei Atomz die Option „Sound-Alike Matching“. Denn sonst findet die Suche nach „Hesse“ auch „Hause“ und „Haus“.

Atomz machte auf mich insgesamt den besten Eindruck aller Testkandidaten.

Crawl-it

Der einzige mir bekannte kostenlose Dienst, dessen Adminstrations-Seiten deutsch sind.

Die Einstellungsmöglichkeiten für die Ergebnislisten bei Crawl-it sind gut. Sie können auf Wunsch sogar eine Sitemap mit erzeugen lassen. Die Anpassungsmöglichkeiten der Gestaltung sind umfassend, nur das Werbebanner ist etwas zu grellgrün und blinkt aufdringlich.

Leider werden in den Ergebnislisten bei den Ausschnitten aus dem Seitentext die Umlaute ersetzt (dort steht dann „fuer“ statt „für“). Die Suche funktioniert aber korrekt.

Dreimal pro Monat können Sie eine Neuindizierung Ihrer Seiten veranlassen, wenn Sie etwa größere Änderungen vorgenommen haben.

FreeFind

Auch FreeFind bietet die automatische Sitemap und außerdem eine automatisch erstellte Seite mit kürzlich erstellen bzw. veränderten Seiten der Site – eine nette Funktion.

Zwar können hier eigene Vorlagen verwendet werden, aber dennoch sind die Anpassungsmöglichkeiten der Trefferlisten etwas eingeschränkt. Oberhalb der Suchergebnisse werden Werbe-Links zu fremden Seiten eingebunden.

Bei der Suche nach mehreren Begriffen enthält der Textausschnitt, der auf der Trefferseite angezeigt wird, nicht immer den besten Treffer – obwohl die Suchergebnisse stimmen.

Der Suchroboter indiziert Schlüsselwörter (Keywords), auch wenn sie nicht im Seitentext vorkommen.

Google

Die beliebteste Suchmaschine Google können Sie auch für Ihre Site nutzen. Die Ergebnis-Seite lässt sich aber kaum verändern, der typische Google-Look bleibt. Die Liste ist übersichtlich und durch die zweizeiligen Ausschnitte aus den Seiteninhalten finden die Benutzer schnell heraus, ob die Treffer das Gesuchte enthalten.

Negativ fallen die bezahlten Links auf. Wie auf allen Google-Seiten erscheinen am rechten Rand der Trefferliste Kästen mit Links zu kommerziellen Sites, die etwas mit den Suchbegriffen zu tun haben. Das kann unter Umständen Besucher direkt zur Konkurrenz locken.

Eine manuelle Neuindizierung ist bei Google nicht möglich.

Picosearch

Die Trefferlisten sind sauber formatiert, das Logo passt sich sicher in die meisten Seiten gut ein. Allerdings sind die Anpassungsmöglichkeiten der Gestaltung eingeschränkt. Bei manchen Begriffen erscheinen bezahlte Links rechts von der Trefferliste.

Bei Picosearch haben Sie viele Kontrollmöglichkeiten darüber, wie der Index angelegt wird. Sie können zum Beispiel eigene „Stopwords“ eingeben, das heißt Wörter, die bei der Suche ignoriert werden. (Sinnvoll für „der“, „die“, „das“, „was“, „ist“ usw.)

Leider wird in den Ergebnislisten bei den Textausschnitten aus den Trefferseiten die Groß- und Kleinschreibung verfälscht (nur das erste Wort jedes Satzes ist groß geschrieben).

Übersicht des Vergleichs der Suchdienst-Anbieter

Atomz

Crawl-it

FreeFind

Google

PicoSearch

Indizierungs-
intervall

wöchentl. & auf Anfr.

monatl. & max. 3xpro Monat auf Anfr.

tägl., wöchentl., monatl. & auf Anfr.

monatl.

auf Anfr.

Limit

500 Seiten

400 Seiten

32 MB

k.A.

1.500 Seiten

Anpassung Layout

eigene Vorlage, maximal

eigene Vorlage

eig. Vorl., eingeschr.

sehr eingeschr.

eingeschr.

Logfiles

ja

ja

ja

eingeschr.

Indizierg. Keywords (Meta-Tag)

ja

ja

2) Suchmaschine auf dem eigenen Server

Liegt die eigene Website auf einem Server, auf dem das Ausführen von CGI-Skripts erlaubt ist, kann man auf eine Vielzahl kostenloser Skripts zur Suche zurückgreifen. Diese werden auf dem Server installiert, und so ist man ganz Herr im Haus und muss weder für den Dienst zahlen noch Beschränkungen bei der Gestaltung bzw. Werbeeinblendungen hinnehmen.

Allerdings ist dafür deutlich mehr Fachwissen erforderlich, da die Installation von solchen Skripts nicht ganz einfach ist. Auch für die Sicherheit der Suchmaschine und eventuell dadurch entstehende Probleme ist man dann selbst verantwortlich.

Betreibt man eine Site mit Content-Management-System, kann man oft auf eine darin integrierte Suchfunktion zurückgreifen. Falls man dynamische Seiten erstellt, deren Inhalte aus einer Datenbank kommen, gibt es auch dafür kostenlose Skripts, mit welchen sich eine Suchmaschine realisieren lässt. (Mehr dazu siehe Links.)

Links

www.searchtools.com/search/search.html
Umfassende Übersicht und Testseiten verschiedener Suchmaschinen-Provider.

www.searchtools.com/guide/index.html
Wegweiser zur Auswahl der Suchmaschine, mit Hinweisen zu Skripts.

www.atomz.com
Atomz

www.crawl-it.de
Crawl-it

www.freefind.com
Freefind

http://www.google.de/cse/
Google Free SiteSearch

www.picosearch.com
Picosearch

————————————————————————-
(c) Jens Jacobsen 2003

Bei Weiterleitung oder Zitat bitte Quellenangabe („Quelle:
benutzerfreun.de-Newsletter Dezember 2003“).

————————————————————————-

Schreibe einen Kommentar