Rezension: Einführung in Apache Solr

Veröffentlicht von am 31. Mai 2014 in Buchrezensionen

Buch Einführung in Apache SolrDas Buch „Einführung in Apache Solr“ von Markus Klose und Daniel Wrigley ist im März 2014 erschienen. Das Buch vom O’Reilly® Verlag wurde uns netterweise vom Verlag zur Verfügung gestellt. Das Buch ist in deutscher Sprache.

Nach der Erklärung, was Apache Solr ist und der üblichen Beschreibung der Geschichte geht es schon los mit der Installation. Und die ist einfach mal reibungslos verlaufen. Das liegt zum Einen daran, dass diese auch einfach durchzuführen ist zum Anderen aber auch an der einfachen Sprache der Autoren, die die Schritte für Windows und Linux sehr gut aufzählen.

Im Zweiten Kapitel werden grundsätzliche Dinge zu Apache Solr erklärt, die man gleich mit der eigenen Installation ausprobieren kann und auch hier funktionieren die Beispiele alle: Indexieren von Dateien, Suchen im Index, Echtzeitsuche… Ich lerne, dass Apache Solr out-of-the-box schon ziemlich viel mitbringt wie z.B. die Indizierung verschiedener Dateien, Datenbanken, der Wikipedia und mehr. Dann wird aufgezeigt, wie man mit booleschen Operatoren und Wildcards in den Indizes suchen kann. Viele davon funktionieren auch in gängigen Suchmaschinen – da muss man also Nichts zwei Mal lernen 🙂

Mein liebstes Kapitel ist Kapitel 3: Den Index konfigurieren. Das Buch wollte ich nämlich unbedingt lesen, da ich mit Apache Lucene arbeiten musste und ich bei der Menge an Tokenizern und Tokenfiltern einfach nicht herausbekommen konnte, wie ich den Index am besten so vorbereiten kann, dass alle gewünschten Werte gefunden werden. Auch wenn dieses Kapitel recht kurz ist mit ca. 40 Seiten, sind diese extrem informativ. Vor allem die Tabellen mit den Input und Output Werten, die in den Index geschrieben werden, sind sehr anfängertauglich mit guten Beispielen gestaltet. Aber auch die erklärenden Absätze in welchen Fällen man die Tokenizer und Tokenfilter einsetzen kann, sind sehr hilfreich. Etwas schade finde ich, dass die Autoren sich in ihren Konfigurationsbeispielen auf Zeilennummern beziehen, diese Nummern aber nicht neben den Zeilen stehen. Glücklicherweise sind die meisten dieser beispiele recht kurz – dann muss man halt mal bis 20 zählen.

Was Apache Solr von Haus aus mitbringt an Such-Features, die wir heutzutage als Standard hinnehmen wie z.B. dem Benutzer Suchbegriffe vorschlagen, Suchergebnisse spezialisieren, ähnliche Ergebnisse finden, Treffer farblich markieren und noch mehr beschreiben die Autoren ebenfalls.  Die Konfigurationen werden von den Autoren nicht nur einfach aufgelistet sondern auch der Einsatz und die Auswirkung wird mit ein paar Sätzen gut beschrieben.

In den letzten Kapiteln werden tiefer gehenden Themen wie „Scoring und Relevanz beeinflussen“ und „Skalierung der Suche“ angegangen.

Das Buch hat sich für mich als extrem hilfreich erwiesen. Ich tat mich mit der Implementierung von Apache Lucene so schwer und obwohl das Buch Apache Solr behandelt, das Apache Lucene benutzt, konnte ich die Informationen viel besser aufnehmen und umsetzen als von der online Dokumentation zu Lucene selbst. Ich denke jeder, der mit Apache Solr oder Apache Lucene Schwierigkeiten hat, sollte sich dieses Buch ansehen. In Richtung Lucene sollte man aber nicht zu viel erwarten, das war mein persönlicher Gewinn 🙂 Aber Apache Solr wird in diesem Buch sehr gut dokumentiert und es ist eine perfekte Starthilfe in das umfangreiche Spektrum von Suchtechnologien.

 

Schreibe einen Kommentar zu Jens Bretschneider Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  1. Markus Klose sagt:

    Hallo allerseits,

    ich bin gerade – zwar spät aber besser als nie – auf eure nette Rezension gestoßen. Vielen Dank dafür.

    Danke auch für die Hinweise und Verbesserungsvorschläge. Zeilennummern … hätte ich auch selbst drauf kommen können. 🙂

    Falls es weitere Anmerkungen gibt, gerne per Mail bei mir melden.

    Ich hoffe das Buch macht noch immer Spass.

    Grüsse aus Augsburg
    Markus Klose