SHI-Blog

Wissenswertes aus dem Software-Universum

How-Tos, Knowhow und Praxistipps: Unsere Blogreihe versorgt Sie mit bunt gemischtem IT-Wissen – informativ, topaktuell und mit echtem Mehrwert.

Solr Ping Request Handler – mehr als nur Status prüfen

Wozu brauch man eigentlich den Solr PingRequestHandler? Diese Frage wird oft gestellt, denn um den Status eines SolrCore zu ermitteln kann man auch eine „normale“ Suchanfrage absetzen und das Ergebnis auswerten. Der PingRequestHandler wird im Allgemeinen unterschätzt. In diesem Blog werde ich auf PingRequestHandler und seinen Einsatz genauer eingehen. Der PingRequestHandler JA, der PingRequestHandler prüft […]

Weiterlesen

Solr ist Schemaless

Beim Vergleich von Solr mit Elasticsearch wird fast immer darauf hingewiesen, dass Elasticsearch schemaless ist. „Schemaless“ bedeutet, dass man direkt, ohne eine vorhergehende Konfiguration, mit der Indexierung loslegen kann und dass das Framework das Mapping von Daten zum Datentyp übernimmt. Bei Solr hingegen muss man immer erst die schema.xml-Datei anpassen, bevor man eigene Daten indexieren kann.Seit […]

Weiterlesen

Cluster Monitoring mit Elasticsearch-head

Die Standardinstallation von Elasticsearch kommt ohne Admin-Oberfläche daher. Dies ist auch völlig ausreichend für den einfachen Betrieb einer Elasticsearch-Installation oder auch für die Entwicklung von neuer Suchfunktionalität. Für den administrativen Betrieb und für die Überwachung eines Clusters bietet Elasticsearch zwar viele APIs, die entsprechende Informationen als JSON-Objekte bereitstellen, jedoch reicht das nicht, um sich einen […]

Weiterlesen

Shard Splitting in Solr

Eines des größten Mankos bei der SolrCloud war das Fehlen der Möglichkeit bestehende Indexe zu teilen, wenn diese zu groß und somit bei der Suche zu inperformant geworden sind. In so einem Fall blieb nur den Index komplett neu aufzubauen, was im schlimmsten Fall zu einer Downtime der Suche führen konnte. Mit dem Solr Release […]

Weiterlesen

Solr Analysekette – Stemming

Solr findet Treffer anhand eines Suchbegriffs, wenn sich der Suchbegriff mittels festgelegter Analysekette in einen Term zerlegen oder transformieren lässt, der einem Element des Index entspricht. Die Elemente des Index laufen vor der Indexierung ebenfalls durch einen Analyseprozess durch. Dieser Analyseprozess wird in der Konfigurationsdatei schema.xml für jeden Feldtypen definiert und beinhaltet genau einen Tokenizer und optional […]

Weiterlesen

Tipp – Solr ZooKeeper CLI / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls”

Wie bereits in einem vorangegangen Artikel “Tipp – Mehrere Collections in einer SolrCloud verwalten” angedeutet, bietet Solr die Möglichkeit mit dem ZooKeeper über eine im Solr integrierte Command Line API zu kommunizieren. Die Möglichkeiten, die uns hier geboten werden, möchte ich in diesem Beitrag näher beleuchten. Mir der im Solr intergierten ZooKeeper CLI können relevante Operationen abgedeckt […]

Weiterlesen

PHP Logging mit Apache log4php

Für PHP existieren verschiedene Logging Frameworks. Vom eher einfachen kLogger über Zend_Log, welches in das bekannte Zend Framework inkludiert ist, bis zu Apache log4php. In diesem Beitrag möchte ich den Apache log4php kurz vorstellen. Kleiner Projektsteckbrief: Entwicklung: Apache log4php ist ein Teilprojekt vom Apache Logging Services Projects, welches für die Entwicklung und Betreuung zahlreicher bekannter […]

Weiterlesen

Tipp – Mehrere Collections in einer SolrCloud verwalten

Die meisten Konfigurationen und Beispiele zur SolrCloud, die man in der Literatur findet, gehen davon aus, dass man pro Solr Instanz nur einen Core hat und somit in der SolrCloud auch nur eine einzige Collection existiert. Dass dies nicht zwingend so sein muss, habe ich bereits in den vergangenen Artikeln angedeutet. Nun möchte ich aufzeigen, […]

Weiterlesen

Apache Solr in PHP Projekten

Längst hat der Suchserver Solr auch das PHP Umfeld erobert.Für alle gängigen Content-Management-Systeme wie TYPO3, Drupal oder Joomla! existieren Erweiterungen, um eine komfortable Anbindung des jeweiligen Systems an Solr zu bewerkstelligen. Aber wie ist vorzugehen, wenn in einem PHP Projekt kein CMS-Bolide zum Einsatz kommt und die Solr Anbindung individuell umgesetzt werden muss? Dem Entwickler […]

Weiterlesen

Externe Zookeeper

Externe Zookeeper / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls” Wie bereits beschrieben, kann die SolrCloud sowohl mit integriertem ZooKeeper als auch mit einem externen ZooKeeper (Ensemble) betrieben werden. Bei der Funktionalität der SolrCloud gibt es bei diesen beiden Möglichkeiten keine Unterschiede; technisch gesehen, bieten externe ZooKeeper die Möglichkeit die Ausfallsicherheit zu […]

Weiterlesen