SHI-Blog

Wissenswertes aus dem Software-Universum

How-Tos, Knowhow und Praxistipps: Unsere Blogreihe versorgt Sie mit bunt gemischtem IT-Wissen – informativ, topaktuell und mit echtem Mehrwert.

Apache Solr goes JSON

Liest man die einschlägigen Dokumentationen zu Apache Solr, wird man immer wieder auf das sogenannte Solr XML stoßen. Mit diesem speziellen XML Format kann der Index leicht manipuliert werden. Viel mehr geht damit aber auch nicht. Seit einigen Versionen gibt es in Solr eine JSON API mit der man ebenfalls den Index manipulieren, aber auch […]

Weiterlesen

Solr 5 – Startskripte jetzt noch einfacher

Das Starten von Solr-Instanzen war in der Vergangenheit oftmals nicht ganz vorbereitungslos zu bewerkstelligen. Die Schuld daran trugen vornehmlich die vielen, oft kryptisch wirkenden Parameter, deren Angabe obligatorischer Bestandteil des Solr-Startkommandos war. Verständnisprobleme, Fehlinterpretationen und Tippfehler seien hier nur als einige der Nachteile einer solchen Parameterliste genannt. Doch frustrierte Solr-Nutzer können nun aufatmen: Die 5.x-Versionen […]

Weiterlesen

Customer Journey Analytics im E-Commerce

Anfangen, die Kunden kennen zu lernen Die Customer Journey ist ein in Marketingkreisen häufig genannter Begriff, der den Weg eines Kunden bis zum Kaufabschluss beschreibt. Nicht nur Global Player wie Amazon analysieren diese, um ihre Kunden besser zu verstehen und dieses Wissen gewinnbringend einsetzen zu können. Es handelt sich hierbei um ein zentrales Thema, sodass […]

Weiterlesen

Apache Solr Indexe OHNE Re-Indexierung

Apache Lucene/Solr Indexe OHNE Re-Indexierung auf die neuste Version bringen Mit jeder neuen Version von Apache Solr gibt es neue tolle Features und Verbesserungen, von denen man gerne profitieren möchte. Oft bedeutet dies, dass man den Index komplett neu aufbauen (re-indexieren) muss. Dieses bei jedem neuen Solr Release durchzuführen ist natürlich nicht praktikabel. So treffen […]

Weiterlesen

Multiword SpellCheck

Multiword SpellCheck in Apache Solr unter Verwendung des Shingle-Filters Ein oftmals auftretendes Problem in Solr ist die Verwendung der SpellCheckComponent (Meinten Sie …) bei der Überprüfung mehrerer aufeinanderfolgender Begriffe, beispielsweise hinsichtlich der Begriffskombination „biig bang theory“.Die meisten Konfigurationen wenden die SpellCheckComponent in Solr auf einzelne Begriffe an. Sofern eine Query mit mehreren Begriffen an Solr […]

Weiterlesen

Past Solr Highlights

Die Entwicklung von Open Source Projekten schreitet oftmals rasant voran. Apache Solr bildet hier keine Ausnahme, sondern bestätigt diese Aussage ganz klar mit Release-Zyklen, die oftmals im Bereich von sechs bis acht Wochen liegen. Mit über einem Dutzend Releases in seit Anfang 2014 ist diese These nicht aus der Luft gegriffen, sondern auch mit Fakten […]

Weiterlesen

Wie neutral ist medienneutral?

„Unser Redaktionssystem verspricht medienneutrale Datenhaltung mittels XML – aber was dabei herauskommt ist in Wahrheit gar nicht medienneutral.“ Solche oder ähnliche Aussagen bekommt man öfter zu hören, sie geben die gelebte praktische Erfahrung in vielen Verlagen wieder.Schon seit vielen Jahren beschäftigen sich die Verlage landauf landab mit den Herausforderungen der sogenannten „Single-Source“-Produktion. Derzeit erhält das […]

Weiterlesen

Log Visualisierung mit Lucidworks Fusion – Alles unter einem Dach

„Daten sind wie Rohöl!“ – Es steckt viel Potenzial in ihnen, aber man muss es erst herausholen.Heutzutage wird für die „Veredlung“ von Daten oft auf Software wie Splunk oder Nagios zurückgegriffen. Mit solchen Tools können Daten, wie beispielsweise Log Dateien, verarbeitet und vor allem visualisiert werden, d.h. mit Diagrammen, Charts usw. können beispielsweise Trends besser […]

Weiterlesen

Schema vs. Schemaless vs. Managed Schema

Schema vs. Schemaless vs. Managed Schema – „Was ist was?“ und „Was passt am besten zu meiner Suche?“ Für eine gute Suche ist die Qualität des Indexes extrem wichtig. Die Qualität des Index setzt sich zum einem aus der Datenqualität und zum anderen aus der Verarbeitung der Daten während der Indexierung bzw. Suche zusammen. Diese […]

Weiterlesen

Ab wann lohnt sich die Investition in ein Fachportal?

Die Frage nach dem Return on Invest stellt sich jedem Verlag, der sich mit dem Gedanken trägt, ob er vorhandene Printprodukte durch ein Online-Fachportal ergänzen soll. Dabei spielt es keine grundsätzliche Rolle, ob das Printprodukt wie ein Loseblattwerk oder eine Fachzeitschrift laufend aktuelle Inhalte liefert, oder ob es sich um ein regelmäßig durch Neuauflagen aktualisiertes […]

Weiterlesen