How-to: Mit Elasticsearch Webinhalte in Magnolia CMS indexieren

How-to: Mit Elasticsearch Webinhalte in Magnolia CMS indexieren

Die Qualität der Web-Suchfunktion kann darüber entscheiden, wie lange ein User auf der Website verweilt. Insbesondere auf Webseiten mit großen und verschiedenartigen Datenmengen sind Suchmaschinen ein ausschlaggebender Faktor und stellen Content Management Systeme wie beispielsweise Magnolia CMS immer wieder vor Herausforderungen. Website Suchmaschinen existieren bereits seit vielen Jahren und sind elementare Bestandteile jeder Web- oder E-Commerce Site, doch erst eine gut durchdachte Suchlogik mit einem angemessenen Spektrum an Möglichkeiten und der guten Qualität der Suchergebnisse bedient die wachsenden Ansprüche des Users.

Suchmaschinen in Magnolia CMS

Magnolia CMS wird auf einem Tablet bedient

Magnolia CMS unterstützt derzeit zwei Suchmaschinen. Eine davon ist die standardmäßig eingebaute Suche, wobei die Daten aus dem Java Content Repository (JCR) in einem Apache Lucene-basierten Indexer abgelegt werden. Hierbei stößt man jedoch relativ schnell an Grenzen. Die zweite ist das Apache Solr Plugin, welche ebenfalls auf Apache Lucene beruht und deutlich mehr Funktionen und Möglichkeiten bietet. Neben Solr ist Elasticsearch eine der weltweit führenden Enterprise Suchmaschinen. Apache Solr als auch Elasticsearch verfolgen das gemeinsames Ziel, das beste Ergebnis für eine Suchanfrage auszuliefern.

Auch auf seitens der Kunden der Neofonie erfreut sich die Kombination von Magnolia CMS mit Elasticsearch wachsender Beliebtheit. Das war für ein Entwicklerteam der Neofonie Grund genug, ein Elasticsearch-Magnolia-Modul zu entwickeln. Das technisches Konzept sieht vor, Magnolia Autoren- und Public-Instanzen mit mehreren Elasticsearch Instanzen zu verbinden, um die Speicherung von Inhalten und Mediendateien im Index zu ermöglichen und diesen der Website Suchmaschine und somit dem User wieder zur Verfügung zu stellen.

Indexierung und Inhaltssuche in Magnolia mit Elasticsearch

Wie Inhalte in Magnolia mit Elasticsearch indexiert und gesucht werden können, zeigt die folgende Schritt-für-Schritt Anleitung. Als Beispiel kommen Tourdaten der bekannten Magnolia Reise Demo zum Einsatz.

  1. Die Configuration App öffnen und einen neuen Index zu /modules/neofonie-module-elasticsearch/config/indexJob hinzufügen
  1. Den example pages index job kopieren und die Einstellungen anpassen. Dabei den workspace und den docType auswählen.

2.1 In targets können diverse Indexer definiert werden, standardmäßig ist localhost:9200 (Kopie von pages) eingestellt

2.3 In exclude kann eingestellt werden, welche Felder, Bereiche oder Komponenten nicht indexiert werden solle

  1. Field mappings konfigurieren
    Diese Information wird verwendet, um in Elasticsearch das mapping schema zu erzeugen. Angegebene Feldnamen werden standardmäßig mit dem gleichen Namen als Datentyp String im Elasticsearch index abgelegt. Folgenden Optionen sind möglich:

3.1 type: der gewünschte Datentyp für das Feld

3.2 magnoliaType: Im Fall eines special type wird aktuell uuid unterstützt und ist für die Verwendung mit Magnolia uuids gedacht. Im Fall mehrerer uuids werden diese als ein Array an Elasticsearch übertragen und nicht als verknüpften String.

3.3 elasticsearchName: Feldname in Elasticsearch

3.4 Jedes weitere Feld, welches als Mapping-Parameter in Elasticsearch verwendet wird, wie z.B. index mit dem Wert not_analyzed oder include_in_all mit dem Wert false. Weitere Details auf elastic.co.

  1. Wenn Sie die Option cron hinzufügen, wird der Index jedes Mal aktualisiert, in diesem Beispiel alle 10 Minuten. Die Syntax ist ähnlich wie bei cron unter Linux und es können auch Angaben in Sekunden gemacht werden.
  2. Eine neue Seite aus dem Template Elasticsearch Results hinzufügen.

5.1 Workspace konfigurieren

5.2 Elasticsearch Felder dem Template zuweisen

  1. Kategorie Facette hinzufügen
  1. Fertig

Elasticsearch Modul für Magnolia CMS

Mit dem Elasticsearch Modul für das Content Management System Magnolia CMS können über eine einfache Schnittstelle Textdateien und Daten einfach indexiert und performant in individuellen Suchergebnisslisten ausgespielt werden. Damit gelangt der Website-Nutzer schneller zum gewünschten Suchobjekt.

Veröffentlicht am 20. Januar 2017, aktualisiert am 12. Oktober 2020

Teilen auf
Ender Özgür

Ender Özgür

Ender Özgür hat Informatik an der TU Berlin studiert. Er verantwortet als Head of Software Factories bei Neofonie die moderne Umsetzung von Entwicklungsprojekten. Neofonie entwickelt individuelle, digitale Lösungen und bietet Beratung, Konzeption, Design, Entwicklung und Betrieb aus einer Hand. Zu den Kunden zählen der Wort & Bild Verlag, Audi, Leica, Rausch und Super RTL.

Container wird hochgehoben

Docker-Container als ideales Software-Transportmittel

Webprojekte werden immer komplexer und die Halbwertszeit der Technologien, die dabei zum Einsatz kommen, werden immer kürzer. Für die Softwareentwicklung ist die Containertechnologie von Docker ein ideales Transportmittel.

Corona-Reise-Check auf Shortlist für Deutschen Digital Award

In der Kategorie „Digital for Goods“ ist der Corona-Reise-Check des Wort & Bild Verlages für den Deutschen Digital Award 2021 nominiert. Der Bundesverband Digitale Wirtschaft e.V. hat in einer Shortlist die Vorauswahl getroffen.

Corona-Reise-Check-Preview

Neofonie entwickelt Corona Reise-Check App

Die Covid-19 Pandemie verursacht u.a. im Bereich Reisen große Verunsicherung. Die Corona-Reise-Check-App begegnet der Unsicherheit mit Transparenz.

EHealth_news

Neofonie weitet Fokus auf E-Health-Bereich aus

Als neues Verbandsmitglied der VerDiGes setzt die Berliner Digitalagentur Neofonie einen neuen unternehmerisch-strategischen Schwerpunkt im E-Health Umfeld und positioniert sich damit noch klarer als Full-Service Technologiedienstleister im Gesundheitsmarkt.

ION ONE: UX-Workshop für Food-Branche

Die UX-Agentur ION ONE unterstützt Unternehmen aus der Lebensmittelbranche mit einem kostenfreien UX-Workshop dabei, ihre Produkte authentisch und emotionalisierend zu inszenieren, um Nutzer zu begeistern und zum Kauf anzuregen.

Textmining_ontolux_NER

Neue Legal NER Komponente in TXTWerk

Mithilfe von Legal NER können juristische Textbausteine, beispielsweise Paragrafen, erkannt und automatisiert extrahiert werden. So lassen sich Texte in den Bereichen Steuern, Finanzen und Recht strukturieren und für die maschinelle Weiterverarbeitung aufbereiten.

Berliner Wirtschaft: Per Klick zum Onlinehändler

Die „Berliner Wirtschaft“ betrachtet die Berliner Agenturlandschaft unter dem Aspekt der gestiegene Nachfrage an E-Commerce Lösungen in der Corona-Krise. Thomas Kitlitschko, Geschäftsführer von Neofonie, liefert Einblicke.

ontolux Logo

Neofonie gründet KI-Agentur ontolux

Neofonie verkündet den Start einer neuen KI-Agentur, die sich den Themen Text Mining, Suche und Natural Language Processing verschrieben hat. Die langjährige Forschungs- und Projektkompetenz wird ab sofort in der eigenständigen Marke ontolux gebündelt.

wir-liefern-org Screen

wir-liefern.org erhält intelligente Suche

Neofonie unterstützt wir-liefern.org mit der kostenfreien Bereitstellung des Textanalyse Frameworks TXTWerk. Das Tool verbessert die Suche zur Auffindbarkeit lokaler Geschäfte.

WorldUsabilityDay_Newsbox

World Usability Day: Suche als echtes Erlebnis

Der World Usability Day vereint Design, Usability, IT und AI in einem Event und präsentiert am 12. November 2020 neueste Trends einem bundesweiten Publikum. Cornelia Werk von Neofonie stellt eine intelligente Suche als echtes Erlebnis vor.

RV24_Vorschaubild

Relaunch der digitalen Versicherung R+V24

Für die Umsetzung von rv24.de wurde Neofonie beauftragte, die den Relaunch auf Basis des Content Management Systems Magnolia umgesetzt hat. Die Erstellung erfolgte just in time – und das mitten in der Corona-Pandemie.

2 Iphone - mit Bildschirm der "meinbezirk" App, weisser Hintergrund

Neofonie Mobile launcht „meinbezirk espresso“ App

Mit der neuen meinbezirk espresso-App baut der Verlag Regionalmedien Austria sein Portfolio aus und liefert ein modernes und innovatives App-Konzept per swipe für sein regionales News-Angebot.

SAP Silver Partner Logo

Neofonie setzt auf SAP Commerce Cloud

Als Spezialist für E-Commerce Lösung hat Neofonie die Partnerschaft mit SAP ausgeweitet und ist nun auch Implementierungspartner für die SAP Commerce Plattform.

Illustration von CRM-Systemen

Neofonie hilft mit CRM-Beratung zur 360° Kundensicht

Neofonie unterstützt Sie beim Aufbau eines erfolgreichen Customer Relation Managements.

SEO in bunten Buchstaben

Webinar: Relaunch und SEO – So machen Sie es richtig

Am 25.08. zeigt SEO-Experte Anton Littau, wie die richtige Strategie zum richtigen Zeitpunkt hilft.

SAP Silver Partner Logo

Neofonie ist SAP Silver Partner mit TXTWerk

Als SAP Silver Partner stellt Neofonie das Text Mining Framework TXTWerk im SAP App Center ab sofort bereit.

Ibexa-Logo

Neofonie und Ibexa sind Partner

Neofonie und Ibexa vereinbaren Partnerschaft, um Content und Commerce stärker miteinander zu verbinden.

Grant McGillivray

Neofonie startet eigenständige UX-Agentur

Das Geheimnis ist nun endgültig gelüftet: ION ONE nennt sich die neue UX-Agentur von Neofonie!

digital-ratgeber.de auf einen Macbook

Wort und Bild Verlag stellt Digital Ratgeber vor

Mit Neofonie als Partner bringt der Wort & Bild Verlag mit dem „Digital Ratgeber“ eine neue Informationsplattform für Apotheken und deren Kunden auf den Markt.

Stadtwerke Oranienburg News

Storytelling-Beratung für Stadtwerke Oranienburg

Neofonie unterstützt die Stadtwerke Oranienburg in einem kreativen Kommunikationsworkshop, um ihr Online-Ableseportal mit einem Kino-Werbespot zu promoten.

Unser Newsletter „Neo Report“ vermittelt konkretes Praxiswissen, Trends und Know-how für Ihr digitales Business – quartalsweise und kompakt. Jetzt anmelden.