How-to: Mit Elasticsearch Webinhalte in Magnolia CMS indexieren

How-to: Mit Elasticsearch Webinhalte in Magnolia CMS indexieren

Die Qualität der Web-Suchfunktion kann darüber entscheiden, wie lange ein User auf der Website verweilt. Insbesondere auf Webseiten mit großen und verschiedenartigen Datenmengen sind Suchmaschinen ein ausschlaggebender Faktor und stellen Content Management Systeme wie beispielsweise Magnolia CMS immer wieder vor Herausforderungen. Website Suchmaschinen existieren bereits seit vielen Jahren und sind elementare Bestandteile jeder Web- oder E-Commerce Site, doch erst eine gut durchdachte Suchlogik mit einem angemessenen Spektrum an Möglichkeiten und der guten Qualität der Suchergebnisse bedient die wachsenden Ansprüche des Users.

Suchmaschinen in Magnolia CMS

Magnolia CMS wird auf einem Tablet bedient

Magnolia CMS unterstützt derzeit zwei Suchmaschinen. Eine davon ist die standardmäßig eingebaute Suche, wobei die Daten aus dem Java Content Repository (JCR) in einem Apache Lucene-basierten Indexer abgelegt werden. Hierbei stößt man jedoch relativ schnell an Grenzen. Die zweite ist das Apache Solr Plugin, welche ebenfalls auf Apache Lucene beruht und deutlich mehr Funktionen und Möglichkeiten bietet. Neben Solr ist Elasticsearch eine der weltweit führenden Enterprise Suchmaschinen. Apache Solr als auch Elasticsearch verfolgen das gemeinsames Ziel, das beste Ergebnis für eine Suchanfrage auszuliefern.

Auch auf seitens der Kunden der Neofonie erfreut sich die Kombination von Magnolia CMS mit Elasticsearch wachsender Beliebtheit. Das war für ein Entwicklerteam der Neofonie Grund genug, ein Elasticsearch-Magnolia-Modul zu entwickeln. Das technisches Konzept sieht vor, Magnolia Autoren- und Public-Instanzen mit mehreren Elasticsearch Instanzen zu verbinden, um die Speicherung von Inhalten und Mediendateien im Index zu ermöglichen und diesen der Website Suchmaschine und somit dem User wieder zur Verfügung zu stellen.

Indexierung und Inhaltssuche in Magnolia mit Elasticsearch

Wie Inhalte in Magnolia mit Elasticsearch indexiert und gesucht werden können, zeigt die folgende Schritt-für-Schritt Anleitung. Als Beispiel kommen Tourdaten der bekannten Magnolia Reise Demo zum Einsatz.

  1. Die Configuration App öffnen und einen neuen Index zu /modules/neofonie-module-elasticsearch/config/indexJob hinzufügen
  1. Den example pages index job kopieren und die Einstellungen anpassen. Dabei den workspace und den docType auswählen.

2.1 In targets können diverse Indexer definiert werden, standardmäßig ist localhost:9200 (Kopie von pages) eingestellt

2.3 In exclude kann eingestellt werden, welche Felder, Bereiche oder Komponenten nicht indexiert werden solle

  1. Field mappings konfigurieren
    Diese Information wird verwendet, um in Elasticsearch das mapping schema zu erzeugen. Angegebene Feldnamen werden standardmäßig mit dem gleichen Namen als Datentyp String im Elasticsearch index abgelegt. Folgenden Optionen sind möglich:

3.1 type: der gewünschte Datentyp für das Feld

3.2 magnoliaType: Im Fall eines special type wird aktuell uuid unterstützt und ist für die Verwendung mit Magnolia uuids gedacht. Im Fall mehrerer uuids werden diese als ein Array an Elasticsearch übertragen und nicht als verknüpften String.

3.3 elasticsearchName: Feldname in Elasticsearch

3.4 Jedes weitere Feld, welches als Mapping-Parameter in Elasticsearch verwendet wird, wie z.B. index mit dem Wert not_analyzed oder include_in_all mit dem Wert false. Weitere Details auf elastic.co.

  1. Wenn Sie die Option cron hinzufügen, wird der Index jedes Mal aktualisiert, in diesem Beispiel alle 10 Minuten. Die Syntax ist ähnlich wie bei cron unter Linux und es können auch Angaben in Sekunden gemacht werden.
  2. Eine neue Seite aus dem Template Elasticsearch Results hinzufügen.

5.1 Workspace konfigurieren

5.2 Elasticsearch Felder dem Template zuweisen

  1. Kategorie Facette hinzufügen
  1. Fertig

Elasticsearch Modul für Magnolia CMS

Mit dem Elasticsearch Modul für das Content Management System Magnolia CMS können über eine einfache Schnittstelle Textdateien und Daten einfach indexiert und performant in individuellen Suchergebnisslisten ausgespielt werden. Damit gelangt der Website-Nutzer schneller zum gewünschten Suchobjekt.

Veröffentlicht am 20. Januar 2017, aktualisiert am 12. Oktober 2020

Teilen auf
Ender Özgür

Ender Özgür

Ender Özgür hat Informatik an der TU Berlin studiert. Er verantwortet als Head of Software Factories bei Neofonie die moderne Umsetzung von Entwicklungsprojekten. Neofonie entwickelt individuelle, digitale Lösungen und bietet Beratung, Konzeption, Design, Entwicklung und Betrieb aus einer Hand. Zu den Kunden zählen der Wort & Bild Verlag, Audi, Leica, Rausch und Super RTL.

Zurück ins Büro

Die Büros von Neofonie waren zur Hochzeit der Pandemie dünn besetzt. Jetzt kehrt wieder mehr Leben ein. Wir haben Suyin Diaz zur Situation „Zurück ins Büro“ befragt.

AI-Tools auf dem Prüfstand

Immer neue AI-Tools werden auf dem Markt geschwemmt. Doch was leisten diese Tools und vor allem wie korrekt arbeiten sie? Mehr Informationen in der aktuellen Ausgabe von „KI & Forschung“.

Customer Experience – nur Kundenerfahrung zählt

Customer Experience – Schlüssel zur Kundenbindung. Wie dies gelingt, zeigen wir im Whitepaper ”Wie Versicherer von Nutzerzentrierung profitieren”.

Header_KI_Forschung_ontolux_christopher-burns-Kj2SaNHG-hg-unsplash_10_22

Autonomes Fahren auf dem Rückzug?

Ist die angekündigte Schließung von Argo AI der Tod des autonomen Fahrens? Dieses und andere Themen beleuchtet Dr. Till Plumbaum in der aktuellen Ausgabe von „KI & Forschung“.

Dastan_sexuelle_Vielfalt_Neo

Vielfalt als Stärke bei Neofonie

Vielfalt in Unternehmen ist eine Stärke. Ein Aspekt ist die sexuelle Orientierung. Wir haben Dastan Kasmamytov zu seinem ganz persönlichen Weg interviewt.

ontolux_Glossar_Header_girl-with-red-hat-OG9NZVNCnFo-unsplash_blue

Was ist Natural Language Processing

Natural Language Processing (NLP) bezeichnet die maschinelle Verwertung natürlichsprachiger Texte. ontolux stellt das Thema im KI-Blog näher vor.

KI & Forschung 09-2022

Wo steht Deutschland in Sachen Künstlicher Intelligenz made in Germany? Dr. Till Plumbaum gibt Einblicke in der aktuellen „KI & Forschung“ Ausgabe.

Anja_Unterberger-Schneck_Pflanzen

Markenwerte und Branding bei Neofonie

Was bedeutet der Slogan „Digitales in guten Händen“? Anja Unterberger-Schneck, Teamlead Marketing bei Neofonie, gibt Einblicke ins Branding.

Neofonie beim BVDVA-Kongress 2022

Axel Hillebrand, UX Consultant stellt im Vortrag Methoden zur Gewinn- und Imageoptimierung mittels User Experience beim BVDVA-Kongress 2022 online vor.

ontolux auf der Qurator-Konferenz in Berlin

Auf der Qurator-Konferenz in Berlin versammeln sich KI-Experten, um über digitale Kuratierungsmethoden im Einsatz für Unternehmen zu diskutieren.

newsbox-shopwareLizenzen

Neue Lizenzmodelle bei Shopware

Shopware ändert seine Lizenzmodelle. Mit Rise, Evolve und Beyond werden die bisherigen Professional- und Enterprise-Pakete abgelöst. Mehr… 

ION ONE bei der CX1 World Conference

Grant McGillivray und Björn Andresen von ION ONE richten einen Roundtable zum Thema Nutzerzentrierung für KMUs bei der CX1 World Conference 2022 aus.

Neofonie auf der DMEXCO

Die größte Digitalmesse Deutschlands öffnet in wenigen Tagen die Tore. Neofonie ist vor Ort.

Füchse_App_Header_Case

Füchse Berlin stellen neue Fan-App vor

Die Füchse Berlin präsentieren ihre neue Fan-App, die durch eine hohe Performance, neue Features und ein ganz neues Nutzererlebnis überzeugt.

Header_KI_Forschung_ontolux_christopher-burns-Kj2SaNHG-hg-unsplash_08_22 (1)

KI & Forschung 08-2022

Die neue Ausgabe der „KI & Forschung“ unserer KI-Agentur ontolux ist da: Dieses Mal hinterfragen sie die Gefahr von KI und thematisieren Deepfakes und Dall-E 2.

TechnologienimWandel_news

Digitale Technologien im Wandel bei Neofonie

Digitale Technologien haben ein enormes Wachstumspotenzial. Im Interview mit Ender Özgür, Head of Software Factories bei Neofonie, beleuchten wir den Wandel.

magic_quardrat_header_Neu

Gartner Magic Quadrant Digital Commerce

Gartner veröffentlich jährlich den Magic Quadrant für Digital Commerce. Mit dabei in 2022 sind alle Commerce Partner von Neofonie.

KI & Forschung 07-2022

Die Juli-Ausgabe von KI und Forschung von ontolux gibt Tipps, wie die Sommerzeit genutzt werden kann, um sich näher mit KI und NLP zu beschäftigen.

Vorurteilen gegenüber dem Agenturalltag

Wir räumen mit den Vorurteilen gegenüber dem Agenturleben auf. Interview zum Arbeitsleben in der Neofonie mit Tim Priwe und André Hirsinger.

ontolux - Qi Wu - hält Vortrag bei der Berlin Buzzwords 2022

M3 und Berlin Buzzwords – Rückblick

ontolux stellte Methoden für ressourcensparende KI-Modelle bei der Minds Mastering Machines und Berlin Buzzwords im Juni 2022 vor. Ein Rückblick

Unser Newsletter „Neo Report“ vermittelt konkretes Praxiswissen, Trends und Know-how für Ihr digitales Business – quartalsweise und kompakt. Jetzt anmelden.