How-to Anleitung: Multi-Instanzen in Typo3 erstellen

How-to: Multi-Instanzen in TYPO3 erstellen

Das Content Management System TYPO3 ist nach eigenen Aussagen ein Enterprise-CMS, allerdings fehlt dem CMS ein entscheidendes Enterprise-Feature: die Multi-Instanz-Fähigkeit. Wie TYPO3 trotzdem auf mehreren Instanzen aufgesetzt werden kann, stellen Roman Schenk, Martin Peranic und Markus Sternberg in einer How-to Anleitung vor.

Enterprise Content Management Systeme müssen die Anforderungen an ein breites Funktionsspektrum genauso erfüllen, wie die der Ausfallsicherheit und einer hohen Performance – so die wiederkehrende Erwartungshaltung von Kunden der Neofonie. Gewährleistet wird dies in der Regel durch redundante Systeme und eine Lastverteilung auf mehreren Instanzen. Das CMS TYPO3, welches bei vielen Webprojekten zum Einsatz kommt, lässt sich allerdings in der Standard-Installation nicht in einem Load-Balanced-Environment betreiben. Dadurch ist u.a. keine Ausfallsicherheit gewährleistet, ebenso drohen Performance-Probleme bei hohen Zugriffszahlen. Darüber hinaus besteht bei einer solchen Installation keine Trennung zwischen Redaktions- und Auslieferungs-Server: Eine Instanz ist immer für beides zuständig, was ein Risiko für Integrität des Contents darstellt.

Im Folgenden soll eine Möglichkeit aufgezeigt werden, wie multiple TYPO3 Instanzen aufgesetzt werden können. Alle verwendeten Technologien sind bewährt und Open Source und stehen auf gängigen Systemen zur Verfügung.

1. Datenbank-Replikation

Nach alter Manier aktivieren wir das MySQL Binlog für die Master/Slave Replikation.

Dump der MasterDB

Zum initialen Start benötigen wir den aktuellen Stand vom Backend. Die Slaves setzen bei zukünftigen Deployments auf diesen Stand auf. Wir verwenden Mysqldump mit der Option –single-transaction (StorageEngine InnoDB), um die MasterDB nicht zu blockieren.

mysqldump -h$DB_MASTER_HOST -P$DB_MASTER_PORT -u$DB_REPL_USER

-p$DB_REPL_PASS

--single-transaction

-B $DB_NAME | mysql

Löschen lokaler Chaches

Da später unter anderem die Cache-Tabellen nicht repliziert werden (duplicate entries), müssen wir diese für einen konsistenten Stand der Slaves beim Deployment löschen:

mysql -Nse 'show tables like "cf_%"' typo3db | while read table; do mysql -e

"truncate table $table" typo3db

Binlog Information

Wir benötigen “file” und “position” des Masters:

MASTER_LOG_FILE=$(mysql -h$DB_MASTER_HOST -P$DB_MASTER_PORT

-u$DB_REPL_USER -p$DB_REPL_PASS -e

"show master status\G"

|grep File |awk '{ print $2 }')

MASTER_LOG_POS=$(mysql -h$DB_MASTER_HOST -P$DB_MASTER_PORT

-u$DB_REPL_USER -p$DB_REPL_PASS -e

"show master status\G"

|grep

Position |awk '{ print $2 }')

Excluden bestimmter Tabellen

Um ‘duplicate entries’ zu vermeiden, replizieren wir alles außer den folgenden Tabellen:

replicate_wild_ignore_table = 'typo3db.cf_%, typo3db.fe_session%,

typo3db.sys_log, typo3db.tx_realurl_urldata, typo3db.tx_realurl_pathdata,

typo3db.sys_file_processedfile'

Replikation erneut starten

mysql -e "stop slave;"

mysql -e "CHANGE MASTER TO MASTER_LOG_FILE='$MASTER_LOG_FILE',

MASTER_LOG_POS=$MASTER_LOG_POS, MASTER_HOST='$DB_MASTER_HOST',

MASTER_PORT=$DB_MASTER_PORT, MASTER_USER='$DB_REPL_USER',

MASTER_PASSWORD='$DB_REPL_PASS';"

mysql -e "set global replicate_wild_ignore_table = 'typo3db.cf_%, typo3db.fe_session%,

typo3db.sys_log, typo3db.tx_realurl_urldata,

typo3db.tx_realurl_pathdata,

typo3db.sys_file_processedfile'"

mysql -e "start slave;"

2. Datei-Replikation

Neben einer fehlerfreien Datenbank Replikation, muss auch ein zuverlässiger Datei-Austausch stattfinden.

Nach der offiziellen TYPO3 Dokumentation sind dabei folgende Verzeichnisse und Dateien für uns relevant:

/typo3temp/

typo3conf/PackageStates.php

typo3conf/ext/

typo3conf/l10n/

/fileadmin/

/uploads/

Richtet man sich nach dem klassischen Backend/Frontend-Modell, in der das Frontend read-only ist, reicht es aus, die Datei-Replikation nur in eine Richtung stattfinden zu lassen und zwar vom Backend zum Frontend. Dies kann exemplarisch mit einem als cronjob laufenden rsync implementiert werden. Bei dieser Art Setup ist unbedingt darauf zu achten, dass die oben erwähnte Ordner/Dateiliste eingehalten wird. Das Frontend fährt sonst nicht richtig hoch. Interessant dabei ist das typo3temp Verzeichnis. Offenbar ist es für TYPO3 nicht weiter schädlich, wenn sich dort zur Laufzeit Dateien verändern.

Nachteile eines rsync basierenden Systems ist eine Verzögerung zwischen der Darstellung auf dem Backend und dem Frontend. Dies ist dem periodisch laufenden cronjob geschuldet. Als Grenzfall können dadurch auch tote Datenbankeinträge auf den Frontends entstehen, z.B. wenn der Kopierbefehl fehlschlägt, nachdem die Datenbank bereits repliziert ist.

Möchte man solche Szenarien verhindern, muss auf einen cronjob verzichtet werden. Ein NFS kommt auch nicht infrage, da auf dem Frontend generierte Daten unter keinerlei Umständen auf das Backend gelangen dürfen. Vorstellbar wäre also eine Kombination aus rsyncd und inotify. In diesem Fall werden Dateien direkt beim Erstellen mit rsync auf das Zielsystem kopiert.

3. Relurl Extension

Die von TYPO3 generierten URLs sind weder für den Menschen noch für die Suchmaschinen sonderlich schön. Diese werden daher üblicherweise mit der realurl Extension, dem defacto-Standard für dieses Problem, „hübsch“ gemacht. Dabei erfolgt ein Mapping von /page/tree/path/to/page auf /index.php?id=42 , und vice versa. Damit der Page-Tree nicht bei jedem Request und jedem Rendering eines Links erneut traversiert werden muss, werden die bereits erfolgreich durchgeführten Mappings – nach dem ersten Request auf eine bestimmte URL bzw. nach dem ersten Rendering eines bestimmten Links – in Cache-Tabellen abgelegt. Diese sind:

cf_cache_rootline
cf_rootline_tags
Tx_realurl_pathdata
tx_realurl_urldata

Wie oben beschrieben müssen die Cache-Tabellen von der Datenbank-Replikation ausgenommen werden, da es ansonsten zu Duplicate-Entries kommt. Von Zeit zu Zeit müssen jedoch einzelne Einträge in diesen Tabellen entfernt werden: wenn sich der Page-Tree oder der Page-Titel, und damit die URL-Struktur, ändert. Diese werden dann beim nächsten Request / bei der nächsten Link-Generierung durch die Extension neu erzeugt. Das Invalidieren (löschen) der Cache-Einträge auf dem Backend wird durch die Extension vorgenommen, durch die deaktivierte DB-Replikation kommen diese Änderungen jedoch nicht auf den Frontends an – die URLs haben weiterhin die alte Struktur.

Voraussetzung: Backend vs. Frontend

Auf der jeweiligen Umgebung (Server) muss TYPO3 die Information zur Verfügung gestellt werden, ob es Deliver-Frontend oder Redaktions-Backend ist.

Das Problem lässt sich mit Bordmitteln (T3 + DB-Replikation) so lösen:

es wird eine Transfer-Tabelle erstellt
es wird ein TCE-Hook für das Cache-Postprocessing gebaut (dieser befüllt auf dem Backend die Transfer-Tabelle)
es wird ein TSFE-Hook für connectToDB gebaut (dieser liest auf den Frontends die Tabelle und löscht die Caches)

Transfer-Tabelle

Die Struktur ist sehr simpel:

CREATE TABLE tx_foo_invalid_cache_on_delivery (

id INT NOT NULL AUTO_INCREMENT,

table_name varchar(255) DEFAULT ' ' NOT NULL,

inserted TIMESTAMP DEFAULT CURRENT_TIMESTAMP,

PRIMARY KEY (id)

);

Darin werden alle Cache-Tabellen gespeichert, die auf den Frontends geleert werden sollen, dies sind hier die 4 oben genannten. Die Tabelle muss mit in die DB-Replikation aufgenommen werden.

TCE-Hook auf dem Backend

Es muss ein Hook für das ClearCache-Postprocessing registriert werden:

$GLOBALS['TYPO3_CONF_VARS']['SC_OPTIONS']['t3lib/class.t3lib_tcemain.php']

['clearCachePostProc'][] = 'Foo\\Hook\\T3libTcemainHook->clearCachePostProc';

Der Hook darf nur auf dem Backend-System die oben genannte Tabelle befüllen.

if($isDelivery){

return;

}

In die Tabelle werden, Komma-separiert, die Namen der vier Cache-Tabellen eingefügt:

$cacheTablesToInvalidate =

'cf_cache_rootline,cf_rootline_tags,tx_realurl_pathdata,tx_realurl_urldata';

$databaseConnection->exec_INSERTquery(

'tx_crefoportal_invalid_cache_on_delivery',

[

     'table_name' => $cacheTablesToInvalidate

]

);

Fertig. Nach dem INSERT wird der neue Eintrag zu den Frontends repliziert.

TSFE-Hook auf den Frontends

Dieser wird als Hook für connectToDB registriert:

$GLOBALS['TYPO3_CONF_VARS']['SC_OPTIONS']['tslib/class.tslib_fe.php']['connectToDB'][] =

'Foo\\Hook\\IndexTsHook->preprocessRequest';

Dieser darf nur auf dem Frontend-System die oben genannte Tabelle auslesen:

if(!$isDelivery){

return;

}

$rows = $databaseConnection->exec_SELECTgetRows(

'table_name',

'tx_crefoportal_invalid_cache_on_delivery',

' '

);

Die ausgelesenen Tabellen-Namen werden gesplittet und anschließend die jeweiligen Tabellen geleert:

foreach($rows as $row){

$tables = $row['table_name'];

$tables = explode(',',$tables);

foreach($tables as $table){

     $databaseConnection->exec_TRUNCATEquery($table);

}

}

Abschließend wird die Transfer-Tabelle geleert, damit diese nicht zu groß wird:

$databaseConnection->exec_TRUNCATEquery('tx_crefoportal_invalid_cache_on_delivery');

Beim nächsten Request / Linkgenerierung werden nun die entsprechenden Einträge generiert und in die Tabellen geschrieben.

Die Transfer-Tabelle auf dem Backend-System sollte regelmäßig durch einen Job geleert werden.

Von Markus Sternberg, Roman Schenk, Martin Peranic

Der Beitrag ist auch im Entwickler-Magazin erschienen.
Multi-Instanz: TYPO3 in drei Schritten redundant aufsetzen

Veröffentlichung am 10. April 2018, aktualisiert am 10. Oktober 2020

Markus Sternberg, Roman Schenk, Martin Peranic

System Operator, System Engineer, Senior-Softwareentwickler

Markus Sternberg ist System Operator bei der Neofonie und beschäftigt sich mit allen Themen der Hochverfügbarkeit im 24×7 Umfeld. Roman Schenk ist seit 6 Jahren System Engineer und seit 3 Jahren bei Neofonie tätig. Er entwickelt auf Linux basierende Serverlösungen. Martin Peranic ist Senior-Softwareentwickler bei Neofonie und hat mehr als 10 Jahre mit Java und Enterprise Content Management Systemen.

Dump der MasterDB

Löschen lokaler Chaches

Binlog Information

Excluden bestimmter Tabellen

Replikation erneut starten

Voraussetzung: Backend vs. Frontend

Transfer-Tabelle

TCE-Hook auf dem Backend

TSFE-Hook auf den Frontends

Markus Sternberg, Roman Schenk, Martin Peranic

Beuth Verlag: Steigerung des UX-Reifegrades

Neofonie unterstützt T-Systems beim IT-Betrieb des Government Site Builders

Wie gut sind Sprachmodelle im Deutschen?

Learning to rank: Mit Machine Learning zu besseren Suchergebnissen

Neofonie zeigt soziales Engagement

Neofonie auf der BMBF-Mittelstandskonferenz in Berlin

Search UX auf dem Digitale Leute Summit

Neofonie erhält Deep Tech Award 2023

Neofonie auf der Global TechMining Conference

Content Commerce mit SAP und Contentful

Wandern zwischen den Welten – von den USA nach Berlin

Herausforderungen für Innovatoren im komplexen E-Health-Markt

ontolux bei der Berlin Buzzwords 2023

Zertifizierung nach ISO 13485 – Gesundheit braucht Qualität

Women in Tech – Projektmanagement in der IT

Qualitätssicherung im Healthcare Markt

Neofonie ist ISO 13485 zertifiziert

Neofonie feiert 25 Jahre

Neofonie Mobile ist offizieller Partner der Füchse Berlin

Neofonie im Digital Insurance Podcast

AI4SCM untersucht Supply Chain Risiken

Arbeiten mit chronischer Erkrankung

ChatGPT im Realitätscheck

Testkonzepte im Software Testing einfach erklärt

Flexibler Arbeitsplatz bei Neofonie

Whitepaper | Wie Versicherer von Nutzerzentrierung profitieren

AI-Tools auf dem Prüfstand

Vielfalt als Stärke bei Neofonie

Was ist Natural Language Processing

Füchse Berlin stellen neue Fan-App vor

Digitale Technologien im Wandel bei Neofonie

Autonomes Fahren auf dem Rückzug?

Digitales in guten Händen – Markenwerte und Branding bei Neofonie

KI Made in Germany

Berliner Wirtschaft: Per Klick zum Onlinehändler

Wie gefährlich ist KI?

Google Analytics 4 kommt

Neue Lizenzmodelle bei Shopware

NLP Summer School

M3 und Berlin Buzzwords - Rückblick

Vorurteilen gegenüber dem Agenturalltag

Betriebliche Weiterbildung bei Neofonie – ein Erfahrungsbericht

Entity Linking mit Doccano und TXTWerk

Emotionen und Language Models

Neofonie ist TYPO3 Gold Member

Shopware Performance-Optimierung

KI in der Justiz

Kind, Karriere, Vereinbarkeit von Familie & Beruf

Mit UX-Design die Candidate Experience optimieren

Neues Forschungsprojekt Text2Tech

Wie eine Webseite zum Verkaufsinstrument wird

Agile Führung - Bedeutung und Herausforderungen

Digitale Kommunikation, Herausforderungen, Chancen, Neofonie

Women in Tech bei Neofonie

Lucence 9

KI-Modelle komprimieren und Ressourcen sparen

Viele Generationen – ein Team – Neofonie

Wie es B2B Webseiten gelingt, mehr Service zu bieten

Bias und KI

ION ONE: UX-Workshop für Food-Branche

Language Models und Ethik

Neofonie ist neuer Contentful Partner

Work-Life-Balance: Sabbatical bei Neofonie

Analyse von Lageinformationen für das BSI

Neofonie ist Top Arbeitgeber für IT-Jobs 2022

Die neuen ML-Modelle DALL-E 2 und PaLM

Neofonie zählt zu den besten Web- und Online Agenturen 2022

Neofonie ist SAP Silver Partner mit TXTWerk

Fortschritte in der KI

Testmethoden | Testprozesse und Strategien im IT-Qualitätsmanagement