Entity Linking mit Doccano und TXTWerk

Zum Labeling von Entitäten hat ontolux das Open Source-Annotationstool Doccano mit der Anbindung an das hauseigene Textanalyse-Framework TXTWerk in einem Fork eingebunden, um eigene Entity Linking Annotationen zu erstellen.

Maschinelle Lernverfahren benötigen gelabelte Trainingsdaten, damit Texte für Computer lesbar werden. Für die sogenannte Annotation, also Labeling, gibt es verschiedene Tools. TXTWerk bietet als ein Feature die Erkennung von Entitäten, dem Entity Linking. Um die Ergebnisse zu verbessern und kundenspezifisch zu individualisieren, wurde das Open Source-Annotationstool Doccano mit einer Anbindung an die TXTWerk-API ausgestattet. Diese Lösung kann On-Premise auf eigenen Servern von ontolux installiert werden.

Alle Einzelheiten stellt Gerhard Haß in seinem Beitrag “Entity Linking mit Doccano und TXTWerk” auf ontolux vor.

 

Veröffentlichung am 25.04.2022