Kompetenz
Forschung & Technologien
Ideen für morgen
Wir haben eine der schnellsten Suchmaschinen der Welt und sind stolz darauf. Doch das reicht uns nicht, denn übliche Search Engines suchen nach Worten. Das genügt heute nicht mehr. Deshalb nutzen wir Semantic-Web- und Text-Mining-Technologien um nach Bedeutungen zu suchen. Mit dem Einsatz mobiler Systeme ermöglichen wir, dass auf Informationen jederzeit und ortsunabhängig zugegriffen werden kann. Wir erforschen inwieweit das Web 2.0 mit semantischen Technologien verschmolzen werden kann. So werden völlig neuartige Möglichkeiten der Suche, Nutzerinteraktion und Navigation erreicht.Mehr Suchmaschinen, Web-Communitys und Portale lassen sich immer weniger trennen. Dies erreichen wir durch Verzahnung unterschiedlicher Technologien. Wir schaffen kooperierende Portale, diese suchen nicht mehr nur lokal, sondern gleich in einem ganzen Netz von Portalen und Diensten. Hierbei werden bisher voneinander "isolierte" Online-Enzyklopädien, Suchdienste, Datenquellen und Communitys miteinander vernetzt.
Unsere Gesellschaft wird immer mobiler: Heute gibt es in Deutschland mehr Mobiltelefone als Einwohner. Ferner haben sich Menschen daran gewöhnt, jederzeit online zu sein, zu telefonieren und direkt untereinander Daten, Filme und Bilder auszutauschen. Wir erkunden Wege, neue mobile Informationssysteme zu schaffen, und diese zuverlässig in Online-Suchstrukturen einzubinden.
Forschung & Entwicklung ausblenden Seitenanfang
Projekte
Projekte für die nächste Generation
Derzeit arbeiten wir an den Forschungsprojekten SemPa, Onyx, Peopleextract und Engifo. Diese werden von BMBF, BMWi und der IBB gefördert.Mehr Forschungsprojekt „SemPa“ – Semantische Suche am Beispiel eines Patienteninformationssystems
Das Ziel des Projektes ist es aufzuzeigen, wie Schwierigkeiten bei der herkömmlichen Informationsbeschaffung aus dem Internet überwunden werden können. Schwierigkeiten entstehen dort, wo die Terminologie des Suchenden nicht mit der Terminologie des Informationsanbieters übereinstimmt. Beispiele dafür sind die Fachsprache eines Elektromechanikers, die Ausdrucksweise von Juristen oder die unterschiedlichen Begriffswelten in denen sich Ärzte und Patienten bewegen. Das noch bis Herbst 2009 laufende Verbundprojekt mit der DocInsider GmbH wird durch das Bundes-ministerium für Wirtschaft und Technologie (BMWi) im Rahmen von PRO INNO II gefördert. Projektträger ist die Arbeitsgemeinschaft industrieller Forschungsvereinigungen "Otto von Guericke" e.V. (AiF).
Die Vision ist eine semantische Plattform für das Web 3.0 Gängige Volltextsuchlösungen, wie sie zum Beispiel Google einsetzt, liefern lediglich eine Liste der wichtigsten Dokumente. Bei ungenauer Suchanfrage sind die gewünschten Informationen sehr weit in diesen Dokumenten gestreut bzw. gar nicht vorhanden. Im Gegensatz dazu versucht die semantische Suche zu verstehen, welche Informationen gesucht werden und liefert diese gezielt. Bestandteile der semantischen Suche in diesem Projekt sind eine Kombination aus Wissensbasen in Form von Ontologien, ein überschaubarer Satz von Regeln und der Volltextsuche.
Forschungsprojekt „Onyx“ – Wissensgewinnung aus Web-Dokumenten
Mit dem Ziel, unstrukturierte Informationen aus dem Internet automatisch in strukturiertes Wissen zu überführen, setzte die neofonie 2008 das Forschungsprojekt „ONtologY learning eXtreme“ – kurz Onyx – auf. Das bis Ende 2009 laufende Projekt wird durch das Bundesministerium für Wirtschaft und Technologie unterstützt. Projektträger ist die EuroNorm GmbH.
Ein wesentlicher Bestandteil der semantischen Suche (siehe Forschungsprojekt SemPa) sind Ontologien. Ontologien bieten eine Möglichkeit, Wissen über ein Fachgebiet im Computer zu repräsentieren. Eine solche Wissensbasis beinhaltet jene impliziten oder expliziten Informationen, die dem Nutzer als Suchergebnis ausgeliefert werden. Voraussetzung ist, dass die Ontologie eine ausreichende Größe hat und damit genügend Informationsgehalt aufweist.
Der manuelle Aufbau von großen Ontologien ist extrem zeit- und kostenintensiv. Das Projekt Onyx entwickelt deshalb ein System, das es ermöglicht, den Inhalt einer Ontologie automatisch aus Internetdokumenten zu erzeugen. Dies wird als Ontologie-Lernen – genauer Ontologie-Population – bezeichnet. Exemplarisch wird dies am Beispiel der Domäne „Gesundheitswesen“ demonstriert.
Um das Ziel der automatischen Ontologie-Erzeugung zu erreichen, werden Methoden der Computer-Linguistik, des maschinellen Lernens, der Statistik und der künstlichen Intelligenz miteinander verzahnt. So kann eine gute Qualität der strukturierten Wissensbasis erzielt werden.
Peopleextract – Web-Inhalte und Personen sinnvoll verknüpfen
Das Web 2.0 hat das Internet nicht nur grundlegend verändert, sondern insbesondere auch personalisiert. Im Internet stehen zunehmend Informationen zur Verfügung, die direkt oder über ein bestimmtes Thema mit Personen verbunden sind. Bisherige Suchmaschinen erlauben es nur bedingt, bei der themenspezifischen Suche auch einen entsprechenden Experten zu nennen. Peopleextract ist Teil des durch den Berliner Senat geförderten Programms ProFit. Projektträger ist die IBB.
Untersucht wird im Rahmen von Peopleextract die automatisierte Gewinnung von strukturierten Informationen zu Personen aus Internet-Dokumenten. In diesem Zusammenhang extrahiert Peopleextract mit Hilfe von Artificial-Intelligence-Technologien unstrukturierte Personeninformationen selbstständig aus dem Web, stellt deren Verbindungen der Personen untereinander her und überführt sie in eine strukturierte und nutzbare Form.
Die entstehende Wissensbasis bildet die Grundlage für moderne Suchplattformen. Auf der strukturierten Personenwissensbasis können Nutzer direkt nach Experten, Expertengruppen oder Wissensträgern eines Themas suchen und mit ihnen – bei gegenseitigem Interesse – in Kontakt treten.
Engifo – Digitale Informationsflut in geordneten Bahnen
Ziel von Engifo ist es, den Nutzen von aktuellen Algorithmen und Verfahren aus dem Bereich des maschinellen Lernens zu untersuchen und die Ergebnisse zur Analyse von digitalen Dokumenten zu verwenden.
Durch die starke Verbreitung des Internet wird man mit immer mehr Dokumenten konfrontiert. Diese zu verwalten und zu nutzen ist Gegenstand aktueller Forschung. Klassische Bibliotheken besitzen durch jahrelang verbesserte und erprobte Katalog- und Index-Systeme eine inhaltsbezogene Klassifizierung von Texten. Dies soll zukünftig automatisiert auf digitale Dokumente in großer Anzahl angewendet werden können. Die Aufgabe des Projekts besteht darin, den Inhalt (die Semantik) von sehr vielen Dokumententexten zu erfassen und diesen zur maschinellen Einordnung der Dokumente zu nutzen.
Aus dem Bereich des maschinellen Lernens sind Verfahren bekannt, um den Inhalt von Texten zu erfassen. Diese Verfahren sind aktuelle Forschungsthemen und noch nicht auf große Dokumentenmengen angewendet worden. Zudem findet die Forschung auf diesem Fachgebiet meist im angelsächsischen Sprachraum statt, sodass die Eignung für Texte deutscher Sprache noch getestet werden muss.
Die untersuchten Verfahren beruhen vorwiegend auf der Idee, dass ein Text inhaltlich aus einer Auswahl von Themen (engl. Topics) besteht. Diese Themen können durch die Wahl eines geeigneten Modells zur Repräsentation der Dokumente extrahiert werden. Die den Dokumenten zugeordneten Themen können beispielsweise genutzt werden, um den Dokumentenbestand in Gruppen zu unterteilen (Dokument-Clustering). Grundlage des Projekts sind probabilistische Verfahren, wobei bisherige Arbeiten nahelegen, dass dieser Ansatz am erfolgversprechendsten ist.
Projekte ausblenden Seitenanfang
Partner
Starke Partner für breite Schultern
Wir sind Partner der Ontopia AS, Oslo/Norwegen, dem weltweit führenden Anbieter einer Topic Map Plattform.Im Bereich mobiler P2P Topic Maps kooperieren wir mit der Uni Oslo, Department of Informatics. Außerdem pflegen wir enge Verbindungen zur FH Brandenburg, Fachbereich Wirtschaftsinformatik. Auch mit der FU Berlin, besonders mit der AG Netzbasierte Informationssysteme, verbinden uns viele gemeinsame Projekte.
Open Source
Gemeinsam Wissen aufbauen und Ideen weiterentwickeln
Viele unserer Produkte entwickeln wir unter Einbeziehung von Open Source Software – Software, deren Quellcode frei zugänglich ist und die von weltweit agierenden Entwicklern in einem offenen Prozess weiterentwickelt und optimiert werden kann. Auf diese Weise können wir nicht nur Fremdlizenzkosten vermeiden und unseren Kunden kostengünstigere Software-Pakete anbieten. Vielmehr spielen die sozialen und ethischen Aspekte des Wirkens freier Software für uns eine Rolle: Innovation und Wissen werden gemeinsam aufgebaut und erprobte Lösungen können sich viral verbreiten. Es wird ein Nutzen für die Gemeinschaft erzeugt.Mit unserer Initiative neofonie open möchten wir den Mentalitätswechsel hin zu Open Source Software und zur Einhaltung offener Standards begleiten und unterstützen, indem wir verstärkt mit der Entwicklergemeinde freier Software interagieren, um Wissen und Erfahrungen auszutauschen und uns symbiotisch weiterzuentwickeln.
Weitere Informationen finden Sie unter:
