One Health – Transdisziplinarität bei ZB MED

Bild

von Eva Seidlmayer und Christoph Poley

Beitrag von ZB MED für die Posterausstellung der AGMB 2017 in Wien

One Health – Transdisziplinarität bei ZB MED

ZB MED  unterstützt disziplinäre und disziplinübergreifende Fragestellungen in Medizin, Umwelt-, Ernährungs- und Agrarwissenschaft und ermöglicht so einen ganzheitlichen Blick auf den Menschen. Das Poster führt in die hinter diesem Ansatz stehenden Konzepte One Health und Transdisziplinarität ein. Zudem stellt es die Services vor, die ZB MED für die transdisziplinäre Forschung in den Lebenswissenschaften bereitstellt.

Das Poster war unser Beitrag zur Posterpräsentation auf der diesjährigen Jahrestagung der Arbeitsgemeinschaft für Medizinisches Bibliothekswesen e.V., die vom 25. bis 27. September in Wien stattfand. Wir haben damit den zweiten Preis im Posterwettbewerb gewonnen.


Weiterführende Links:
AGMB-Jahrestagung, Wien

Ein Vergleich lebenswissenschaftlicher Ontologien mit dem Suchportal LIVIVO

Von Alexandra Hagelstein

Semantische Suche

Im letzten Blogbeitrag der LIVIVO-Labs „Beyond Metada“ haben wir die Vorgehensweise beschrieben, wie wir LIVIVO semantisch mithilfe von Entitäten aus Ontologien anreichern. Die Entitäten werden mit dem UIMA Framework extrahiert und in unserem ZB MED Knowledge Environment gespeichert.

Bei genaueren Betrachtungen sind uns weitreichende Überschneidungen aufgefallen. Beispielsweise zeigen unsere Wordclouds die häufigsten gefundenen Begriffe aus den Thesauri in LIVIVO (1).

Interdisziplinarität der Suche

LIVIVO als Suchportal für die Lebenswissenschaften enthält Publikationen aus den Bereichen der Medizin, des Gesundheitswesens, der Ernährungs-, Umwelt- und Agrarwissenschaften. Mit MeSH (Medical Subject Headings) wird das ZB MED Knowledge Environment mit medizinischer Terminologie angereichert, Agrovoc deckt den landwirtschaftlichen Bereich ab, DrugBank umfasst pharmazeutische Fachbegriffe.

Ähnlichkeitsvergleich der Ontologien

In einer aktuellen Publikation (2) haben wir die drei erwähnten Thesauri auf ihre Ähnlichkeiten verglichen. In den Thesauri und somit in den automatisch generierten Wordclouds überschneiden sich vor allem Oberbegriffe wie zum Beispiel „Patients“ oder „Methods“. Als Maß, um die Ähnlichkeit zwischen den Ontologien zu messen, verwenden wir den Jaccard-Koeffizienten. Er teilt die Anzahl der gemeinsamen Begriffe durch die Größe aller in den jeweiligen Thesauri vorkommenden Begriffe.
Je höher der Jaccard-Koeffizent – er kann maximal den Wert „1“ annehmen – desto größer ist die Ähnlichkeit der Thesauri.

Ergebnisse

Der Jaccard-Koeffizent zwischen den Thesauri MeSH und Agrovoc beträgt 0,09.
Beim Betrachten der 1000 häufigsten Begriffe aus dem ZB MED Knowledge Environment steigt dieser Koeffizient auf 0,3 an. Das heißt, dass viele der häufigen Begriffe aus dem Suchportal LIVIVO sowohl in dem MeSH-Thesaurus, als auch in Agrovoc enthalten sind.

Der Koeffizient zwischen Agrovoc und DrugBank ist im Vergleich dazu sehr niedrig und liegt bei 0,005. Die modellierten Begriffe im Thesaurus DrugBank sind im Wesentlichen durch spezifisches Wissen geprägt und enthalten weniger Oberbegriffe als die Thesauri MeSH und Agrovoc. MeSH und Agrovoc teilen sich einige Begriffe, da sie als Oberbegriffe in vielen Disziplinen anwendbar sind. So werden Begriffe wie „Therapy“ oder „Research“ in den Thesauri abgebildet, enthalten aber kein spezifisches und unterscheidbares Fachwissen.

Zwei Venndiagramme veranschaulichen die Ergebnisse. Diagramm A stellt die Überschneidungen zwischen den Thesauri MeSH, DrugBank und Agrovoc dar. Diagramm B zeigt die Überschneidung der 1000 häufigsten Begriffe in LIVIVO.

Venndiagramme

Venndiagramme zur Veranschaulichung der Ergebnisse

Fazit

Diese Ergebnisse zeigen Schwierigkeiten, die bei der Extraktion von Begriffen aus verschiedenen Wörterbüchern für die Literatursuche auftreten. Um die Überschneidung der Begriffe zu vermeiden, gibt es zwei Möglichkeiten: Entweder die überschneidenden Oberbegriffe aus den Ontologien werden zusammengefasst und ergeben nur einen Treffer oder es wird ein Verfahren genutzt, dass die Oberbegriffe auslässt. Das Auslassen der Oberbegriffe würde jedoch zu einem Ausfall von Informationen führen, dafür könnte aber möglicherweise die Genauigkeit der Treffer erhöht werden.

 

Die Publikation wurde im Rahmen der EKAW (International Conference on Knowledge Engineering and Knowledge Management) (3) eingereicht. Die diesjährige EKAW Konferenz befasst sich mit der Wirkung von Raum und Zeit auf die Repräsentation von Wissen. Mit dem Suchportal LIVIVO ermöglichen wir unseren Nutzern den Zugang zu Literatur aus 55 Millionen Publikationen aus dem Bereich der Lebenswissenschaften.


 

(1) LIVIVO Laboratories
(2) Müller, B., Hagelstein, A., Gübitz T.: Life Science Ontologies in Literature Retrieval: A Comparison of Linked Data Sets for Use in Semantic Search on a Heterogueneous Corpus. Proceedings of the 20th International Conference on Knowledge Engineering and Knowledge Management, Bologna, Italy (2016)
(3) International Conference on Knowledge Engineering and Knowledge Management, Bologna (Italy), 19.-23. November 2016

„Beyond Metadata“ – Wir reichern LIVIVO semantisch an!

Von Alexandra Hagelstein

Das ZB MED-Suchportal LIVIVO enthält Metadaten aus 55 Millionen Publikationen der Lebenswissenschaften. Typische Metadaten sind beispielsweise Titel, Namen der Autorinnen / Autoren oder das Erscheinungsjahr. Mit unserer neuen Methode extrahieren wir nun Titel und Abstract der Publikationen aus LIVIVO und annotieren die Texte mit den Begriffen der Ontologien. Volltexte durchsuchen wir aktuell noch nicht.

Was ist eigentlich eine Ontologie?

Ontologien enthalten semantische Informationen zu Begriffen, die sie beinhalten. Eine Ontologie repräsentiert Wissen über bestimmte definierte Fachbereiche. Dabei werden Entitäten, also die einzelnen Begriffe, und ihre strukturellen Beziehungen zueinander modelliert. Diese Beziehungen werden in der Regel hierarchisch dargestellt. Bei einer hierarchischen Darstellung sind die Elemente ausgehend von einer Wurzel wie Äste in einem Baum einander über- und untergeordnet.

Nehmen wir passend zum Sommer und zur Kirschzeit den englischen Begriff „cherries“ aus dem agrarwissenschaftlichen Thesaurus Agrovoc. „Cherries“ ist sowohl ein Oberbegriff von „sour cherries“ und „sweet cherries“, als auch Unterbegriff von „stone fruits“. Der Begriff „stone fruits“ ist wiederum Unterbegriff von „fruits“ usw. Auch gleichrangige Begriffe werden dargestellt. So ist „fruits“ in Agrovoc auf der selben Ebene wie beispielsweise „spices“, „legumes“, „cereals“ annotiert.

Der Agrovoc-Thesaurus ist Teil der „Linked Open Data Cloud“. Die LOD Cloud besteht aus offen zugänglichen und maschinenlesbaren Ontologien von verschiedenen Wissensdomänen. Eine der bekanntesten Ontologien aus der LOD Cloud ist zum Beispiel DBpedia. Neben Agrovoc gibt es weitere Ontologien, die den spezifischen Bereich der Lebenswissenschaften abdecken, aus denen wir aktuell noch zwei weitere benutzen. Medical Subject Headings (Akronym: MeSH) enthält Begriffe aus dem Bereich Medizin und semantische Informationen derselben. DrugBank enthält bedeutungstragende Informationen zu Medikamenten und Proteinen.

Woran forschen wir von ZB MED?

Üblicherweise erfolgt die Annotation von Schlagwörtern in Dokumenten manuell. Seit einiger Zeit beschäftigen wir uns mit Methoden, unsere LIVIVO-Metadaten automatisiert semantisch anzureichern, damit wir die Metadaten auch inhaltlich erschließen können. In einer Publikation, die auch bereits zur Veröffentlichung bei einer Konferenz (1) eingereicht wurde, stellen wir einen Ansatz vor, wie wir Metadaten mit Entitäten aus den Ontologien MeSH, Agrovoc und DrugBank semantisch verknüpfen. Die drei Ontologien decken schon ein breites Spektrum im Bereich der Lebenswissenschaften ab. Für die automatisierte Anreicherung benutzen wir ein JAVA-Framework, dass von IBM entwickelte wurde und als Open Source mit dem Namen UIMA (Unstructured Information Management Architecture) verfügbar ist. Das Framework ist beliebig mit weiteren Ontologien erweiterbar.

Die Entitäten der LOD Cloud werden mithilfe des Apache UIMA Frameworks aus den Metadaten extrahiert. Im ersten Schritt lesen wir Titel und Abstract aus unserer Wissensdatenbank, danach erfolgt mit einem sogenannten Offset-Tokenizer die Zerlegung der Sätze in einzelne Wörter. Dabei berücksichtigt der Offset-Tokenizer sowohl einzelne Wörter wie „brain“, als auch zusammengesetzte Nomen wie „epileptic seizures“ oder „Long QT Syndrome“ als jeweils ein Token. Die einzelnen Tokens werden mit dem Conceptmapper semantisch mit den entsprechenden Einträgen aus den Ontologien annotiert. Zum Schluss werden die annotierten Daten in die Wissensdatenbank aufgenommen.

In den Metadaten von LIVIVO wurden mehr als 1 Milliarde Entitäten gefunden. Die meisten von ihnen stammen aus MeSH (531 Millionen), gefolgt von Begriffen aus Agrovoc (447 Millionen) und Drugbank (50 Millionen).

Unsere ersten Ergebnisse

Als erste Anwendung haben wir die Ergebnisse unserer Arbeit als Wordcloud grafisch dargestellt. Dazu haben wir aus jeder Ontologie die 100 am häufigsten gefundenen Begriffe aus der Wissensdatenbank extrahiert und mit Wordclouds visualisiert. Mit Hilfe eines Schiebereglers lässt sich die Grafik in der Anwendung skalieren. Auf Basis dieser Wordclouds können dann Services entwickelt werden.

Wordcloud

Diese Wordcloud zeigt die 100 am häufigsten gefundenen Begriffe mit Agrovoc.

Der Prototyp der Applikation ist bereits online verfügbar. Mithilfe des Ansatzes, Begriffe automatisch aus unseren Metadaten zu extrahieren, wollen wir in Zukunft neue Funktionen für LIVIVO anbieten. Sobald es dort Neuigkeiten gibt – und diese werden auch nicht lange auf sich warten lassen – erfahren Sie es zuerst hier im ZB MED-Blog!


(1) Bernd Müller / Alexandra Hagelstein: Beyond Metadata – Enriching life science publications in LIVIVO with semantic entities from the linked data cloud. Köln, 2016. Wissenschaftliche Publikation eingereicht zur Konferenz „Semantics“, Leipzig


Links zu Ontologien:
Agrovoc
MeSH
DrugBank
DBpedia

 

Das perfekte Webinar – Ergebnisse einer ZB MED-Umfrage

Bequem vom Arbeitsplatz oder von zuhause aus, am PC oder Tablet, zeitlich flexibel den beruflichen oder privaten Horizont erweitern und in den direkten Austausch mit Fachexperten kommen? Webinare machen’s möglich.

Auch wir bei ZB MED möchten zukünftig mit Webinaren über unsere Produkte und Services informieren. Das Format wird für alle Interessierten zur Verfügung stehen, sich aber in erster Linie an multiplizierende Personen wie Bibliothekarinnen und Bibliothekare richten. Studierende und Forschende, so ein Ergebnis einer Befragung im Rahmen einer Usability-Studie an LIVIVO 2015, bevorzugen statt Webinaren kurze Online-Videos wie ZB MED sie bereits für Ihre Services GMS, DOI-Vergabe & Co. anbietet (zum YouTube-Channel von ZB MED).

Wir möchten dabei unsere Angebote möglichst nah an den Wünschen und Erwartungen unserer Nutzerinnen und Nutzer entwickeln. Daher haben wir Personen aus unserer Zielgruppe zu einer Online-Umfrage eingeladen, um mehr über deren Vorstellungen zu erfahren. 59 Personen füllten die Umfrage vollständig aus und erlaubten uns teils sehr detaillierte Einblicke in ihre Ansichten.

Zunächst ein bisschen Demographie:Sozio-Demographie_kleinDie Befragten waren zwischen 29 und 64 Jahre alt und kamen aus ganz Deutschland, nur 4% aus dem direkten ZB MED-Einzugsgebiet (Köln/Bonn). 86% waren Bibliothekarinnen und Bibliothekare, der Rest entstammte der Wissenschaft (z.B. Lehrende an Hochschulen). Es beteiligten sich Vertreter aller ZB MED-Fachgebiete Medizin, Gesundheitswesen, Ernährungs-, Umwelt- und Agrarwissenschaften. Das Fachgebiet Medizin war dabei mit 72% am häufigsten vertreten, dafür waren aber auch Personen aus dem Bereich der Naturwissenschaften (7%), wie Biologie oder Chemie unter den Befragten.

Die Befragung hat interessante Ansätze für die Ausgestaltung von ZB MED-Webinaren ergeben:
Das ideale Webinar findet demnach am Vormittag oder frühen Nachmittag statt, der Termin vermeidet dabei Montage und Freitage. Mit 30 bis maximal 45 Minuten ist es kurz gehalten. Eingeladen wird per E-Mail, bei produktbezogenen Webinaren auch gerne über einen Hinweis beim Produkt selbst, wie z.B. in LIVIVO. Das Webinar verwendet interaktive Elemente wie Chat und Downloadmöglichkeiten, sowie Umfragen und Feedback-Buttons (z.B. für „Hand heben“, „Applaus“). Im Nachgang steht eine Aufzeichnung des Webinars als Download zur Verfügung, Chat & Co. sind dabei jedoch anonymisiert.

Themen ZB MED-WebinareGefragte Themen für ZB MED-Webinare sind in erster Linie das ZB MED-Suchportal LIVIVO, sowie die Beratung zum Thema Open-Access-Publizieren und das Publikationsportal PUBLISSO. Nach Ansicht der Befragten sollte das Format von ZB MED quartalsweise oder bei Bedarf zu unterschiedlichen Themen angeboten werden.

Freitext-Felder in der Befragung wurden rege genutzt, um auch konkrete Fragestellungen anzusprechend. Einige dieser Anregungen sind bereits in Hilfetexte und Schulungen für LIVIVO oder PUBLISSO eingeflossen, z.B. zur Transparenz der Suche und der Rankingkriterien.

Auf Basis dieser Ergebnisse wird nun ein passendes Angebot entwickelt. Die ersten Webinare für die ZB MED-Produkte PUBLISSO und LIVIVO gehen in Kürze an den Start.

Ein Jahr LIVIVO – ein Rückblick

Der 15.04.2015 war für ZB MED ein ganz besonderer Tag. Nach nur 17 Monaten interner Vorarbeit ging das neue ZB MED-Suchportal Lebenswissenschaften online: LIVIVO.

Beta-Logo des ZB MED-Suchportals LIVIVO

Das neue ZB MED-Suchportal Lebenswissenschaften ging am 15.04.2015 als Beta-Version online.

Die Beta-Version des Portals bot bereits alle wichtigen neuen Features: Modernes, responsives Design, interdisziplinäre Recherchemöglichkeiten, verbesserte Nutzerführung, Filterung nach Fachgebieten und Einbindung von Forschungsdaten.

Um dies zu ermöglichen, herrschte in den Monaten vor dem Online-Gang intern Ausnahmezustand! Mehrere Entwicklungen wurden – teils mit externer Unterstützung – parallel realisiert:

  • Namensfindung: Der neue Name LIVIVO stellt den Bezug zum lebenswissenschaftlichen Fächerspektrum her (lat. vivo=ich lebe). Anders als vielfach angenommen, handelt es sich dabei nicht um eine Abkürzung (z.B. steht das LI in LIVIVO nicht für Leibniz-Informationszentrum bzw. Literatur). Das Kunstwort wurde u.a. wegen seiner internationalen Verwendbarkeit als neuer Name ausgewählt; es erzeugt in den meisten europäischen Sprachen positive Assoziationen.
  • Usability: Die Überarbeitung der Nutzerführung der alten Portale MEDPILOT und GREENPILOT bezog die Erkenntnisse aus früheren Usability-Studien und Fokusgruppeninterviews mit ein. Basierend darauf wurde von einer Usability-erfahrenen Medienagentur zwischen April und November 2014 das neue Layout entwickelt und anschließend mit den Portal-Funktionalitäten wie Dokumentbestellung und Nutzerkonto zusammengeführt.
  • Thematische Filter: Zur thematischen Einordnung aller in LIVIVO nachgewiesenen Literatur in die ZB MED-Fachgebiete wurde eine selbstlernende Software eingesetzt, die auch die Deutsche Nationalbibliothek zur Kategorisierung verwendet. Die Anpassung auf ZB MED-Bedürfnisse und die Nachkonfiguration bis zum Erreichen einer zufriedenstellenden Qualität der automatischen Verarbeitung, nahm mehr als sechs Monate in Anspruch.
  • Suchtechnologie: Die Datenquellen aus MEDPILOT und GREENPILOT wurden in einen gemeinsamen Suchindex überführt, die Suchtechnologie ausgetauscht (Wechsel von einer Eigenentwicklung der Firma Averbis zur Open Source Suchmaschine Solr), und die semantische Komponente aktualisiert (vom Morphosaurus zur Averbis Search Platform). Ziel war es neben der interdisziplinären Recherche, eine bessere Treffergenauigkeit (höhere Precision) der Suchergebnisse zu erreichen. Konfigurationen aus MEDPILOT, die über Jahre gewachsen waren, beispielsweise für Boosting, Ranking und spezielle Anforderungen an die Suche, mussten nun von einem System in das andere übertragen werden bzw. komplett neu konfiguriert werden. Die Arbeit an der Beta-Version ab November 2014 war daher von Konfigurationen der Suchmaschine geprägt.
  • Forschungsdaten: Zu den Lebenswissenschaften passende Forschungsdaten der Platform Dryad wurden ausgewählt und Einbindungsmechanismen auf Basis der PubMedID und der DOI entwickelt.
  • English first: Das komplette Suchportal wurde auf Englisch umgestellt, auch die umfangreichen Hilfebereiche.

Klar, dass dann erstmal gefeiert werden musste, als LIVIVO endlich online gehen durfte – mit selbstgebackenem Kuchen, natürlich in LIVIVO-Farben 😉

Foto des Kuchens

Zur internen Feier des Launchs der Beta-Version von LIVIVO im April 2015 gab es leckeren LIVIVO-Kuchen.

In den nächsten sieben Monaten bis zum offiziellen Start von LIVIVO und dem Verlassen der Beta-Version am 10.11.2015 wurde aber nicht weniger hart gearbeitet. Es gab mehr als 250 kleinere und größere Fehler zu beseitigen, sowie 50 Verbesserungsvorschläge und neue Funktionalitäten einzubauen:

  • Behebung von Fehlern im Layout, z.B. für die Einbindung der Coveranzeigen oder für die Browserkompatibilität (Internet Explorer)
  • Optimierung der Bedienbarkeit des Responsive Designs für kleinere mobile Endgeräte
  • Einbindung aller Link-Resolver aus MEDPILOT/GREENPILOT, sowie mehr als 20 neue für LIVIVO
  • Umstellung der Literaturagenten MEDPILOT/GREENPILOT auf LIVIVO
  • Umstellung des kompletten Portals von http auf https
  • Aktivierung von Schnittstellen für Literaturverwaltungsprogramme wie Citavi, z.B. CoinS-Schnittstelle
  • Einbindung weiterer Datenquellen, z.B. aus BASE
  • Neue Features, z.B. Permalink, Suchhistorie mit mehr Funktionen

Mehr als 500 Rückmeldungen, Kooperationsanfragen und Verbesserungsvorschläge haben uns in dieser Zeit erreicht und erreichen uns heute noch. Sie fließen direkt in die Weiterentwicklung von LIVIVO ein.

Aber wir warten nicht nur darauf, dass uns Nutzerfeedback erreicht. Erst kürzlich haben wir eine Umfrage bezüglich der Ausgestaltung von Webinaren für LIVIVO durchgeführt, auf deren Basis nun ein entsprechendes Angebot entwickelt wird. Und wir testen aktiv weiter die Usability des neuen Portals. Noch während der Beta-Phase haben wir Forschende und Wissenschaftlerinnen/Wissenschaftler zu einer Usability-Studie eingeladen, um LIVIVO zu bewerten: Es gab durchweg positive Rückmeldungen und hilfreiche Anregungen für die Weiterentwicklung. Viele der Anregungen konnten wir bereits umsetzen, so wurden z.B. Icons ausgetauscht, die Bedienung der Suchfilter verbessert und Recherchemöglichkeiten für Forschungsdaten implementiert.

Hintergrundinformationen zur LIVIVO-Usability-Studie 2015:
ZB MED-Pressemitteilung
Einblick in den Ablauf der Usability-Studie und deren Ergebnisse im Blog der TH Köln

Das Verlassen der Beta-Version haben wir am 10.11.2015 beim LIVIVO-Launch mit einem großen Festakt gefeiert.

Foto mit Beteiligten an der Feier

Das LIVIVO-Team beim offiziellen Start des neuen ZB MED-Suchportals LIVIVO am 10.11.2015

Danach sind wir mit voller Kraft in die die Weiterentwicklung eingestiegen: Neue Lizenzmodelle zur überregionalen Nutzung von lokal lizenzierten Inhalten wie E-Books sind integriert worden und das interne Sessionhandling wurde umgestellt, wodurch LIVIVO noch bequemer zu bedienen ist. Intern arbeiten wir an der Entwicklung neuer Features für LIVIVO, wie der Visualisierung von Ergebnissen oder der Weiterentwicklung der semantischen Verarbeitung und der eingebundenen Thesauri. Außerdem laufen Vorbereitungen für die nächsten Usability-Untersuchungen.

In einem Jahr ist viel passiert. Wir finden, der erste Geburtstag von LIVIVO ist wieder ein Grund zum Feiern! Daher veranstalten wir am 19.04.2016 bei ZB MED in Köln einen ganzen Tag mit Informationen, Schulungen und einem Science Slam zum Thema LIVIVO.

Details zum LIVIVO-Tag auf unserer Website
Anmeldeformular zur LIVIVO-Schulung (PDF)

Kommen Sie vorbei und feiern Sie mit uns 🙂