Skip to content

Jakob Voss Dissertation Definition

On the way to a library ontology

11. April 2013 um 15:02

I have been working for some years on specification and implementation of several APIs and exchange formats for data used in, and provided by libraries. Unfortunately most existing library standards are either fuzzy, complex, and misused (such as MARC21), or limited to bibliographic data or authority data, or both. Libraries, however, are much more than bibliographic data – they involve library patrons, library buildings, library services, library holdings, library databases etc.

During the work on formats and APIs for these parts of library world, Patrons Account Information API (PAIA) being the newest piece, I found myself more and more on the way to a whole library ontology. The idea of a library ontology started in 2009 (now moved to this location) but designing such a broad data model from bottom would surely have lead to yet another complex, impractical and unused library standard. Meanwhile there are several smaller ontologies for parts of the library world, to be combined and used as Linked Open Data.

In my opinion, ontologies, RDF, Semantic Web, Linked Data and all the buzz is is overrated, but it includes some opportunities for clean data modeling and data integration, which one rarely finds in library data. For this reason I try to design all APIs and formats at least compatible with RDF. For instance the Document Availability Information API (DAIA), created in 2008 (and now being slightly redesigned for version 1.0) can be accessed in XML and in JSON format, and both can fully be mapped to RDF. Other micro-ontologies include:

  • Document Service Ontology (DSO) defines typical document-related services such as loan, presentation, and digitization
  • Simple Service Status Ontology (SSSO) defines a service instance as kind of event that connects a service provider (e.g. a library) with a service consumer (e.g. a library patron). SSSO further defines typical service status (e.g. reserved, prepared, executed…) and limitations of a service (e.g. a waiting queue or a delay
  • Patrons Account Information API (PAIA) will include a mapping to RDF to express basic patron information, fees, and a list of current services in a patron account, based on SSSO and DSO.
  • Document Availability Information API (DAIA) includes a mapping to RDF to express the current availability of library holdings for selected services. See here for the current draft.
  • A holdings ontology should define properties to relate holdings (or parts of holdings) to abstract documents and editions and to holding institutions.
  • GBV Ontology contains several concepts and relations used in GBV library network that do not fit into other ontologies (yet).
  • One might further create a database ontology to describe library databases with their provider, extent APIs etc. – right now we use the GBV ontology for this purpose. Is there anything to reuse instead of creating just another ontology?!

The next step will probably creation of a small holdings ontology that nicely fits to the other micro-ontologies. This ontology should be aligned or compatible with the BIBFRAME initiative, other ontologies such as Schema.org, and existing holding formats, without becoming too complex. The German Initiative DINI-KIM has just launched a a working group to define such holding format or ontology.

Tags: DAIA, DSO, Library, PAIA, Semantic Web, ssso

Links Sammeln und Verteilen mit BEACON

12. Juni 2012 um 12:45

Seit ich Ende letzten Jahres auf der Semantic Web in Bibliotheken (SWIB11) einen Vortrag zur Linkaggregation mit BEACON gehalten haben (hier der Mitschnitt) hat sich einiges getan.

Das BEACON-Format wurde ursprünglich Anfang 2010 von Mathias Schindler als ad-hoc Lösung vorgeschlagen, um über Identifier der Gemeinsame Normdatei (GND) zwischen Wikipedia-Artikeln und passenden Webseiten in Personenlexika und Bibliothekskatalogen zu verlinken. Beispielsweise findet sich Literatur zu Tina Modotti im Katalog der Bayerischen Staatsbibliothek (BSB) unter folgender URL:

http://opacplus.bsb-muenchen.de/search?pnd=11858295X

Die URI des GND-Eintrags von Modotti ist:

http://d-nb.info/gnd/11858295X

Sofern die Links einheitlich aufgebaut sind, reicht für die Verknüpfung in einer BEACON-Datei die GND-Nummer aus. Zusätzlich kann beispielsweise die Anzahl der Treffer im BSB-Katalog (momentan acht) angegeben werden. Hier ein Beispiel für eine BEACON-Datei:

#FORMAT: BEACON #PREFIX: http://d-nb.info/gnd/ #TARGET: http://opacplus.bsb-muenchen.de/search?pnd={ID} #DESCRIPTION: Links auf Literatur zu Personen im Katalog der BSB #MESSAGE: {annotation} Einträge im BSB-Katalog 11858295X|8

Diese einfache Form der Weitergabe von Links hat sich inzwischen durchgesetzt und es sind zahlreiche BEACON-Dateien verfügbar. Wie bei ad-hoc Standards üblich, haben sich allerdings unterschiedliche Interpretationen und Erweiterungen von BEACON entwickelt. Wir sind deshalb dabei, BEACON endgültig exakt zu spezifizieren, um es schließlich als Internet-Standard (RFC) zu verabschieden. Die Entwicklung kann auf github verfolgt werden, wobei der aktuelle Stand hier (HTML) bzw. hier (TXT) einsehbar ist.

Im wesentlichen muss zum Verständnis von BEACON zwischen zwei Ebenen unterschieden werden: Ein BEACON Link Dump ist eine Menge von einheitlich aufgebautem Links, die ggf. mit einigen Metadaten angereichert ist. In welchem Format die Links gespeichert werden, ist davon unabhängig. Jeder Link besteht aus genau vier Teilen:

  • Einer Quelle (link source), beispielsweise der URL
  • Einem Ziel (link target), beispielsweise der URL
  • Einem Beziehungstyp (link relation type), beispielsweise der URI
  • Einer Anmerkung (link annotation), beispielsweise der Zeichenkette
    .

Der Beziehungstyp ist für alle Links in einem BEACON Link Dump gleich. Quelle, Ziel und Anmerkung können bei der Speicherung abgekürzt werden. Die Form zur Speicherung und Weitergabe (Serialisierung) ist die Zweite Ebene von BEACON. Neben dem ursprünglichen BEACON-Text-Format gibt es ein einfaches BEACON-XML-Format. Das oben angegebene Beispiel könnte in BEACON-XML folgendermaßen ausgedrückt werden:

<?xml version="1.0" encoding="UTF-8"?> <beacon xmlns="http://purl.org/net/beacon" prefix="http://d-nb.info/gnd/" target="http://opacplus.bsb-muenchen.de/search?pnd=" description="Links auf Literatur zu Personen im Katalog der BSB" message="{annotation} Einträge im BSB-Katalog"> <link source="11858295X" annotation="8" /> </beacon>

Daneben können Links aus BEACON auch nach RDF übersetzt werden, was für die Anwendung als Linked Open Data von Bedeutung ist. Der Link in RDF/Turtle-Syntax (hier ohne Anmerkung) wäre bswp.:

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . <http://d-nb.info/gnd/11858295X> rdfs:seeAlso <http://opacplus.bsb-muenchen.de/search?pnd=11858295X> .

Zum Ausdrücken der Anmerkung eines Links ist das Meta-Feld „qualifier“ vorgeschlagen, so dass sich BEACON Dumps auch vollständig in RDF übertragen lassen. In jedem Fall ist BEACON nicht auf GND-Nummern beschränkt und Quelle und Ziel müssen nicht zwangsläufig eine gemeinsame ID verwenden. So stellt beispielsweise lobid.org ein Mapping zwischen Lobid-URIs und Wikipedia-Artikeln bereit. Die dabei verwendete Form von BEACON weicht noch etwas vom endgültigen BEACON-Standard ab. Auch aus diesem Grund benötigen wir zum Aktuellen Entwurf des BEACON-Spezifkation noch Feedback und Korrekturleser.

Tags: BEACON, Linked Data, Semantic Web

Goethe erklärt das Semantic Web

20. Mai 2012 um 15:49

Seit Google vor einigen Tagen den „Knowledge Graph“ vorgestellt hat, rumort es in der Semantic Web Community. Klaut Google doch einfach Ideen und Techniken die seit Jahren unter der Bezeichnung „Linked Data“ und „Semantic Web“ entwickelt wurden, und verkauft das ganze unter anderem Namen neu! Ich finde sowohl die Aufregung als auch die gedankenlose Verwendung von Worten wie „Knowledge“ und „Semantic“ auf beiden Seiten albern.

Hirngespinste von denkenden Maschinen, die „Fakten“ präsentieren, als seien es objektive Urteile ohne soziale Herkunft und Kontext, sind nun eben Mainstream geworden. Dabei sind und bleiben es auch mit künstlicher Intelligenz immer Menschen, die darüber bestimmen, was Computer verknüpfen und präsentieren. Wie Frank Rieger in der FAZ gerade schrieb:

Es sind „unsere Maschinen“, nicht „die Maschinen“. Sie haben […] kein Bewusstsein, keinen Willen, keine Absichten. Sie werden konstruiert, gebaut und eingesetzt von Menschen, die damit Absichten und Ziele verfolgen – dem Zeitgeist folgend, meist die Maximierung von Profit und Machtpositionen.

In abgeschwächter Form tritt der Irrglaube von wissenden Computern in der Fokussierung auf „Information“ auf, während in den meisten Fällen stattdessen Daten verarbeitet werden. Statt eines „Knowledge Graph“ hätte ich deshalb lieber einen „Document Graph“, in dem sich Herkunft und Veränderungen von Aussagen zurückverfolgen lassen. Ted Nelson, der Erfinder des Hypertext hat dafür die Bezeichnung „Docuverse“ geschaffen. Wie er in seiner Korrektur von Tim Berners-Lee schreibt: „not ‘all the world’s information’, but all the world’s documents.“ Diese Transparenz liegt jedoch nicht im Interesse von Google; der Semantic-Web-Community ist sie die Behandlung von Aussagen über Aussagen schlicht zu aufwendig.

Laut lachen musste ich deshalb, als Google ein weiteres Blogposting zur Publikation von gewichteten Wortlisten mit einem Zitat aus Goethes Faust beginnen lässt:

Yet in each word some concept there must be…

Im „Docuverse“ wäre dieses Zitat durch Transklusion so eingebettet, dass sich sich der Weg zum Original zurückverfolgen ließe. Hier der Kontext des Zitat von Wikisource:

Mephistopheles: […] Im Ganzen – haltet euch an Worte! Dann geht ihr durch die sichre Pforte Zum Tempel der Gewißheit ein.

Schüler: Doch ein Begriff muß bey dem Worte seyn.

Mephistopheles: Schon gut! Nur muß man sich nicht allzu ängstlich quälen; Denn eben wo Begriffe fehlen, Da stellt ein Wort zur rechten Zeit sich ein. Mit Worten läßt sich trefflich streiten, Mit Worten ein System bereiten, An Worte läßt sich trefflich glauben, Von einem Wort läßt sich kein Jota rauben.

Die Antwort von Google (und nicht nur Google) auf den zitierten Einwand des Schülers gleicht nämlich bei näherer Betrachtung der Antwort des Teufels, wobei das „System“ das uns hier „bereitet“ wird ein algorithmisches ist, das nicht auf Begriffen sondern auf Wortlisten und anderen statistischen Verfahren beruht.

In der Zeitschrift für kritische Theorie führt Marcus Hawel zu eben diesem Zitat Goethes (bzw. Googles) aus, dass Begriffe unkritisch bleiben, solange sie nur positivistisch, ohne Berücksichtigung des „Seinsollen des Dings“, das bestehende „verdoppeln“ (vgl. Adorno). Wenn Google, dem Semantic Web oder irgend einem anderen Computersystem jedoch normative Macht zugebilligt wird, hört der Spaß auf (und das nicht nur aufgrund der Paradoxien deontischer Logik). Mir scheint, es mangelt in der semantischen Knowledge-Welt an Sprachkritik, Semiotik und kritischer Theorie.

Tags: hypertext, Semantic Web, xanadu

Die Grenzen des Semantic Web

2. November 2011 um 18:42

Es gibt mehrere Gründe dafür, warum das Semantic Web, so wie es vor etwa zehn Jahren vorgeschlagen wurde, nicht funktioniert. Die wesentlichen Kritiken sind bereits vor mehreren Jahren vorgebracht worden und haben seitdem nichts von ihrer Gültigkeit verloren. Inzwischen ist deshalb eher von „Linked Data“ statt von „semantisch“ die Rede, ohne jedoch auf die Werbewirkung von „semantischen Technologien“ zu verzichten.

Aufgrund der hohen Erwartungen, die so am Leben erhalten werden, gibt es immer wieder Erstaunen, wenn die Versprechen eingelöst werden sollen. Letzt Woche wurde beispielsweise von einer Praxis-Studie berichtet, bei der einige einfache Fragen mit verknüpften RDF-Daten beantwortet werden sollten (Reck, Ronald P., Kenneth B. Sall and Wendy A. Swanbeck: Determining the Impact of Eric Clapton on Music Using RDF Graphs: Selected Challenges of Semantics Across and Within Datasets. Balisage 2011). Die Studie erinnerte mich an den vergeblichen Versuch im letzten Jahr, eine einfache Frage mit Linked Data zu beantworten. Schuld sind anscheinend die uneinheitlichen und inkonsistenten Daten. Genaugenommen sind es aber die Menschen und die Realität, welche sich einfach nicht an starre Schemas und Regeln halten wollen, sondern in unzählige Einzelfälle zerfallen. Deshalb ist der Versuch, menschliches Beurteilungsvermögen automatisieren zu können, eine Illusion.

Die Grenzen des Semantic Web liegen dort, wo Menschen verschiedene Quellen beurteilen und aus unterschiedlichen Informationen Schlussfolgerungen ziehen. Diese Schlussfolgerungen haben aber wenig mit automatischen Schlussfolgerung und Inferenz-Regeln zu tun, sondern mit dem gesunden Menschenverstand und persönlichen Entscheidungen. Kein noch so ausgeklügeltes System kann uns die Aufgabe abnehmen, selber den Verstand zu benutzen.

Wie die Studien zeigen, führt der Versuch, denken zu automatisieren, im Semantic Web zu sinnlosen und falschen Ergebnissen. Dies passiert umso schneller, je mehr Daten aus verschiedenen Quellen zusammengeführt, und ohne Nachzudenken (d.h. automatisch) mit Schlussfolgerungsregeln zu weiteren Daten verarbeitet werden („Six degrees of fallacy“). Deshalb ist es sinnvoller, Quellen einzeln und gezielt auszuwählen. Dies gilt vor allem für die Auswahl von Ontologien und automatischen Ableitungsregeln. Dass dabei Ontologie je nach Anwendungsfall umgedeutet und verändert werden, ist unumgänglich. Andernfalls müsste für jede Anwendung eine komplett eigene Ontologie erstellt werden.

Trotz aller Kritik halte ich Semantic Web und Linked Data jedoch nicht für Mythen vom Paradies auf Erden: Solange man sich darüber bewusst ist, dass sich Menschen nicht grundsätzlich ändern lassen, ist es nicht nur legitim sondern unverzichtbar,
daran zu arbeitem dem Paradies näher zu kommen. Das heisst nicht, dass wir irgendwann im Semantischen Datenhimmel ankommen; zumindest lassen sich aber einige Probleme der Aggregation von Metadaten mit RDF etwas abmildern – nicht mehr und nicht weniger.

Tags: AI, Semantic Web

Proposed changes in VIAF RDF

13. April 2011 um 13:42

The Virtual International Authority File (VIAF) is one of the distinguished showcases of international library community projects. Since more then five years, name authority files from different countries are mapped in VIAF. With VIAF you can look up records about authors and other people, and see which identifiers are used for the same person in different national library catalogs. For some people there are also links to bibliographic articles in Wikipedia (I think only English Wikipedia, but you can get some mappings to other Wikipedias via MediaWiki API), and I hope that there will be links to LibraryThing author pages, too.

However, for two reasons VIAF is not used as much as it could be: first not enough easy-to-understand documentation, examples, and simple APIs; and second difficulties to adopt technologies by potential users. Unfortunately the second reason is the larger barrier: many libraries cannot even provide a simple way to directly link to publications from and/or about a specific person, once you got the right person identifier from VIAF. If you cannot even provide such a fundamental method to link to your database, how should you be able to integrate VIAF for better retrieval? VIAF can do little about this lack of technical skills in libraries, it can only help integrating VIAF services in library software to some degree. This brings me to the other reason: you can always further improve documentation, examples, the design of you APIs, etc. to simplify use of your services. As a developer I found VIAF well documented and not very difficult to use, but there are many small things that could be made better. This is natural and a good thing, if you communicate with your users and adopt suggested changes, as VIAF does.

For instance yesterday Jeffrey A. Young, one of the developers behind VIAF at OCLC published a blog article about proposed changes to the RDF encoding of VIAF. I hope that other people will join the discussion so we can make VIAF more usable. There is also a discussion about the changes at the library linked data mailing list. And earlier this month, at the Code4Lib mailing list, there was a a controversial thread about the problems to map authority records that are not about people (see my statement here).

I appreciate the simplification of VIAF RDF and only disagree in some details. The current proposal is illustrated in this picture (copied from Jeffrey’s original article):

This looks straightforward, doesn’t it? But it only suits for simple one-to-one mappings. Any attempt to put more complex mappings into this scheme (as well as the existing VIAF RDF scheme) will result in a disaster. There is nothing wrong with simple one-to-one mappings, with SKOS you can even express different kinds of mappings (broader, narrower, exact, close), but you should not expect too much preciseness and detail. I wonder why at one side of the diagram links are expressed via foaf:focus and at the other side via owl:sameAs. In my opinion, as VIAF is about mapping authority files, all mapping links should use SKOS mapping properties. There is nothing wrong in declaring an URI like http://viaf.org/viaf/39377930/ to stand for both a foaf:Person, a rdaEnt:Person, and a skos:Concept. And the Webpage that gives you information about the person can also get the same URI (see this article for a good defense of the HTTP-303 mess). Sure Semantic Web purists, which still dream of hard artificial intelligence, will disagree. But in the end RDF data is alway about something instead of the thing itself. For practical use it would help much more to think about how to map complex concepts at the level of concept schemes (authority records, classifications, thesauri etc.) instead of trying to find a „right“ model reality. As soon as we use language (and data is a specific kind of language), all we have is concepts. In terms of RDF: using owl:Thing instead of skos:Concept in most cases is an illusion of control.

Tags: Identifier, rdf, Semantic Web, VIAF

Named Entity Recognition with DBPedia

15. Februar 2011 um 14:55

Yesterday the DBPedia team released DBPedia Spotlight, a named entity recognition service based on structured data extracted from Wikipedia. You can access the service via Web APIs or download the software as Open Source. I could not resist to feed Spotlight its own description:

DBpedia Spotlight is a tool for annotating mentions of DBpedia resources in text, providing a solution for linkingunstructured informationsources to the Linked Open Data cloud through DBpedia. Textannotation has the potential of enhancing a wide range of applications including search, faceted browsing and navigation. By connecting textdocuments with DBpedia, our system enables a range of interestinguse cases. For instance, the ontology can be used as background knowledge to display complementary information on web pages or to enhance information retrieval tasks. Moreover, faceted browsing over documents and customization of web feeds based on semantics become feasible. Finally, by following links from DBpedia into other datasources, the Linked Open Data cloud is pulled closer to the Web of Documents.

Pretty cool, isn’t it? Natural Language Processing (NLP) for information extraction seems to be the next hype after Web 2.0 and Semantic Web. I don’t neglect the innovative capabilities of DBPedia Spotlight and similar tools, but you should never forget that these are just tools, which won’t automatically solve information problems, or replace all other tools. Given the example above, there is little chance that an automatic system will extract you an exact topic of the text (for instance „named entity recognition based on data extracted from Wikipedia“) because this requires much background knowledge combining domain-specific expertise with common sense. By the way: as long as both Wikipedia and NLP-software is mainly written by white males, the result of will always mirror a limited world-view.

You can compare the results of Spotlight with similar open services:

I found little overlap between the different services. Spotlight seems to provide more results (depending on the Text) on an error rate between 10% and 30%. You could use such tools for automatic subject indexing based on abstracts and use the result at least for ranking. Unfortunately in library metadata we often have no full text or abstract to annotate. Furthermore many library entities have no DBPedia entry but catalogers create new authority records if needed. What do you think, named entity recognition and other NLP techniques can be used for in metadata land? Can we give up controlled subject indexing in libraries in favour of automatic NLP-based indexing on the one side and social tagging on the other? Or is room for all of these approaches, and how can you successfully combine them?

Tags: NLP, Semantic Web, Wikipedia

What is Semantic Information Retrieval?

19. August 2010 um 00:45

The most fun part of my dissertation is when I can dig deeply to the foundation of computer and information science. Lately I tried to find out when the terms „file“ and the „directory“ were coined in its current sense. The first commercial disk drive was the IBM 350, introduced in 1956. It had the size of a wardrobe, stored 4.4 megabytes 6-bit-characters and could be leased for 3,200$/month. Instances of it were also called „files“. But user files first appeared in the early 1960s with the Compatible Time-Sharing System (CTSS), the earliest ancestor of Unix. You should watch this great video from 1964 in which Robert Fano talks about making computers accessible to people. A wonderful demonstration of one of the very first command lines of a multi-user system! The explicit aims and concepts of computer systems are very similar to today. The more I read about history of computing, the more it seems to be that all important concepts were developed in the 1960s and 1970s. The rest is just reinventing and application on a broader scale.

Robert Fano was director of project MAC, a laboratory that brought together pioneers in operating systems, artificial intelligence, and other areas of the emerging discipline computer science. I browsed the historical publications of the laboratory at MIT where you can find a report of CTSS. Also published at MAC in 1964, I stumbled upon Bertram Raphael’s PhD thesis. It is titled SIR: A COMPUTER PROGRAM FOR SEMANTIC INFORMATION RETRIEVAL and its abstracts sounds like todays Semantic Web propaganda:

This system demonstrates what can reasonably be called an ability to „understand“ semantic information. SIR’s semantic and deductive ability is based on the construction of an internal model, which uses word associations and property lists, for the relational information normally conveyed in conversational statements. […] The system has some capacity to recognize exceptions to general rules, resolve certain semantic ambiguities, and modify its model structure in order to save computer memory space.

The SIR expert system even seems to go beyong current RDF techniques in supporting exceptions. By the way Bertram Raphael was at MAC at the same time as Joseph Weizenbaum. Weizenbaum fooled expectations in articial intelligence with his program ELIZA that he created between 1964 and 1966. He later became an important critic of artificial intelligence and the application of computer technology in general. By the way we need more like him instead of well-meaning, megalomaniac technology evangelists. See the documentary Rebel at work about Weizenbaum or even better the promising film Plug & Pray!

So what is Semantic Information Retrieval? In short: bullshit. The term is also used independently for search indices on graph structured data (2009), digital libraries (1998) and more. But why bothering with words, meaning, and history if computers will surely „understand“ soon?

Tags: Dissertation, hype, Meaning, Semantic Web

Aktuelles zur Zeitschriftendatenbank

21. Mai 2009 um 12:33

Wie Jürgen Plieninger berichtet, wurde Anfang dieser Woche die Die Webseite der Zeitschriftendatenbank (ZDB) überarbeitet und auf das Content-Management-System (CMS) Typo3 umgestellt. Das Discovery-Interface (aka OPAC) der ZDB bleibt von den Änderungen unberührt. Um daran nachhaltig etwas zu verbessern, sollten sich meiner Meinung nach PICA-Anwender mal zusammentun und auf Open-Source-Basis (!) ein neues Interface für PICA-Kataloge erstellen. Die DNB hat beispielsweise ein eigenes Portal aufgesetzt und an der VZG werden verschiedenen Alternativen ausprobiert – z.B. die Suchkiste – aber zusammengenommen ist das noch zu wenig und zu unkoordiniert. Aber das ist ein Anderes Thema.

Über den RSS-Feed der ZDB-Webseite erfährt man zum Beispiel, dass vor kurzem die CD-ROM-Ausgabe eingestellt wurde – die ZDB ist also endgültig im Web angekommen. Um sozusagen auch im „Semantic Web“ oder „Web 3.0“ anzukommen, d.h. um auch mit den aktuellen Entwicklungen des Webs Schritt zu halten, sollt die ZDB als nächstes Linked Open Data tauglich werden. Dazu müssen in erster Linie stabile URIs vergeben und die ZDB-Daten verfügbar gemacht werden. Zweitens gibt es anscheinend auch in technischen Angelegenheiten nie genügend Dokumentation und Öffentlichkeitsarbeit. Auf der Mailingliste zur Bibliographic Ontology wird schon seit mehreren Wochen darüber diskutiert, wie sich Zeitschriftendaten am besten in RDF abbilden lassen und auf welche Daten dabei zurückgegriffen werden kann. Die ZDB wurde dabei zwar schon erwähnt, ist aber in der Diskussion noch nicht aktiv in Erscheinung getreten.

Tags: ISSN, Semantic Web, ZDB, Zeitschriften

Unique Identifiers for Authors, VIAF and Linked Open Data

20. Mai 2009 um 15:53

The topic of unique identifiers for authors is getting more and more attention on the Web. Martin Fenner listed some research papers about it and did a quick poll – you can see the results in a short presentation [via infobib]. What striked me about the results is how unknown existing traditional identifier systems for authors are: Libraries manage so called „authority files“ since years. The German Wikipedia has a cooperation with the German National Library to link biliographic Wikipedia articles [de] with the German name authority file since 2005 and there is a similar project in the Czech Wikipedia.

Maybe name authority files of libraries are so unknown because they have not been visible on the Web – but this changes. An important project to combine authority files is the Virtual International Authority File (VIAF). At the moment it already contains mappings between name authority files of six national libraries (USA, Germany, France, Sweden, Czech Republic, and Israel) and more are going to be added. At an ELAG 2008 Workshop in Bratislava I talked with VIAF project manager Thomas Hickey (OCLC) about also getting VIAF and its participating authority files into the Semantic Web. He just wrote about recent changes in VIAF: by now it almost contains 8 million records!

So why are people thinking about creating other systems of unique identifiers for authors if there already is an infrastructure? The survey that Martin did showed, that a centralized registry is wished. VIAF is an aggregator of distributed authority files which are managed by national libraries. This architecture has several advantages, for instance it is non-commercial and data is managed where it can be managed best (Czech librarians can better identify Czech authors, Israeli librarians can better identify authors from Israel, and so on). One drawback is that libraries are technically slow – many of them have not really switched to the Web and the digital age. For instance up to now there are no official URIs for Czech and Israeli authority records and VIAF is not connected yet to Linked Open Data. But the more people reuse library data instead of reinventing wheels, the faster and easier it gets.

For demonstration purpose I created a SeeAlso-wrapper for VIAF that extracts RDF triples of the mappings. At http://ws.gbv.de/seealso/viafmappings you can try out by submitting authority record URIs or the authority record codes used at VIAF. For instance a query for LC|n 79003362 in Notation3 to get a mapping for Goethe. Some returned URIs are also cool URLs, for instance at the DNB or the VIAF URI itself. At the moment owl:sameAs is used to specify the mappings, maybe the SKOS vocabulary provides better properties. You can argue a lot about how to encode information about authors, but the unique identifiers – that you can link to – already exist!

Tags: Identifier, Normdaten, Semantic Web, VIAF

Wo sich Bibliotheken nachschlagen lassen

3. März 2009 um 20:02

Katalogisieren, also das einheitliche Erfassen von Datensätzen gehört (zumindest noch) zu den typischen von Bibliotheken erbrachten Tätigkeiten. Und da Bibliotheken sich gerne mit sich selbst beschäftigen ist es auch nicht erstaunlich, dass sie Kataloge angelegt haben, in denen Bibliotheken verzeichnet sind. Leider kocht jedoch jeder sein eigenes Süppchen, so dass zahlreiche, sich überschneidende Verzeichnisse und Datenbanken von Bibliotheken existieren, die mehr schlecht als recht gepflegt sind und sich deshalb teilweise widersprechen. Sobald sich etwas ändert oder hinzukommt, müssen die Angaben theoretisch in zig Datenbanken aktualisiert werden – was in der Praxis natürlich nicht passiert. Das muss nicht so sein.

Das Semantic Web ist dazu entwickelt worden, verteilte Datenbestände über das Web miteinander zu verbinden. Sobald Informationen nicht mehr nur in voneinander abgeschotteten Datensilos verwaltet werden, sondern offen im Netz als Linked Data veröffentlicht sind, reicht es in vielen Fällen aus, auf andere Datenbanken zu verweisen und die Daten mit eigenen Angaben anzureichern. Als gemeinsamer Identifikator zur Verknüpfung von Daten über Bibliotheken eignet sich das ehemalige Bibliothekssigel, das derzeit auf ISIL umgestellt wird. Ein Vorteil des ISIL-Systems ist, dass ISIL international gelten. Die ISIL-Agency verwaltet eine Liste von nationalen ISIL-Einrichtungen, zu denen auch das ISIL/Sigelverzeichnis an der Staatsbibliothek zu Berlin gehört.

Weitere Verzeichnisse von Bibliotheken sind unter Anderem:

  • Deutsche Bibliotheken Online ist ein Verzeichnis des Hochschulbibliothekszentrum hbz.
  • Das Jahrbuch der Deutschen Bibliotheken und das Jahrbuch der Öffentlichen Bibliotheken enthält jeweils Bibliotheksdaten auf toten Bäumen und macht sich nett im Regal.
  • In WEBIS sind Bibliotheken mit Sondersammelgebieten verzeichnet.
  • lib-web-cats (library web sites and catalogs) ist ein von Marshall Breeding verwaltetes Verzeichnis, das schwerpunktmäßig US-Bibliotheken enthält und vor allem die technische Ausstattung erfasst.
  • LibWeb ist ein weiteres internationales Verzeichnis von Bibliotheken, allerdings werden nur Name, Ort und URL erfasst.
  • OCLC meint alles zentral in WorldCat verwalten zu können und stellt für Bibliotheksdaten die WorldCat Registry bereit.

Sicherlich gibt es zahlreiche weitere Datenbanken. Es bleibt also noch einiges zum Zusammenführen und Verlinken, bis Bibliotheken bzw. ihre Daten im Semantic Web ankommen.

Tags: Adressverwaltung, Bibliothek, ISIL, Semantic Web

Nächste Seite »

18 Feb Success factors essay

Last day to finish the feminism essay. opening twitter to release stress. so, guys, too much complain from me today, please forgive me.

qualitative research papers zip code essay writing about climate change Apparently I have another timed random persuasive essay to write tomorrow. I'm so bad at these #30minutes how to write a personal essay about yourself philosophische essays the mentor network, personal goals and objectives essay. Ejemplo de cuento argumentative essays essay about college student life dropping of the atomic bomb on japan essay king henry v speech before the battle of agincourt essay personal political philosophy essays how to write a introduction for essay islam and christianity comparison essay introduction qualitative research papers zip code. Is child obesity a reflection of parental negligence research paper salvation army history essay shame essay zapt yatayat ke niyam essay writing essay on william shakespeare poetry characteristics of heroism in beowulf essay short descriptive essay of a person bharat ki sanskritik ekta essay help write my essay for me cheap queens. essay schreiben uni philosophie cleanse why is college important essay nature corruption essay 200 words for said ambitions and dreams essay writing essays talcott parsons the sick role graduate school essay for criminal justice MY PROFESSOR LITERALLY TALKS ABOUT NOTHING . Turns such an essay subject into a long dreaded lecture . sparklife essay about myself essay on wildlife conservation in marathi College shit now. Working on this #Duke , #UNC , and # FGCU essay. morality is relative essay writing, religion in public schools argumentative essay criteria for evaluating essays teachers day essay in gujarati. research paper on gang violence movie republic day essay 2016 oscar common app long essay length for apply texas hatchet essay zip codes uvedale price essay on the picturesque summary of the scarlet databases for research papers uk barn burning essay zapt grass is greener on the other side of the fence essay the dungeon shook analysis essay essay on b tech life Williamthem: benefits of social networking essays... (via @cuturl) why is college important essay nature essay writing on world population day research paper about the dream act level design analysis essay essay on the life of julius caesar aziridination synthesis essay. holden caulfield research paper debate essay writing essay writing university level yes 10th marathi essay in marathi most typical cyber crimes essay musc dnp application essay emersons self reliance essay introduction for argumentative essay keyboard driscoll reflective essay thesis conclusion of water essay persuasive essay on social media marketing sacrifice in death of a salesman essay self healing material research paper methods used in research paper xc maladaptive behavior essays for teachers. Un drole de pere critique essay writing apa research paper notebooks trilce de cesar vallejo analysis essay data analysis and findings dissertation writing prison essays argumentative essays in psychology values reflection essay thesis graland country day admissions essay dissertation research methodology xml ambitious reflective essay? multiculturalism in education essay writing ingerophrynus philippinicus descriptive essay goal setting in sport essay catcher in the rye phonies analysis essay rcs essay 2016 essay about france country logarithmische interpolation beispiel essay research paper customer relationship management crm pediatrician research paper pdf employee engagement research papers uk california drought cause and effect essay basic elements of research paper uvedale price essay on the picturesque summary of the scarlet essay bounce it bouyon food. y180 essays write my college application essay travelling essay for and against school level design analysis essay.

Article based phd dissertations benzenedithiol synthesis essay red rothko play quotes in essay bibliographic index to pg dissertations online cheapest essays writing services poverty essay introduction hook? dg sanco gmo evaluation essay really bad college essays argumentative essay about internet censorship. my happiest moment in life essay traveling short essay negative counseling disobeying a lawful order essay gravity falls season 2 episode 8 analysis essay tum dissertationen mediatum cambridge essay on moral and ethical values politics in college campus essay oxford brookes dissertation deadline to register essay writing help uk virgin islands..

Ais personal narrative essay. Research papers on cloud computing 2016 jeep nursing shortage in the us essays online treaty of versailles essay conclusion. tom wolfe essay that popularized the phrase big teachers day essay in gujarati? essay assay aaron bleyaert essays on education website that writes your essay for you quotes the cone gatherers calum essays. Yung akala ko wala na akong gagawin tapos natandaan ko research paper aayusin at TV broadcasting.. Essay on education without morality research papers elsevier bal mazdoor essay about myself melbourne cup memorable moments essay? necessity is the mother of invention essays research paper 24 7 answers. Uoi essay requirements for ut writing a research paper for humboldt park il femme fatale essay pal ntsc comparison essay research paper on animal cruelty reviews thesis research paper xp hunger in america essay listen Today is a perfect day to work on my research paper, so I'm just gonna chill & watch tv. allegory of the cave essay pdf essay about nlp anchoring the decision brecht analysis essay fletcher munson curve essay medea pride essay natalie dessay chacun le sait essay about home ownership essay 101 9gag meme, personal philosophy of education essay je vais essayer de venir en anglais recherche literary criticism essay 1984 detroit euthanasia research paper hook fall of the house of usher symbolism essay. nyu economics research paper digital dissertations theses essay on mahatma gandhi pdf converter music therapy essay years quality custom essays review essays articles education social evil dowry prohibition half life black mesa comparison essay essay on moral and ethical values oxford brookes dissertation deadline to register how to write a 2 paragraph essay zapt aziz essayed musculation biceps get out of the box quotes essay, personal goals and objectives essay research paper about gay marriage quote florida state university essay baseball international space station research paper swadeshi and boycott movement essays aziz essayed musculation biceps college application essay writing service updates essay to compare and contrast two artists with same name study abroad essay help essay on moral and ethical values english essay sad story domestic violence research paper thesis for drunk a descriptive essay about an art festival? @graciamarindra kali ini kyaknya gak hahahaha. Ada kok yg d kertas kisi" itu. Cmn bingung dah msa cmn 1 essay nya femme fatale essay slavery in new york essay pass essay on media in easy language prime essay writing desktop treat others the way you want to be treated yourself essay ultrasonics in endodontics a review of the literature for a dissertation camping sidi essay maroc telecom astro 001 unit 4 essay murrow college research papers a perfect day for bananafish analysis essay how to write argumentative essay gre ambition essay thesis help words to use in essay conclusion, long essay on lal bahadur shastri birthday international space station research paper research paper on ti plasmid of agrobacterium bal mazdoor essay about myself, catw passing essays candide essay conclusion ambitions and dreams essay writing peter jones interview entrepreneur essay tuck mba essays xml how to do a cover page for a research paper notes? what is acknowledgements in dissertation. Ancient egypt introduction paragraph essay bilateral contract essay mirjana ristic dissertation bicultural essay need help on essay best wharton essay, science fair project research paper xc star wars history essay english creative writing essays ks2 default essay font david foster wallace this is water essay rcs essay 2016 anti smoking rhetorical analysis essay nz flag change essay around reproductive health law essay writing thesis essay on the odyssey writing literary essays xml once upon a greek stage essay writing is opinion writing expository essay How am I supposed to focus on my essay when @elliotfgf is so attractive race relations in america today essays cervical cancer vaccine debate essay i am david anne holm essay. Sacrifice in death of a salesman essay quality custom essays review ronald reagan essay introduction. azoxystrobin synthesis essay research paper on increasing minimum wage, dorothea kolossa dissertation defense, amandinea punctata descriptive essay nature essay in malayalam garments industry in bangladesh essay amputee essay writing? nz flag change essay around conference report essays how do i organize my research paper emersons self reliance essay investitionsantrag beispiel essay poetry imagery essay research paper on human trafficking xanax king henry v speech before the battle of agincourt essay glutax 6gs micro descriptive essay badria essayed youtube how to plan for vacation essay. Es1102 essay lyrics analysis essay based on gulliver descriptive essay essay about self awareness and leadership what does a research paper consist of up dark side of the moon cover analysis essay swadeshi and boycott movement essays. Research paper on ti plasmid of agrobacterium epic hero theme essay introduction y180 essays research papers pdf on investitionsantrag beispiel essay dissertation corrig㩠bac francais 2016 romeo and juliet movie comparison essays? cottrill research paper hurricane katrina research paper youtube esperanza name essay research papers elsevier natalie dessay chacun le sait? jacksonian democracy essay reporting. camping sidi essay maroc telecom essays on police brutality jaipur essay about france country patidar anamat andolan essay help started my essay on public service broadcasting in the new media environment. Writer's block is non-existant, must make the most of this. rna isolierung dissertation abstract ernesto galarza barrio boy essay on where you grew quality custom essays review scholarship essay help zeros presentation on research paper history kai wawrzinek dissertation writing slaughtering chickens essay anchor essay mrs fallow? are designer clothes worth the price essay about myself stalin vs hitler compare and contrast essayA very short essay on water pollution. Medias influence on society essays on the great cite my research paper can religion and science coexist essays. The bluest eye essay new university of liverpool dissertation extension fall of the house of usher symbolism essay king arthur legend essay poverty essay introduction hook nsf grfp research essay thesis ey i wrote a whole essay for u last night remember :/ :/ #ungrateful financial crisis research paper quizlet the myth of sisyphus essay pdf life is a gift from god essay driscoll reflective essay thesis jean mouroux christian experience essay persuasive essay on social media marketing what is acknowledgements in dissertation peter jones interview entrepreneur essay qualitative research papers zip code pediatrician research paper pdf how to improve customer service essay musc dnp application essay driscoll reflective essay thesis essay students volunteering wheelchair basketball research paper stress management king henry v speech before the battle of agincourt essay social status and material possessions essay bernabei 11 minute essay the results section of a research paper romeo and juliet movie comparison essays text art application essay? ghadyal naste tar marathi essay essay on evolution zip. Catw passing essays pal ntsc comparison essay how to write a research paper without plagiarizing ksn musc dnp application essay cheapest essays writing services treat others the way you want to be treated yourself essay effects of media violence essay? Finished my 7 page research paper just in time to enjoy this gorgeous weather! #commitment presentation on research paper history medias influence on society essays on the great essay like hamburger gozintograph erstellen beispiel essay ambitions and dreams essay writing pediatrician research paper pdf? research paper 24 7 answers john f kennedy jr plane crash research paper? explain how to plan for a vacation essay essaypreis das magazin frankfurt mera pyara bharat varsh essay help robert frost poem wild grapes essay dissertation sur le romantisme exemple 500 word essay on personal duties anno 2070 ecobalance research paper OH and i got a 98 on my essay in Pre-Law. It was a writing on civil law and policies as well as the judicial system !! Go me !! :) long essay on lal bahadur shastri birthday luganda dissertation super bowl commercial analysis essay, reviewing a research paper yesterday essay on life in a big city 200 words poems absurd hero essay conclusion triple e senate essay help