vrijdag 11 december 2009
Kosten: Geen
Locatie: SURFfoundation
De bijeenkomst heeft plaatsgevonden op 11 december 2009. Lees meer over de bijeenkomst, bekijk de video's van de presentaties en resultaten.
The Dutch universities have placed 200.000 Open Access publications online on the web. University Libraries worked together within the SURFshare program and created a Repository Infrastructure. In this Infrastructure each Repository is harvested overnnight by NARCIS, the Dutch research portal containing informations about a.o. publications, research projects and people. Each harvest contains new records of the Dutch research output that has been produced that day. The records are described by metadata (structured data). The metadata contains a link to the pdf (unstructured data) and the the national author identifier to uniquely identify the author that has writen the publication.
The Dutch universities have placed 200.000 Open Access publications online on the web. University Libraries worked together within the SURFshare program and created a Repository Infrastructure. In this Infrastructure each Repository is harvested overnnight by NARCIS, the Dutch research portal containing informations about a.o. publications, research projects and people. Each harvest contains new records of the Dutch research output that has been produced that day. The records are described by metadata (structured data). The metadata contains a link to the pdf (unstructured data) and the the national author identifier to uniquely identify the author that has writen the publication.
SURFshare has one question: "What Advanced Search Service for Scientists with high usage potential can you think of, within the reach of current technological state of art, that makes use of the Repository Infrastructure's 'ingredients', that are of benefit to the Dutch researcher?"
For this purpose the SURFshare programme is organising a scouting meeting on Friday the 11th of December 2009, where commercial and research parties concerning search technology, language processing and information retrieval, are invited to come over and show their current state of art, and help us find find a service that is benificial for the researcher at the end of the day.
SURFshare is thinking about a social network of scientics automatically created by the similarity of their publications, where this social network can be integrated with the current social networks like linked-in and facebook. This social network can notify/recommend the researcher when one of his friends/collegues added a new publication in their repository. Questions that might come up during the discussion might be about the feasibility, is the technology ready, is the infrastructure ready, wat might we change to the infrastructure to make it more feasible?
Currently we are inviting parties to join in.
The exact details of the agenda will become more clear towards the meeting date. The draft agenda looks like the following:
| Tijd |
Onderwerp |
Spreker |
| 12:30 |
ontvangst: koffie, thee en broodjes |
|
| 12:45 |
welkomstwoord |
Dr. Marjan Vernooy (SURF) |
| 13:00 |
Key note: semantic web & science 2.0 |
Prof.dr. Frank van Harmelen (VU) |
| 13:25 |
Key note: information retrieval |
Prof.dr. Maarten de Rijke (UvA) |
| 13:50 |
repository infrastructuur |
Maurice Vanderfeesten (SURF) |
| 14:10 |
SURFshare expert finder demo |
Victor van Tol (TeezIR) |
| 14:30 |
zoekdiensten, - producten en -architectuur |
Tigran Spaan (Gridline) |
| 14:50 |
nano-publicaties en concepten wiki |
Albert Mons (NBIC) |
| 15:10 |
koffiepauze |
|
| 15:30 |
creatieve sessie; schets een impressie van een “Advanced Service for Researchers”
breakout sessies and poster presentaties |
breakout sessies en poster presentaties |
| 17:00 |
einde: drankjes en borrelhapjes |
|
We are looking for the following presenters that have a search company or active in the field of Expert finding, language processing, etc.
Possible candidates from the following research departments: Language Processing, Information Retrieval, Semantic Web, Machine Learning, Artificial Intelligence, Online Communities, Social Web Interaction, Web 2.0 expertice, etc.
As an audience you are very welcome to discuss about the Advanced Search Service for Scientists you can think about after listening to the current state of art of the presenters. We are very interesed to hear a voice from the researcher, librarian or repository manager's point of view.
Suggested reading:
Interesting links:
Achtergrond informatie repository infrastructuur:
- Een repository is een digitale bewaarplaats waar de wetenschappelijke jaaroutput (waar mogelijk) open toegankelijk wordt aangeboden
- Elke Universiteit in Nederland heeft zo’n repository en wordt beheerd door de UniversiteitsBibliotheken.
- Alle metadatagegevens van de publicaties in de repositories wordt opgehaald (harvesting) door NARCIS.
- NARCIS is de nationale research portal beheerd door de KNAW
- De metadata van elke publicatie en de full-text in een repository bevat interessante informatie voor Information Retrieval en is eenvoudig uitbreidbaar voor Semantic-web toepassingen
- De gebruikelijke metadata: titel, auteur, beschrijving, publicatie datum, etc.
- De directe link naar de PDF in de repository
- Vocabulaires voor publicatietypen en toegangsrechten
- De (co-)auteurs met DAI
- Persistent Identifier: Elk digitaal kennisobject in de repository heeft een mondiaal uniek nummer (PID). Via de Nationale resolver kan de meest recente/stabiele locatie van dat kennisobject worden opgezocht. Repositories voorzien de resolver van PID’s en URL’s koppels. Verhuizingen en duplicaten van kennisobjecten worden aan de resolver doorgegeven. (nog niet 100% in productie)
- Lange termijn toegang tot kennisobjecten: de Konlinklijke Bibliotheek beheert het E-Depot, een archief voor digitale tekstuele documenten. De van de PDF’s in de repositories wordt een kopie gemaakt in het e-Depot. (nog niet 100% in productie) De resolver wordt op de hoogte gebracht van deze duplicatie. DANS en de 3TU beheren digitale archieven voor data gebruikt bij onderzoek.
- Download statistieken (in ontwikkeling): de repositories geven op uniforme wijze hun download statistieken door van de kennisobjecten. (hits, countries, browsers, etc.) Dit geeft een andere kijk op de waardering en populariteit van kennis.
- Relaties tussen kennisobjecten (in concept): De relaties tussen kennisobjecten (bijv. tussen publicatie, dataset en annotatie) kunnen worden weergegeven met de huidige metadata structuur, maar gebeurt nog niet in productie omgevingen, maar wel in Verrijkte publicatie projecten.
- De repositoryinfrastructuur vormt de samenhang van afspraken tussen al deze onderdelen.