Søk etter relevante deler i tekster med blandet innhold: gjenfinningsforsøk med metadata fra NRKs radioprogram "Ukeslutt"

Author(s)

Publication date

2014

Publisher

Høgskolen i Oslo og Akershus

Document type

Description

Master i bibliotek- og informasjonsvitenskap

Abstract

I denne oppgaven har jeg evaluert gjenfinningen av relevante deler i tekster med blandet innhold i ett gjenfinningssystem. Jeg har utført et gjenfinningsforsøk med metadata fra NRKs radioprogram "Ukeslutt". Programmene er enheten for registreringen i den manuelle indekseringen av metadata i NRKs database. Programmene inneholder flere nyhetsinnslag som er de semantiske enhetene i programmene. Formålet er å evaluere gjenfinningseffektivitet når det søkes i innslag delt hver for seg i forhold til søk i hele programmer, og se om inndelingen etter semantiske enheter forbedrer søkeresultatene. I evalueringen brukes standardmål for gjenfinningseffektivitet, presisjon og fullstendighet, og resultatene for gjenfinningen analyseres kvalitativt. Resultatene viser at det er mulig å finne fram til de enkelte innslagene eller temaene også der søkeenheten er programmene. Forskjellene mellom gjenfinningseffektivitet for søk i innslag og søk i programmer er marginale. Analysen viser også at indekseringspraksis og flere valg knyttet til gjenfinningssystemet påvirker gjenfinningseffektivitet. Det er en kombinasjon av flere faktorer som påvirker søkeresultatene.
In this thesis I evaluate the retrieval of relevant parts of texts with mixed content in a retrieval system. I have performed a retrieval experiment with metadata from the NRK radio programme "Ukeslutt". The programmes are units in the manual indexing of metadata made by NRK. They contain several news items that are semantic units in the programmes. The purpose is to evaluate the retrieval effectiveness when searching for news items indexed as units compared with search in complete programmes, and see if the division by semantic units improves search results. The evaluation uses standard measures of retrieval effectiveness, precision and recall, and the results of the retrieval was analyzed qualitatively. The results show that it is possible to find the news items and the single topics also when programmes are units for search. The difference between retrieval effectiveness for searching in news and search in programmes are marginal. The analysis also shows that indexing practices and several choices related to the retrieval system influences the retrieval effectiveness. A combination of different factors affects the search results.

Keywords

Permanent URL (for citation purposes)

  • http://hdl.handle.net/10642/2545