nav-left cat-right
cat-right


ИОА-ПЖМ жнеење

Во домејнот на складиштето постојат неколку стандарди кои се нашироко применети и обезбедуваат интероперативност, од кои најпознат е Протокол за иницијативата на архиви со слободен пристап за жнеење на метадата (ИОА-ПЖМ), кој се користи како најчест интерфејс за жнеење метадата од складиште.


Што е жнеење на метадата?

Подетален преглед на протоколите за жнеење и сродните прашања

Извештајот за поврзување на складиштата во Велика Британија (PDF, Swan & Awre, 2006).

Кога надворешните пребарувачи сакаат да индексираат веб-страница, тие често ја демнат преку следење линкови за да ја најдат секоја веб-страница и потоа да го извадат текстот од страниците што ќе ги најдат. Овој процес добро функционира, но недостасува способноста да се искористи структурираната метадата и услугите за напредно пребарување базирани на полињата во метадатата или понапредно испитување преку методи, како што е трагање по податоци (data mining). Исто така, тешко е да се идентификува нова содржина без уште едно комплетно демнење на веб-страница или користење мапи на сајтови.

Алтернатива на веб-демнење е жнеењето. Жнеењето значи распрашување во складиштето за неговата содржина и добивање одговори кои содржат список на објекти и метадата за нив. Протокол за иницијативи на архиви со слободен пристап за жнеење на метадата (ИОА-ПЖМ) е интерфејс машина-до-машина (м2м), кој е специјално дизајниран да го олесни жнеењето на податоци од архивите со отворен пристап и поголемиот број складишта ја даваат оваа опција.

Повеќето складишта обезбедуваат ИОА-ПЖМ интерфејс и се дизајнирани да бидат усогласени со ИОА. Кога складиштето го почитува својот протокол, дел или целата метадата која ја содржи за сите објекти во својата колекција се подложни на жнеење од провајдерите на услуги. Повратната метадата вообичаено вклучува УРЛ за објектот и за секој целосен текст фајл, кој потоа, исто така, може да се процесира ако има потреба.


Принципи на ИОА-ПЖМ

Системите кои обезбедуваат информации преку ИОА-ПЖМ се познати како провајдери на податоци, а и системите кои жнеат информации, користејќи ИОА-ПЖМ, се познати како обезбедувачи на услуги (бидејќи обезбедуваат нови услуги со податоците)

Складиштата кои се усогласени со ИОА, имаат УРЛ база покрај УРЛ човечките ресурси. На пример, складиштето на Универзитетот во Абериствит CADAIR складиште ја има ИОА основа за УРЛ . Сама по себе ИОА основа за УРЛ едноставно враќа ХМЛ кој содржи грешни пораки. Ова е затоа што инструкциите на протокол експертите во форма на „глаголи“ треба да се приклучат кон УРЛ.


ИОА-ПЖМ глаголи

Наједноставниот случај е глаголот „идентификувај“, кој враќа информации за идентитет за складиштето.
Заедно, има шест ИОА-ПЖМ глаголи, за некои од нив се потребни дополнителни аргументи:

Идентификувај Враќа информации за складиштето
Пример – RRP – Roehampton
Наведи формати на метадата Ги наведува метадата форматите кои ги поддржува складиштето. Минималните барања се oai_dc (Dublin Core)
Пример – CADAIR – Aberystwyth University
Наведи комплети Ги наведува комплетите обезбедени од складиштето (пр. оддели, теми)
Example – e-Prints – University of Southampton
Наведи идентификатори Ги наведува идентификаторите, датумите и кои било други наслови за секој депониран предмет. Го бара аргументот „метадата префикс“. Резултатите може да бидат ограничени на специфични подгрупи користејќи го „поставениот“ параметар. Резултатите може да бидат ограничени на одредени временски рамки користејќи ги параметрите „до“ и „од“.
Пример – ePublication Library – Chilbolton, Daresbury, and Rutherford Appleton Laboratories
Наведи податоци Жнее метадата податоци од складиште. Го бара аргументот „метадата префикс“ – метадата префикс=оаи_дц. Резултатите може да бидат ограничени на специфични подгрупи, користејќи го „поставениот“ параметар. Резултатите може да бидат ограничени на одредени временски рамки користејќи ги параметрите „до“ и „од“.
Пример – ePrints – Nottingham
Најди податоци Наоѓа индивидуални метадата податоци од складиште. Го бара аргументот „идентификатор“ и „метадата префикс“
Пример – ePrints – White Rose Research Online

Забелешка: Глаголите и нивните сродни аргументи се сензитивни во однос на големи или мали букви.

Кога резултатите од пребарувањето на ИОА-ПЖМ се големи, често се делат на делови на податоци. Секој дел завршува со „токен за продолжување“, кој може да се користи за врска со следниот дел.

Инсталациите на ИОА-ПЖМ може да се приспособат за да враќаат резултати користејќи различни метадата шеми. Како минимум, сите ИОА-ПЖМ сервери мора да имаат способност да ги враќаат резултатите користејќи го неквалификуваната едноставна Dublin Core (oai_dc) шема и тоа е сè што многу складишта или пакети го нудат. Сепак, тие може да дадат колку што сакаат повеќе или помалку дополнителни шеми. На пример, EPrints и DSpace ги поддржуваат United Kingdom Eletronic Thesis и Dissertation Dublin Core (uketd_dc) метадата формати кои ги бара EThOS.


Регистрирање во ИОА

Корисни врски

Иницијатива за отворени архиви – Иницијативата за отворени архиви развива и промовира стандарди за интероперативност, чија цел е да ја олеснат ефикасното распространување на содржина

Форум на отворените архиви – Форумот на отворените архиви овозможи европски фокус на распространувањето на информации во врска со европската активност поврзана со отворените архиви и особено за Иницијативата за отворени архиви.Тие имаат корисен онлајн-туторијал

Регистрирање во ИОА – Информации за регистрирањето во ИОА како провајдер на податоци во склад со ИОА-ПЖМ

Иницијатива за отворени архиви – Пребарувач на складишта – Оваа страница претставува меѓуврска до интерактивни тест архиви за усогласеност со ИОА-ПЖМ

Иако складиштето може да се ожнее едноставно поставувајќи ИОА-ПЖМ меѓуврска, регистрирањето овозможува корисни средства за промовирање на видливоста на вашето складиште за жнеење од страна на провајдерите на услуги. Иницијативата за отворени архиви обезбедува услуга, дозволувајќи му на вашето складиште да биде регистрирано како доставувач на податоци во регистарот на ИОА. Регистарот е јавно достапна листа на сите складишта кои се во согласност со ИОА, што овозможува лесно откривање на доставувачи на податоци од страна на провајдерите на услуги. Кога го регистрирате вашето складиште, ИОА сервисот ќе спроведе тестирање на усогласеноста за да се осигури дека вашето складиште е во согласност со ИОА-ПЖМ. Ако е успешна валидацијата, вашето складиште ќе биде додадено на регистарот.

ИОА, исто така, периодично ќе го тестира вашето складиште за усогласеност. Ако не успее анализата, вашето складиште ќе биде отстрането и на администраторот ќе му биде пратено известување по е-пошта со детали за причината за отстранување. Ова го обезбедува интегритетот на регистарот на ИОА и на меѓуврската на вашето складиште. Информацијата за регистрирањето на вашето складиште во ИОА може да се најде на интернет-страницата на ИОА. ИОА-ПЖМ меѓуврските кои ги даваат главните платформи за складишта од отворен пристап се направени на тој начин што гарантираат дека секогаш се усогласени.

Иако регистрирањето во Иницијативата на отворени архиви ќе помогне при зголемувањето на видливоста на вашето складиште кај другите провајдери на услуги, директното регистрирање кај овие сервиси, исто така, е можно за да се гарантира дека вашето складиште ќе биде ожнеано од нив. Провајдерите на услуги кои бараат дополнителна регистрација се Intute Search, ИОАster и OpenDOAR.

  • Share @ Ping.mk