Archiv českého webu
Projekt WebArchiv byl spuštěn v roce 2000 Národní knihovnou České republiky ve spolupráci s Moravskou zemskou knihovnou a Ústavem výpočetní techniky Masarykovy univerzity. Jeho cílem je skenování (sklizně) vybraných českých webových stránek a ukládání jejich obsahu do elektronického archivu. Od roku 2000 do roku 2014 jde přibližně o jednu celoplošnou sklizeň ročně, přičemž velikost dat v jedné sklizni dosahuje řádově jednotek (a blíží se k desítkám) TiB.
Skenování webů v rámci projektu probíhá ve třech základních režimech. Jednak jde o plošné seknování webových stránek s doménou prvního řádu .cz, které splňují požadavky na formát, datový objem a možnost přístupu na web, které není dále podmíněno. Druhým režimem je pak výběrové skenování stránek, jejichž vydavatelé uzavřeli s hlavním řešitelem projektu - Národní knihovnou České republiky smlouvu o zpřístupnění archivovaných kopií webu prostřednictvím portálu http://webarchiv.cz. Zařazení konkrétní webové stránky mezi vybrané zdroje a uzavření uvedené smlouvy je ze strany Národní knihovny ČR podmíněno splněním několika kritérií, mezi něž patří:
- územní kritérium – web musí být publikován na území ČR,
- jazykové kritérium – web musí být publikován v češtině,
- kritérium autorství - archivovány jsou weby českých autorů,
- obsahové kritérium – obsah webu se týká ČR nebo českého národa.
Třetím, specifickým režimem sklizní jsou ad hoc tématické sklizně zaměřené na webové stránky věnované konkrétnímu tématu, které je zvoleno obvykle v souvislosti s významnou společenskou událostí týkající se ČR.
Zapojení webů rodiny smerem.cz do projektu
Z webů portálu smerem.cz byl doposud do seznamu webů vybraných pro archivaci na základě úspěšné kontroly splnění výběrových kritérií vybrán portál spravnym.smerem.cz, pro ostatní weby nebyla dosud žádost podána. Smlouva o poskytování elektronických online zdrojů byla uzavřena dne 10. 7. 2014.
Zdroje
- Webarchiv: archiv českého webu, dostupný online na: http://webarchiv.cz/vydavatele/
|