Memento Project - Memento Project
Tento článek je tón nebo styl nemusí odrážet encyklopedický tón použitý na Wikipedii.Listopadu 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Květen 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Memento je Spojené státy Národní program pro digitální informační infrastrukturu a ochranu (NDIIPP )–Financovaný projekt zaměřený na výrobu Web-archivováno obsah snáze zjistitelný.
Projekt je řízen Národní laboratoř Los Alamos a Old Dominion University.
Spíše než očekávat, že lidé budou vědět o rostoucím počtu webových archivů, a uhodnout, který archiv může obsahovat starší verzi zdroje, který hledají, Memento navrhuje zpřístupnit archivovaný obsah pomocí původní adresy URL, o které již hledající věděl . Memento je v zásadě pokus umožnit uživatelům prohlížet jakoukoli webovou stránku tak, jak vypadala k určitému datu v minulosti.
Technický popis
Existuje celá řada webových archivů, které shromažďují konkrétní revize webových stránek, které existovaly v určitém okamžiku. Memento umožňuje uživateli bezproblémový přechod mezi těmito archivy při hledání nejlepší archivované stránky odpovídající datetime pro stránku, kterou si přejí.
Memento je definováno v RFC 7089[1] jako implementace časové dimenze vyjednávání obsahu, jak je definováno Tim Berners Lee v roce 1996.[2] HTTP dosahuje vyjednávání obsahu prostřednictvím hlaviček. V následující tabulce jsou uvedeny různé hlavičky dostupné pro HTTP, které klientům a serverům umožňují najít obsah, který uživatel požaduje.
Záhlaví požadavku | Záhlaví odpovědi | Dimenze | Příklady | Odkaz |
---|---|---|---|---|
Akceptovat | Typ obsahu | typ obsahu reprezentace | text / html text / plainimage / png | RFC 7231[3] |
Přijmout jazyk | Jazyk obsahu | jazyk zastoupení | en en-UScz | RFC 7231 |
Přijmout-kódování | Kódování obsahu | médium, obvykle komprese, kterým byl obsah zakódován | komprimovat gzipdeflate | RFC 7231 |
Přijmout-Charset | Typ obsahu | znaková sada používaná webovou stránkou | iso-8859-5 unicode-1-1 | RFC 7231 |
Přijmout-datum a čas | Memento-datetime | čas reprezentace | Pá, 15. srpna 2014 13:43:03 GMT | RFC 7089 |
Memento poskytuje Přijmout-datum a čas záhlaví požadavku, aby klienti mohli serveru poskytnout datum, a server může k tomuto datu poskytnout nejlepší archivovanou verzi stránky. Toto se označuje jako vyjednávání datetime.
Abychom Mementu plně porozuměli, musíme si uvědomit, že Naposledy změněno záhlaví poskytované HTTP[4] nemusí nutně odrážet, kdy konkrétní verze webové stránky vznikla. Také Naposledy změněno záhlaví nemusí v některých případech existovat. Chcete-li poskytnout více informací, Memento-datetime bylo zavedeno záhlaví, které označuje, kdy byla na webu pozorována konkrétní reprezentace webové stránky.[5]
Výše uvedený diagram ukazuje tříkrokový proces, kterým Memento najde nejlepší archivovanou webovou stránku pro datetime dodanou uživatelem. Proces funguje následovně:
- Klient Memento kontaktuje původní zdroj, aby zjistil, zda vrátí informace o TimeGate (URI-G) v záhlaví odkazu.
- Klient Memento poté použije Přijmout-datum a čas záhlaví požadavku k odeslání datetime požadovaného uživatelem na URI-G objevený v předchozím kroku. Většina prostředků na webu ještě nevrací URI-G, takže většina klientů Memento k dosažení tohoto kroku používá předdefinovaný seznam TimeGates. TimeGate poté vrátí stavový kód přesměrování 302 a Umístění záhlaví sdělit klientovi, kde má najít archivovaný zdroj (URI-M).
- Klient Memento poté požádá o archivovaný zdroj (URI-M), jako by to byla jakákoli jiná webová stránka. Odpověď pro URI-M obsahuje a Memento-datetime označující, kdy byla na webu pozorována.
Tímto způsobem Memento využívá stávající infrastrukturu HTTP k dosažení cílů nalezení nejlepší archivované webové stránky na základě požadovaného datetime a URI uživatele.
Používání
Kopie stránky lze najít pouhou navigací ve webovém prohlížeči na odkaz naformátovaný a nahrazený urltoarchiv
s požadovanou úplnou adresou URL stránky:[6]
Popis JSON pro Memento:
http://timetravel.mementoweb.org/api/json/RRRR/urltoarchiv
http://timetravel.mementoweb.org/api/json/RRRRMM/urltoarchiv
http://timetravel.mementoweb.org/api/json/RRRRMMDD/urltoarchiv
http://timetravel.mementoweb.org/api/json/RRRRMMDDHH/urltoarchiv
http://timetravel.mementoweb.org/api/json/RRRRMMDDHHMM/urltoarchiv
- nebo
přesměrovat na Memento s datetime, který je blízký požadovanému datetime:
http://timetravel.mementoweb.org/memento/RRRR/urltoarchiv
http://timetravel.mementoweb.org/memento/RRRRMM/urltoarchiv
http://timetravel.mementoweb.org/memento/RRRRMMDD/urltoarchiv
http://timetravel.mementoweb.org/memento/RRRRMMDDHH/urltoarchiv
http://timetravel.mementoweb.org/memento/RRRRMMDDHHMM/urltoarchiv
Reference
- ^ RFC 7089: HTTP Framework for Time-Based Access to Resource States - Memento
- ^ Berners Lee, Tim. "Webová architektura: Obecné zdroje". World Wide Web Consortium (W3C). 1996. http://www.w3.org/DesignIssues/Generic Archivováno 02.06.2015 na Wayback Machine
- ^ RFC 7231: Hypertext Transfer Protocol (HTTP / 1.1): Sémantika a obsah
- ^ RFC 7232: Hypertext Transfer Protocol (HTTP / 1.1): Podmíněné požadavky
- ^ Nelson, Michael L. „2010-11-05: Memento-Datetime není naposledy změněn“. Výzkumná skupina pro webovou vědu a digitální knihovny. 5. listopadu 2010. http://ws-dl.blogspot.com/2010/11/2010-11-05-memento-datetime-is-not-last.html Archivováno 19. 05. 2015 na Wayback Machine
- ^ „Time Travel APIs“. timetravel.mementoweb.org. Archivováno z původního dne 2018-05-21. Citováno 2018-05-15.
externí odkazy
- Memento Project
- Kdy na webu - Rozsáhlé informace o návrhu a experimentu jsou k dispozici v příspěvku z listopadu 2009
- Memento: Cestování v čase pro web
- http://lanlsource.lanl.gov/hello
- http://www.cdlib.org/cdlinfo/2010/02/04/web-archive-discovery-memento-implementation-meeting/