Archiwizacja stron WWW w praktyce badawczej – wprowadzenie

Prowadzący: Marcin Wilkowski (LaCH UW)
Liczebność grup: 15 osób
Wymogi sprzętowe: Komputer z oprogramowaniem:
przeglądarka Chrome lub Chromium,
import.io,
RStudio https://www.rstudio.com/products/rstudio/download/ (z biblioteką rvest)

I cykl, 24 maja - 24 maja 5 godzin
Program ramowy:

Termin: 24 maja, 15:00-20:00

Celem warsztatu jest poznanie podstawowych metod pracy z publicznymi archiwami stron WWW oraz nauka samodzielnej archiwizacji stron internetowych w celach badawczych oraz ich analizowania i przetwarzania według własnych potrzeb. Zapraszamy wszystkie osoby zainteresowane pracą z archiwami Webu.

Program ramowy:

Część I – korzystanie z archiwów Webu

1. znaczenie archiwizacji Webu
2. instytucjonalne programy archiwizacji WWW (krótka prezentacja, zalety i ograniczenia), oddolna archiwizacja Webu
3. performatywność archiwów Webu (projekt Memento)
4. text mining w archiwach Webu – projekt Shine
5. osobista archiwizacja WWW do celów badawczych
6. wyzwania techniczne – historyczna zmienność WWW
7. wyzwania prawa autorskiego w archiwizacji Webu

Część II –  tworzenie archiwów WWW do celów badawczych

5. Format WARC
6. Budowanie własnych kolekcji stron WWW (proste rozwiązania)
7. Praca z archiwami WWW
10. Porządkowanie badawczych archiwów WWW – oprogramowanie Omeka i rozszerzony schemat metadanych Dublin Core
11. Archiwizacja mediów społecznościowych – metody, problemy, dostępne zasoby i narzędzia

Formularz rekrutacyjny