Reuse: Dane publiczne, a rewolucja cyfrowa

#1

Mój pierwszy dłuższy otwarto-danowy tekst/raport. Zajrzyjcie przez weekend!
Ciekaw jestem czy zgadzacie się z takim podsumowaniem i co sądzicie o pomyśle zaradzenia zaistniałej sytuacji?

http://blog.epf.org.pl/pl/2014/12/24/reuse/

Na FB tutaj: https://www.facebook.com/epanstwo/posts/876522365703377

1 Like
#2

Cześć Krzyśku,

Tekst dobry. Mam jedną uwagę techniczną - być może wybiegającą zbyt daleko w stosunku do stanu prawnego - odnośnie twojego przykładu z raportem wykorzystania środków transportu.

Po prostu nie jestem pewien, czy agregacja danych poprzez wspólne archiwum zip, to dobry kierunek. Raczej starałbym się ustawodawcom sugerować kierunek Linked Data, która to metodologia własnie w tym celu powstała. Czyli wydanie tego raportu w formie Linked Data:

  • tekst raportu w formacie maszynowo przetwarzalnym, z URI w miejscu innych elementów (arkusz kalkulacyjny, zdjęcia, rozkłady jazdy)
  • arkusz, zdjęcia i rozkłady w osobnych plikach, również publicznie dostępnych, pod tymi URI.

Zalety widzę takie:

  • poszczególne elementy mogą mieć wartość same w sobie (grafika, rozkłady), więc i tak powinny, zgodnie z metodologią OD, być dostępne powszechnie - nie ma więc potrzeby ich duplikować i wkładać ich kopii do archiwum
  • linkowane dane i tak powinny być wersjonowane (jeśli są “porządnymi” otwartymi danymi), raport więc może linkować do konkretnej wersji, jeśli ma to znaczenie, lub do wersji domyślnie najnowszej, jeśli wersja nie ma znaczenia
  • maszyna (i jej programista) przetwarzająca taki zbiór otwartych danych nie traci czasu na rozpakowywanie archiwum, oraz, jeśli np. linkowane dane są wielkiej objętości, pobieranie całości danych z których spora część może jej nie interesować.

Jeśli dobrze się orientuję, metodologia Linked Data jest już częściowo wykorzystywana w otwartych danych, zwłaszcza w UK. Naturalnie, największa bolączka Linked Data to odwieczne pytanie: “no dobrze, ale mój raport staje się bezwartościowy, jeśli linkowane dane znikną”. Na taki zarzut można odpowiedzieć dwojako: defensywnie (“ok, ale i tak możesz wrzucić pełnego PDFa, więc stworzona wiedza sama w sobie nie zanika”) i/lub ofensywnie (“musimy zakładać, że linkowane dane są tak dobrze dostępne, jak internet - inaczej cała zabawa traci sens”).

Jeśli uważasz, że to sensowny kierunek, to mogę jakoś pomóc w lepszym opracowaniu zagadnienia LD jako inputu do procesu legislacyjnego.

#3

Moim zdaniem opracowanie tego legislacyjnie to za daleko idący krok - mogłaby być to rekomendacja grupy roboczej, ktora mogłaby się dynamicznie zmieniać.

Uwaga o linked data bardzo celna. Zgadzam się z tym: linkujmy wiedząc, że linkowany zasób jest poprawnie wersjonowany. Dla sceptyków i dla bezpieczeństwa dodać do tego lokalny cache i jazda.Nie chciałem jednak wchodzić w takie szczegóły techniczne.