analiza danych text mining

Open Refine


Open Refine (do 2012 pod nazwą Google Refine) to narzędzie ułatwiające porządkowanie i przetwarzanie danych. Działająca w przeglądarce aplikacja umożliwia import danych z wielu formatów (TSV, CSV, *SV, .xls i .xlsx, JSON, XML, RDF/XML), z adresów URL, plików lokalnych i systemowego schowka. Import danych do uporządkowania posiada dwa etapy: pierwszy polega na wprowadzeniu danych do narzędzia, drugi – na ich wstępnym przefiltrowaniu – na tym etapie użytkownik może określić, jaki element danych z importowanego zbioru jest mu niezbędny do dalszej pracy. Można więc np. importując duży dokument .xls na tym etapie wybrać wyłącznie interesujące nas kolumny.

W dalszych etapach pracy Open Refine ułatwia sortowanie i dzielenie danych, a także ich przetwarzanie z wykorzystaniem wyrażeń regularnych. Po zakończonej pracy w łatwy sposób można eksportować wypracowany zbiór do popularnych formatów (csv, tabela html czy pliki Excela i ODT).

Z Open Refine korzystać można w systemach linuksowych, OS oraz w Windowsach. Narzędzie korzysta oraz dystrybuowane jest na licencjach Open Source.

licencja:

open source

Omówienie/recenzja:

http://openrefine.org/