19 авг. 2019 г.

Визуализация каталога публикаций Infostart

Просто оставлю это здесь. Захотелось проверить возможности утилиты gource.io. Подходящего объема не было, а генерировать абстрактные данные было не интересно. В итоге решил спарсить каталог публикаций Инфострата. А именно активность по странице - дата публикации или комментария и пользователя с привязкой к структуре каталога. Парсер написал на OneScript с использованием библиотек:
1connector - получение текста страниц, текст страниц разбирался с помощью регулярных выражений;
sql - для работы с sqlite-базой, запись/чтение результатов парсинга.
Сам скрипт выкладывать не буду, на вопросы отвечу.

Записи визуализаций:






Комментариев нет:

Отправить комментарий