Извлечение и анализ данных о судопроизводстве в г. Томске с помощью технологий OLAP И Data Mining / К. Б. Щукова, А. А. Хлопонин, Д. М. Паршина ; науч. рук. А. В. Кудинов

Основной Автор-лицо: Щукова, К. Б.Альтернативный автор-лицо: Хлопонин, А. А.;Паршина, Д. М.Вторичный автор-лицо: Кудинов, А. В., специалист в области автоматического управления, доцент Томского политехнического университета, кандидат технических наук, 1975-, Антон Викторович, 727Коллективный автор (вторичный): Национальный исследовательский Томский политехнический университет (ТПУ), Институт кибернетики (ИК), Кафедра вычислительной техники (ВТ)Язык: русский ; резюме, eng.Страна: Россия.Серия: Геоинформационные системы и технологииРезюме или реферат: The article is intended to analyze various data obtained from websites of regional and district Tomsk courts via advanced analytic technologies such as OLAP and Data Mining. The process of comparing structure web pages and parsing HTML pages using PHP and C# is considered in details. Near-duplicates and shingling, as well as regular expressions and Levenshtein distance stand for analyzing and comparing texts, sentences and words. Due to these algorithms, the issue relating to extraction of necessary units can be sorted out effectively and quite accurately..Примечания о наличии в документе библиографии/указателя: [Библиогр.: с. 106 (1 назв.)].Тематика: электронный ресурс | труды учёных ТПУ | судопроизводство | Data mining | OLAP | Microsoft SQL Server | регулярные выражения | шинглы | анализаторы | реляционные базы данных Ресурсы он-лайн:Щелкните здесь для доступа в онлайн | Щелкните здесь для доступа в онлайн
Тэги из этой библиотеки: Нет тэгов из этой библиотеки для этого заглавия. Авторизуйтесь, чтобы добавить теги.
Оценка
    Средний рейтинг: 0.0 (0 голосов)
Нет реальных экземпляров для этой записи

Заглавие с титульного листа.

[Библиогр.: с. 106 (1 назв.)]

The article is intended to analyze various data obtained from websites of regional and district Tomsk courts via advanced analytic technologies such as OLAP and Data Mining. The process of comparing structure web pages and parsing HTML pages using PHP and C# is considered in details. Near-duplicates and shingling, as well as regular expressions and Levenshtein distance stand for analyzing and comparing texts, sentences and words. Due to these algorithms, the issue relating to extraction of necessary units can be sorted out effectively and quite accurately.

Adobe Reader

Для данного заглавия нет комментариев.

оставить комментарий.