СТАТИСТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ И ИХ ИДЕНТИФИКАЦИЯ : доклад, тезисы доклада | Научно-инновационный портал СФУ

СТАТИСТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ И ИХ ИДЕНТИФИКАЦИЯ : доклад, тезисы доклада

Перевод названия: STATISTICAL ANALYSIS OF THE TEXTS AND THEIR IDENTIFICATION

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: Физика и методика обучения физике. Технологическое образование; Красноярск; Красноярск

Год издания: 2016

Ключевые слова: author identification, Zipf's law, Law Huseyn-Zade, scattergrams, entropy, statistical distributions, Авторская идентификация, закон Ципфа, закон Гусейна-Заде, скаттерограмма, энтропия, статистические распределения

Аннотация: В работе исследуются основные статистические характеристики текстовых фрагментов и изучается возможность использования этих характеристик в качестве инструментов для авторской идентификации. Показано, что методы на основе коэффициентов Ципфа, Гусейна-Заде и энтропийный метод не являются однозначными инструментами идентификации. We study the basic statistical characteristics of text fragments and study the possibility of using these characteristics as tools for the identification of the author. It has been shown that the methods based on coefficients of Zipf and Huseyn-Zade, and entropy method is not unambiguous identification tools.

Ссылки на полный текст

Издание

Журнал: Физика и методика обучения физике. Технологическое образование

Номера страниц: 4-6

Издатель: Красноярский государственный педагогический университет им. В.П. Астафьева

Персоны

  • Винокурова А.А. (Красноярский государственный педагогический университет им. В.П. Астафьева)
  • Орлова И.Н. (Красноярский государственный педагогический университет им. В.П. Астафьева)
  • Логинов В.М. (Красноярский государственный педагогический университет им. В.П. Астафьева)

Вхождение в базы данных

Информация о публикациях загружается с сайта службы поддержки публикационной активности СФУ. Сообщите, если заметили неточности.

Вы можете отметить интересные фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.