ЧИСЛЕННЫЙ ВЕРОЯТНОСТНЫЙ АНАЛИЗ ДЛЯ АГРЕГАЦИИ, РЕГРЕССИОННОГО МОДЕЛИРОВАНИЯ И АНАЛИЗА ДАННЫХ | Научно-инновационный портал СФУ

ЧИСЛЕННЫЙ ВЕРОЯТНОСТНЫЙ АНАЛИЗ ДЛЯ АГРЕГАЦИИ, РЕГРЕССИОННОГО МОДЕЛИРОВАНИЯ И АНАЛИЗА ДАННЫХ

Перевод названия: Numerical probabilistic analysis for aggregation, regression modeling and data analysis

Тип публикации: статья из журнала

Год издания: 2015

Ключевые слова: numerical probabilistic analysis, histogram expansion, histogram regression modeling, data aggregation, "Big Data", численный вероятностный анализ, гистограммные расширения, регрессионное моделирование, агрегация данных, "большие данные"

Аннотация: В статье рассматривается численный вероятностный анализ как способ обработки и представления данных для построения процедур агрегации больших массивов данных. Для агрегации данных применяется гистограммный подход. На основе агрегированных данных для выявления зависимостей между входными и выходными характеристиками рассматриваются теоретические и практические аспекты регрессионного моделирования. Используя понятие гистограммной переменной разрабатываются численные методы для построения регрессионных моделей. На основе численных примеров демонстрируется эффективность и наглядность предлагаемых методов и делается вывод о возможности применения данного подхода для обработки и исследования «больших данных». We discuss the using of numerical probabilistic analysis as a method of the data processing and aggregation of “big data”. For data aggregation is used the histogram approach. Based on the aggregated data to identify relationships between the input and output characteristics are discussed the theoretical and practical aspects of regression modeling. Using the concept of the histogram variable and developing the numerical methods we are constructed the regression histogram models. It is shown that the application of the procedures developed allows the data aggregation, reduces the level of information uncertainty in the data and significantly increases the efficiency of the numerical calculations. On the basis of numerical examples we are demonstrated the efficiency and visibility of the proposed methods and concluded on the applicability of this approach for the treatment and research of “big data”.

Ссылки на полный текст

Издание

Журнал: Информатизация и связь

Выпуск журнала: 1

Номера страниц: 15-21

ISSN журнала: 20788320

Место издания: Москва

Издатель: Автономная некоммерческая организация "Редакция журнала "Информатизация и связь"

Авторы

Вхождение в базы данных

Информация о публикациях загружается с сайта службы поддержки публикационной активности СФУ. Сообщите, если заметили неточности.

Вы можете отметить интересные фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.