Cluster analysis for databases typologization characteristics

 

QR code of document

Ratings: 0

36.99
C63


    Cluster analysis for databases typologization characteristics [Текст] / M. A. Nikitina, I. M. Chernukha, Ya. M. Uzakov, D. E. Nurmukhanbetova // Известия Национальной Академии наук Республики Казахстан. - 2021. - №2. - Р. 114-121
ББК 36.99

Рубрики: Общественное питание. Кулинария

Кл.слова (ненормированные):
кластер -- мера близости -- методы кластеризации -- k-means, дендрограмма
Аннотация: В статье рассмотрены основные понятия кластерного анализа и кластеризации данных. Даны краткие сведения по истории возникновения кластерного анализа, первых областях его применения. Приведена классификация методов по способу обработки и анализу данных в кластерном анализе. Проанализированы существующие методы и алгоритмы кластеризации данных: 1) по способу обработки данных; 2) по способу анализа данных; 3) по количеству применений алгоритмов кластеризации; 4) по возможности расширения объема обрабатываемых данных; 5) по времени выполнения кластеризации. Наиболее подробно описан популярный, неиерархический алгоритм k-средних. При составления адекватного рациона питания необходимо оперировать большим объемом данных, иногда не структурированным или слабоструктурированным. При разработке баз данных, в ее структуре следует предусмотреть деление продуктов на кластеры по различным характеристикам. Наряду с этим необходимо учесть деление на кластеры по другим признакам, например, аллергенности (содержит ли в своем составе продукт аллергический компонент) или содержании углеводов (важно для диабетиков). Содержание белка, калия и фосфатов следует учесть при проектировании рационов для страдающих заболеваниями почек. Присутствие конкретных аминокислот – для метаболических заболеваний и т.д. Таким образом, данные о составе продуктов и кластеризация продуктов по различным категориям позволяют диетологам формировать взаимозаменяемые списки блюд с размерами порций или списки разрешенных и неразрешенных продуктов с точки зрения различных заболеваний. Приведена кластеризация фрагмента базы данных химического состава продуктов и блюд на примере творожных продуктов и кондитерских изделий по одному из признаков – содержание углеводов – в программной среде R методом k-средних. Кластеры продуктов по содержанию углеводов очень важны при формировании рациона питания для диабетиков. Продемонстрирована визуальная градация продуктов на кластеры в виде построения дендрограммы, показывающая степень близости отдельных кластеров. Кластеризации позволяет пользователю увидеть более детальную информацию при раскрытии каждого кластера: какие подгруппы продуктов или продукты входят в данный кластер
Держатели документа:
ЗКУ
Доп.точки доступа:
Nikitina, M. A.
Chernukha, I. M.
Uzakov, Ya. M.
Nurmukhanbetova, D. E.

Similar publications by classification