• Nie Znaleziono Wyników

Назва (англ.): Personal information protection in big data analysis and processing problems

N/A
N/A
Protected

Academic year: 2021

Share " Назва (англ.): Personal information protection in big data analysis and processing problems "

Copied!
2
0
0

Pełen tekst

(1)

Авторська довідка

(реферату дипломної роботи магістра)

Назва дипломної роботи магістра: Захист персональної інформації в задачах аналізу та обробки великих даних

назви записувати нижнім регістром (як у реченні)

Назва (англ.): Personal information protection in big data analysis and processing problems

переклад англійською

Освітній ступінь : магістр

Шифр та назва спеціальності: 125-Кібербезпека Екзаменаційна комісія: Екзаменаційна комісія №32

Установа захисту: Тернопільський національний технічний університет імені Івана Пулюя Дата захисту: 24.12.2019 Місто: Тернопіль

Сторінки:

Кількість сторінок дипломної роботи: 109 Кількість сторінок реферату: 7 УДК: 004.056.53 Автор дипломної роботи

Прізвище, ім’я, по батькові (укр.): Сачик Тетяна Владиславівна

розкривати ініціали

Прізвище, ім’я (англ.): Sachyk Tetiana

використовувати паспортну транслітерацію (КМУ 2010)

Місце навчання (установа, факультет, місто, країна): Тернопільський національний технічний

університет імені Івана Пулюя, факультет інформаційних систем та програмної інженерії, м. Тернопіль Україна

Керівник

Прізвище, ім’я, по батькові (укр.):Загородна Наталія Володимирівна

повністю

Прізвище, ім’я (англ.): Zagorodna Natalia

використовувати паспортну транслітерацію (КМУ 2010)

Місце праці (установа, підрозділ, місто, країна): Тернопільський національний технічний університет імені Івана Пулюя, факультет інформаційних систем та програмної інженерії, кафедра кібербезпеки м. Тернопіль Україна

Вчене звання, науковий ступінь, посада: кандидат технічних наук, доцент

Рецензент

Прізвище, ім’я, по батькові (укр.): Пасічник Володимир Володимирович

повністю

Прізвище, ім’я (англ.): Pasichnyk Volodymyr

використовувати паспортну транслітерацію (КМУ 2010)

Місце праці (установа, підрозділ, місто, країна): Тернопільський національний технічний університет імені Івана Пулюя, факультет інформаційних систем та програмної інженерії, кафедра комп’ютерних наук м. Тернопіль Україна

Вчене звання, науковий ступінь, посада: кандидат технічних наук, професор

(2)

Ключові слова

українською: К-АНОНІМІЗАЦІЯ, КОНФІДЕЦІЙНІСТЬ, КВАЗІ-ІДЕНТИФІКАТОР,

ЕФЕКТИВНІСТЬ, СИНТЕТИЧНИЙ ГЕНЕРАТОР англійською: K-ANONYMITY, PRIVACY, QUASI-IDENTIFIERS, EFFICIENCY, SYNTHETIC DATA

GENERATOR

Анотація

українською:

Метою роботи – систематичне порівняння трьох відомих алгоритмів k-анонімізації для вимірювання їх продуктивності (з точки зору використання ресурсів) та їх ефективності (з точки зору корисності даних).

Основні результати роботи: в роботі досліджено поняття анонімізації, описано її моделі, обрано для дослідження алгоритми k-анонімізації, як однієї з базових моделей, запропоновано критерії якості алгоритмів k- анонімізації для подальшого прийняття рішення щодо вибору алгоритму, проведено порівняння трьох основних алгоритмів Datafly, Incognito, Modrian для двох наборів даних (реального та синтетичного) та для різних

початкових налаштувань параметрів алгоритмів, сформовано рекомендації щодо застосування алггоритмів.

У першому розділі описується, що таке анонімізація, моделі конфідеційності та на прикладах розглядаються деякі атаки конфідеційності.

У другому розділі розглядаються методи анонімізації, три найбільш поширені алгоритми анонімізації та описується методологія порівняння цих алгоритмів.

Третій розділ експерементальний. У ньому порівнюются три алгоритими анонімізації за такими критеріями як – час анонімізації, узагальнена втрата інформації, метрика чутливості та середній розмір класу еквівалентності.

У четвертому розділі описується генератор реальних синтетичних даних та принцип його роботи.

У розділі “Обґрунтування економічної ефективності” підраховується вартість роботи та термін її окупності.

У розділі “Охорона праці та безпека в надзвичайних ситуаціях” зазначено, що дослідження відбувалося зі збереженням правил пожежної безпеки та всіх норм охорони праці.

У розділі “Екологія” описуються методи узагальнення екологічної інформації та зазначаються вимоги до мікроклімату приміщень.

У результаті підготовки дипломної роботи проведено серію експериментів та всебічний аналіз для виявлення факторів, що впливають на ефективність загальнодоступних реалізації алгоритмів анонімізації. Представлено за допомогою експериментальної оцінки умови, в яких один алгоритм перевершує інші за певним показником, залежно від вхідних даних та вимог конфіденційності.

англійською

: Project purpose: systematic comparison of three well-known k-anonymization algorithms to measure their efficiency (in terms of resources usage) and their effectiveness (in terms of data utility).

Main results: The concept of anonymization is investigated, its models are described, k-anonymization algorithms are selected as one of the basic models, k-anonymization quality criteria are proposed for further decision making, algorithm selection is performed for three basic algorithms, Datafly Incognito, Modrian two sets of data (real and synthetic) and different initial adjustments of algorithm parameters, recommendations for the application of algorithms were formed.

The first section describes anonymization, privacy models, and some examples of privacy attacks.

The second section discusses anonymization methods, the three most common anonymization algorithms, and describes a methodology for comparing these algorithms.

The third section is experimental. It compares three anonymization algorithms against such criteria as anonymization time, generalized information loss, sensitivity metric, and average equivalence class size.

The fourth section describes the real synthetic data generator and how it works.

In the economic section the cost of the work and its payback period are calculated.

The section "Occupational Health and Safety" states that the study was conducted in compliance with fire safety rules and all occupational safety standards.

The section "Ecology" describes the methods of generalizing environmental information and specifies the requirements for the microclimate of the premises.

As a result of the preparation of the thesis, a series of experiments and a comprehensive analysis were conducted to identify the factors that influence the effectiveness of publicly available anonymization algorithms. Provided by an experimental evaluation of the conditions in which one algorithm outperforms the others by a certain measure, depending on the input and privacy requirements.

Cytaty

Powiązane dokumenty

ТЕРНОПІЛЬСЬКИЙ НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ ІМЕНІ ІВАНА ПУЛЮЯ ФАКУЛЬТЕТ ПРИКЛАДНИХ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ ТА ЕЛЕКТРОІНЖЕНЕРІЇ КАФЕДРА

Місце праці (установа, підрозділ, місто, країна): Тернопільський національний технічний університет. Вчене звання, науковий ступінь, посада:

Місце праці (установа, підрозділ, місто, країна): Тернопільський національний технічний університет імені Івана Пулюя,

Місце праці (установа, підрозділ, місто, країна): Тернопільський національний технічний університет імені Івана Пулюя, кафедра управління інноваційною

Місце праці (установа, підрозділ, місто, країна Тернопільський національний технічний університет імені Івана Пулюя, факультет машин,

Місце праці (установа, підрозділ, місто, країна): Тернопільський національний технічний університет імені Івана Пулюя, факультет інформаційних

Місце праці (установа, підрозділ, місто, країна): Тернопільський національний технічний університет

Місце навчання (установа, факультет, місто, країна): Тернопільський національний технічний університет імені Івана Пулюя, факультет