Системи штучного інтелекту

Мета роботи. Ознайомитися з основними фреймворками глибокого навчання для реалізації моделей машинного навчання, побудови та розгортанні моделей. Встановити та дослідити можливості TensorFlow, PyTorch та Keras, що засновані Google, Facebook та Python відповідно. Сервіси досить широко використовуються серед дослідників та практиків..

TensorFlow, PyTorch і Keras є основними інструментами сучасного глибокого навчання. Вони реалізують ефективну роботу з тензорами, автоматичне диференціювання та оптимізацію моделей. Незважаючи на спільні математичні принципи, підходи до програмування та сфери переважного використання в них відрізняються, що й становить практичний інтерес у межах даної лабораторної роботи.

Загальні принципи глибокого навчання

Глибоке навчання є підрозділом машинного навчання, що базується на використанні багатошарових нейронних мереж для автоматичного виділення ознак із даних. Основною обчислювальною структурою є тензор — багатовимірний масив чисел, який узагальнює поняття скаляра (0D), вектора (1D), матриці (2D) та багатовимірних структур (3D і більше).

Навчання нейронної мережі полягає в мінімізації функції втрат (loss function), яка вимірює різницю між прогнозом моделі та правильними значеннями. Для мінімізації використовується метод зворотного поширення помилки (backpropagation) разом із алгоритмами оптимізації (SGD, Adam тощо).

Ключові поняття:

Епоха (epoch) — один повний прохід по всьому навчальному набору даних.
Батч (batch) — підмножина даних, яка використовується для одного кроку оновлення ваг.
Ітерація — одне оновлення параметрів моделі.
Гіперпараметри — параметри, що задаються до навчання (швидкість навчання, розмір батча тощо).

Обчислювальні графи

Сучасні фреймворки глибокого навчання використовують концепцію обчислювального графа — структури, де вузли представляють операції, а ребра — потоки даних (тензори).

Існують два підходи:

Статичний граф — граф будується до початку виконання (традиційно використовувався у ранніх версіях TensorFlow).
Динамічний граф — граф будується під час виконання програми (характерний для PyTorch).

Динамічні графи забезпечують більшу гнучкість і простоту налагодження, тоді як статичні можуть бути більш оптимізованими для продуктивності.

TensorFlow

TensorFlow — це потужна бібліотека з відкритим кодом для машинного та глибокого навчання, розроблена компанією Google. Вона підтримує:

виконання на CPU, GPU та TPU;
автоматичне диференціювання;
розподілене навчання;
інструменти для продакшену (TensorFlow Serving, TensorFlow Lite).

TensorFlow активно використовується в промислових застосуваннях завдяки масштабованості та інтеграції з хмарними сервісами. Починаючи з версії 2.x, він орієнтований на більш інтуїтивний, Python-подібний стиль програмування.

Keras

Keras — це високорівневий API для створення нейронних мереж, який працює поверх TensorFlow. Головна мета — спрощення розробки моделей.

Особливості:

інтуїтивний інтерфейс;
модульність (шари, функції активації, оптимізатори);
швидке прототипування;
модель типу Sequential та функціональний API.

Keras дозволяє створювати складні архітектури з мінімальною кількістю коду, що робить його зручним для навчання та досліджень.

PyTorch

PyTorch — фреймворк глибокого навчання, розроблений Meta (Facebook). Його основні переваги:

динамічний обчислювальний граф;
природна інтеграція з Python;
простота налагодження;
гнучкість у створенні нестандартних моделей.

PyTorch широко використовується у наукових дослідженнях і швидкому прототипуванні нових архітектур. Завдяки бібліотеці torchvision він має зручні інструменти для роботи з комп’ютерним зором.

Автоматичне диференціювання

Всі сучасні фреймворки реалізують механізм automatic differentiation — автоматичного обчислення похідних функції втрат за параметрами моделі. Це дозволяє ефективно реалізувати алгоритм backpropagation без ручного обчислення градієнтів.

Апаратне прискорення

TensorFlow і PyTorch підтримують використання GPU для прискорення обчислень. Паралельні обчислення особливо важливі при роботі з великими нейронними мережами та великими наборами даних.

GPU значно пришвидшує:

множення матриць;
операції згортки;
обчислення градієнтів.

Сфери застосування

Розглянуті фреймворки використовуються для:

комп’ютерного зору;
обробки природної мови (NLP);
розпізнавання мовлення;
генеративних моделей;
рекомендаційних систем;
медичної діагностики.

Лабораторне завдання

Ознайомитися з теоретичними матеріалами щодо глибокого навчання.

Частина 1. Підготовка середовища

Встановити Python (останню версію).
Створити віртуальне середовище.
Встановити бібліотеки: pip install tensorflow torch torchvision keras matplotlib scikit-learn
Перевірити коректність встановлення (імпорт бібліотек).

Частина 2. Реалізація простої моделі класифікації.

Завдання: Побудувати нейронну мережу для класифікації зображень (наприклад, MNIST або Fashion-MNIST).

2.1 Реалізація в TensorFlow/Keras

Завантажити набір даних MNIST.
Нормалізувати дані.
Побудувати модель типу Sequential:
- Flatten
- Dense (128, ReLU)
- Dense (10, Softmax)
Навчити модель (5–10 епох).
Оцінити точність (accuracy).
Побудувати графік функції втрат.

2.2 Реалізація в PyTorch

Завантажити MNIST через torchvision.
Створити DataLoader.
Описати клас нейронної мережі (nn.Module).
Визначити:
- функцію втрат (CrossEntropyLoss)
- оптимізатор (Adam або SGD)
Реалізувати цикл навчання.
Обчислити точність моделі.

Частина 3. Порівняння

Студент повинен:

Порівняти кількість коду.
Оцінити складність реалізації.
Зробити висновки щодо зручності кожного фреймворку.
Порівняти швидкість навчання (за можливості).

Зміст звіту

Назва та мета виконання лабораторної роботи.
Короткі теоретичні відомості.
Лістинг коду з коротким описом.
Результати навчання (accuracy, loss)
Графіки
Аналітичні висновки щодо отриманих результатів, можливого застосування бібліотек для виконання певних завдань.

Контрольні запитання

Що таке тензор і чим він відрізняється від матриці?
У чому різниця між статичним і динамічним обчислювальним графом?
Які переваги має TensorFlow?
Які переваги має PyTorch?
Що таке Keras і яку роль він виконує?
Що таке функція втрат? Наведіть приклади.
Для чого використовується оптимізатор?
Що таке епоха та батч?
Чим відрізняється SGD від Adam?
Що таке overfitting і як його уникнути?
Які типи шарів найчастіше використовуються у згорткових нейронних мережах?
Як реалізується GPU-прискорення в цих фреймворках?

Розподіл балів

Диски для звітності

Корисні посилання

Follow Us

Лабораторна робота №5

Інструменти для роботи з ШІ