понеділок, 24 листопада 2014 р.

Запитання для поточного контролю (2 атестація).



  1. Опишіть причини, які привели до появи нового класу обчислювальних систем - систем підтримки прийняття рішень (СППР). Дайте визначення поняття СППР (DSS).
  2. Дайте характеристику класів задач аналізу по ступеню "інтелектуальності".
  3. Опишіть різницю між OLAP і OLTP системами.
  4. Для чого призначені інформаційні системи класу OLTP? Яку дію реалізує транзакція в OLTP-системах?
  5. Опишіть властивості транзакцій. Які операції є характерними для транзакцій (ROLLBACK, COMMIT)?
  6. Опишіть принципи та дайте характеристику процесів відновлення системи після збоїв. Які функції виконують монітори транзакцій?
  7. Дайте характеристику даних у СППР і системах операційної обробки (OLTP). Приведіть основні протиріччя між системами OLTP і СППР.
  8. Які особливості в запитах до OLTP системи і СППР (аналітичної системи). Яким чином їх здійснити?
  9. Дайте визначення поняття сховище даних по Інмону. Приведіть опис властивостей сховища даних.
  10. Опишіть концепцію сховищ даних. Чому дані, які застосовують для аналізу, стали виділяти в окремі бази даних?
  11. Дайте характеристику вимог до сховищ даних. Опишіть відмінності сховищ даних від баз даних.
  12. Приведіть приклади основних операцій маніпулювання вимірами: перетин; обертання; деталізація; згортка.
  13. В яких випадках слід використовувати схему "сніжинка"? Приведіть опис схеми.
  14. Дайте визначення поняття кіоски даних. В яких випадках їх доцільно використовувати?
  15. Яким чином метадані відповідають на запитання: що, хто, де, як, коли і чому?
  16. Які інформаційні потоки утворюють дані, що поступають із сховища даних до аналітиків?
  17. Опишіть спрощену логічну схему аналітичної системи.
  18. Дайте визначення поняття ETL-процес. Опишіть етапи ETL-процесу.
  19. Які процедури виконуються при перетворенні даних в сховищі даних?
  20. В чому різниця між методами математичної статистики і Data Mining?
  21. Приведіть приклади формулювань задач при використанні методів OLAP і Data Mining.
  22. Які недоліки реляційної моделі баз даних згідно до поглядів Кодда обмежують її застосування для аналізу даних?
  23. Опишіть багатомірне концептуальне представлення даних згідно до поглядів Кодда.
  24. Сформулюйте призначення та мету OLAP-систем.
  25. Опишіть тест Пендса і Кріта для визначення OLAP.
  26. Дайте визначення понять OLAP-сервер та OLAP-клієнт. 
  27. Опишіть MOLAP, ROLAP, HOLAP, DOLAP та JOLAP способи реалізації OLAP-сервера.
  28. Опишіть схеми реалізації багатомірного представлення даних за допомогою реляційних баз даних.
  29. Опишіть властивості знань, які добуваються методами Data Mining.
  30. Приведіть короткий опис основних задач Data Mining.
  31. Дайте характеристику задач опису та передбачення.
  32. Як розглядають задачу класифікації в Data Mining? Приведіть приклади.
  33. Дайте визначення задач регресії. Приведіть приклади.
  34. Опишіть відмінність сіквенціального аналізу від пошуку асоціативних правил.
  35. Дайте визначення понять кластеризація та сегментація. Приведіть приклади задач кластеризації та сегментації. 
  36. Яким чином слід проводити підготовку вихідних даних для Data Mining? Дайте визначення понять неповнота і недостовірність.
  37. Опишіть варіанти оцінки ефективності моделей. Дайте характеристику методів порівняння класифікаційних (передбачуваних) та регресійних (оціночних) моделей.
  38. Опишіть процес навчання і тестування моделі на різних обсягах даних. Опишіть способи формування навчальної і тестової множини в умовах недостатності даних.
  39. Яким чином проводиться перехресна перевірка з виключенням? Опишіть процес одержання бутстреп–оцінок. Яким чином можна мінімізувати витрати помилок класифікації?
  40. На які категорії поділяють програмні продукти Data Mining? Дайте їх коротку характеристику.


неділя, 16 листопада 2014 р.

Запитання для захисту Лабораторних робіт №6 та 7.


  1. Дайте коротку характеристику методів прогнозування.
  2. Яким чином можна оцінити корисність прогнозу?
  3. Дайте визначення поняття часовий ряд. Дайте характеристику типів часових рядів.
  4. Які завдання вирішуються в ході аналізу часових рядів? Опишіть проблеми, які виникають в ході аналізу.
  5. Дайте характеристику детермінованої і стохастичної складових часового ряду.
  6. Дайте характеристику адитивної та мультиплікативної складових часового ряду.
  7. Дайте визначення поняття тренд часового ряду. Які моделі використовують для опису тренду?
  8. Дайте визначення поняття сезонний компонент часового ряду. Опишіть графік сезонного компонента часового ряду.
  9. Дайте визначення поняття циклічний компонент часового ряду. Опишіть композиційну структуру часового ряду.
  10. Які проблеми вирішують при дослідженні часових рядів? Яким чином використовується апарат кореляційного аналізу при дослідженні часових рядів?
  11. До яких висновків про поведінку часового ряду дозволяє прийти кореляційний аналіз?
  12. В яких випадках доцільно застосовувати "наївну" модель прогнозування та екстраполяцію?
  13. Яким чином проводиться прогнозування методом середнього й ковзного середнього?
  14. В яких випадках корисно застосовувати регресійні моделі прогнозування часових рядів?
  15. Опишіть метод декомпозиції часового ряду. Яким чином обчислюються сезонні індекси?
Відповіді на запитання слід шукати по посиланнях:

https://drive.google.com/file/d/0B0ukVqxgerCkWGZiQWp0WjREdFU/edit?usp=sharing
https://drive.google.com/file/d/0B0LDn1AUuYzFVnJ2ZldiWVE4Y00/view?usp=sharing
https://drive.google.com/file/d/0B0LDn1AUuYzFMzlsdEhVb0ZsSkk/view?usp=sharing

середа, 5 листопада 2014 р.

Запитання для захисту Лабораторної роботи №5.


  1. Дайте визначення поняття багатомірних кубів. Опишіть можливості моделі багатомірних кубів для аналізу даних.
  2. Опишіть технологію комплексного багатомірного аналізу даних. Якими способами можуть бути реалізовані системи OLAP?
  3. Моделі представлення даних у вигляді кубів різної розмірності: проблеми та способи вирішення.
  4. Якого типу таблиці найбільш придатні для аналізу і які взаємозв’язки в них необхідно знайти аналітику?
  5. Що в термінах OLAP називається кубом?
  6. Які традиційні обмеження кубів відсутні у кубів OLAP?
  7. Наведіть приклади міток та вимірів OLAP-куба.
  8. Які підрахунки може проводити OLAP-додаток при формуванні куба?
  9. Опишіть процес підключення сховища даних та імпорту процесу "Продажи". Яким чином слід застосовувати обробник "Дата и время" до імпортованої гілки "Продажи"?
  10. Опишіть процес побудови OLAP-куба за допомогою Майстра візуалізації.
  11. Приведіть опис вікна програми, на якому зображено побудований OLAP-куб. Яким чином проводиться маніпуляція вимірами?
  12. Приведіть опис панелі інструментів OLAP-куба для редагування параметрів діаграм.
  13. Опишіть вікно селектора для фільтрування даних. Які дії слід зробити, щоб викликати випадаючий список для фільтрації вимірів?
  14. Яким чином проводиться налаштування відображення фактів та сортування.
  15. Дайте визначення поняття крос-діаграми. Опишіть особливості крос-діаграм.


Для підготовки до захисту лабораторної роботи слід скористатися посиланнями:
https://drive.google.com/file/d/0B0ukVqxgerCkYjNDQ056dm1pRW8/view?usp=sharing
та
https://drive.google.com/file/d/0B0ukVqxgerCkd084UVNvaWMyVlk/view?usp=sharing