Машинное обучение.sa_ИМО

Скачать тест — (Машинное обучение.sa_ИМО_13da760a.pdf)

  1. Что из перечисленного НЕ является данными?
  2. Упорядочите типы машинного обучения:
  3. Какие из перечисленных компонентов НЕ относятся к машинному обучению?
  4. Упорядочите шаги в процессе подготовки данных:
  5. Сегодня данные нужны бизнесу, чтобы:
  6. Соотнесите в верном соответствии термины и определения
  7. Что включает в себя компонент «модели» в машинном обучении?
  8. К направлению……… , Data Science относится задача “Разработка архитектуры хранилища данных”
  9. Упорядочите этапы разработки ML-проекта:
  10. ……… — это вид машинного обучения, основанный на использовании только неразмеченных данных
  11. Соотнесите в верном соответствии термины и определения
  12. …….. — это вид машинного обучения, основанный на использовании только размеченных данных?
  13. Соотнесите в верном соответствии термины и определения
  14. Что означает «unsupervised learning»?
  15. Принцип ………. используется в weakly-supervised learning для обработки данных
  16. Процесс оценки эффективности модели на тестовых данных называется ……
  17. ……….. — это математическое или компьютерное представление процесса или явления, которое помогает прогнозировать результаты и проводить эксперименты.
  18. Выберите правильные утверждения:
  19. Соотнесите в верном соответствии термины и определения
  20. Упорядочите типы задач машинного обучения по уровню сложности :
  21. Этап разработки ML-проекта включающий в себя сбор и подготовку данных называется …..
  22. Какие данные являются структурированными?
  23. Соотнесите в верном соответствии термины и определения
  24. В чем отличие между машинным обучением, нейронными сетями и глубоким обучением?
  25. Данный вид обучения …….. , наиболее эффективен для работы с большими объемами неразмеченных данных
  26. Упорядочите методы предварительной обработки данных:
  27. Выберите верные утверждения:
  28. Термин ……… описывает выбор алгоритмов и методов для конкретной задачи в ML-проекте
  29. В чем отличие между обучением с учителем, обучением без учителя и обучением с частичным привлечением учителя?
  30. При использовании техники …… , модели учатся находить структуры в данных без направляющего сигнала
  31. Какие признаки называют числовыми?
  32. Что отличает категориальные признаки от числовых?
  33. Признаки, которые могут принимать значение 0 или 1 , известны как …… признаки
  34. Признаки без порядка между категориями — это …… признаки
  35. ……. признаком является возраст в целых годах
  36. …………. – это признаки, обладающие порядком между категориями
  37. Почему важно различать типы признаков?
  38. Техника кодирования ………… применяется к категориальным признакам для использования в моделях машинного обучения
  39. Сопоставьте верно тип признака и описание
  40. В каком порядке следуют типы признаков по возрастанию их возможности хранения информации?
  41. Какую информацию несут временные признаки в данных?
  42. Что может стать следствием неравномерных масштабов числовых признаков?
  43. При помощи способа ……. обрабатываются текстовые признаки перед использованием в моделях
  44. Для чего может быть полезна стандартизация признаков?
  45. ……. — это новые признаки, полученные путем комбинации существующих признаков
  46. Какая задача решается с помощью уменьшения размерности признаков?
  47. Признаки, что принимают любое значение в определенном диапазоне называются — ……..
  48. Почему важно обрабатывать пропуски в данных?
  49. Какая трансформация часто применяется к числовым признакам для устранения выбросов?
  50. Установите соответствие между типами данных и характеристиками
  51. Модель, в которой зависимость между переменными линейная это — …….
  52. Функция … используется в линейной регрессии для минимизации ошибки?
  53. «Переменные» в контексте линейной модели это — ……
  54. Какую зависимую переменную называют в линейной модели?
  55. Чему равна гипотеза линейной регрессии?
  56. Для измерения точности линейной модели используется метрика качества — ………
  57. Метрика, измеряющая долю объясненной вариации – это …..
  58. Для измерения средней абсолютной ошибки используется метрика-
  59. Что такое смещение в контексте линейных моделей?
  60. Какая метрика используется для измерения плотности предсказаний в регрессии?
  61. Сопоставьте верно термины и определения
  62. Что характеризует параметр θ в линейной модели?
  63. Расставьте следующие метрики качества регрессии по убыванию значимости:
  64. Какая метрика измеряет среднее квадратичное отклонение ошибки?
  65. Упорядочите следующие метрики качества линейной регрессии по убыванию значимости:
  66. Какая метрика измеряет разницу между предсказанным и фактическим результатом как абсолютное значение?
  67. Для чего используется метод наименьших квадратов?
  68. Метрика точности …….. наиболее чувствительна к выбросам
  69. Метрика …………….. используется для оценки качества модели при больших ошибках
  70. Математическая модель, описывающая зависимость переменной от одной или нескольких других переменных – это ……
  71. Упорядочите этапы процесса линейной регрессии:
  72. Какой из следующих примеров является задачей, решаемой с помощью линейной регрессии?
  73. …….. переменная в контексте линейной регрессии, это переменная, которую мы пытаемся предсказать
  74. Что означает коэффициент в уравнении линейной регрессии?
  75. Какая задача может быть решена с помощью линейной регрессии?
  76. Чаще всего …….. типа данные используются в качестве входных для линейной регрессии
  77. Линейная регрессия может быть использована в экономике, для предсказания изменения …….. на товары
  78. Упорядочите методы оценки качества модели линейной регрессии:
  79. Как линейная регрессия может помочь в маркетинге?
  80. Метод ……… используется для нахождения оптимальных коэффициентов в линейной регрессии
  81. Что значит «переобучение» в контексте линейной регрессии?
  82. Чем отличается линейная регрессия от полиномиальной?
  83. Как можно проверить качество модели линейной регрессии?
  84. Помешать точности модели линейной регрессии может ……. признаков
  85. Установите соответствие между терминами и их определениями:
  86. При каких условиях линейная регрессия дает наилучшие результаты?
  87. Установите соответствие между методами оценки и их описаниями:
  88. В чем отличие множественной линейной регрессии от простой?
  89. Метод ………. может использоваться для снижения влияния выбросов на линейную регрессию
  90. Какой метод используется для минимизации функции потерь в линейной регрессии?
  91. Какой из методов использует информацию о предыдущих градиентах для адаптации размера шага?
  92. Какой из следующих параметров используется для оценки качества модели в контексте регрессии?
  93. Какой из следующих методов является стохастическим?
  94. Какой алгоритм требует вычисления градиента на всей выборке для обновления весов?
  95. В процессе обучения линейной модели используется функция потерь, известная как ……….
  96. Упорядочите методы оптимизации по сложности (от простого к сложному):
  97. Метод ………. позволяет изменять скорость обучения с течением времени.
  98. Какой из методов позволяет избежать колебаний в процессе обучения?
  99. Скорость изменения функции потерь в градиентном спуске называется ……….
  100. Алгоритм ………. использует адаптивный подход для обработки редких признаков.
  101. Общее количество итераций, выполняемых в процессе обучения, называется ……….
  102. В стохастическом градиентном спуске градиент вычисляется на ……….
  103. Какой метод, который учитывает информацию о предыдущих градиентах для корректировки шага, называется ……….
  104. Какой из следующих методов используется для решения задачи регрессии?
  105. В стохастическом градиентном спуске выбирается случайная ………. для вычисления градиента.
  106. Какой параметр обозначает размер шага при обновлении весов в градиентном спуске?
  107. Какой метод используется для вычисления адаптивного градиента, учитывая накопленные градиенты?
  108. Установите соответствие между методами и их описаниями:
  109. Метод ……… используют для повышения скорости обучения и избегания переобучения
  110. Приведение данных к определенному диапазону – это …….
  111. Почему масштабирование данных полезно при использовании алгоритмов машинного обучения?
  112. Метод …………. применяется для масштабирования данных
  113. Какой диапазон применяется при стандартной нормализации данных?
  114. Приведение к диапазону …… происходит с данными при применении метода Min-Max нормализации
  115. Алгоритм ……… требует обязательного масштабирования входных данных
  116. Какой из методов масштабирования лучше подходит для данных с выбросами?
  117. Что такое Z-преобразование в контексте масштабирования?
  118. Какую проблему может вызвать несопоставимость масштаба признаков в машинном обучении?
  119. ………….. — метод масштабирования который сохраняет форму распределения данных
  120. Для……………… типа данных не рекомендуется использовать метод Min-Max нормализации
  121. Почему не рекомендуется обучать модель на немасштабированных данных в SVM (метод опорных векторов)?
  122. Установите соответствие между методами масштабирования и их описаниями:
  123. Масштабирование робастом использует какую статистику для нормализации данных?
  124. Какой из методов масштабирования требует знания максимума и минимума данных в выборке?
  125. Установите соответствие между типами данных и рекомендуемыми методами масштабирования:
  126. Главный недостаток стандартизации данных – это ……
  127. Как масштабирование данных влияет на вычислительную эффективность?
  128. Упорядочите шаги, необходимые для устранения влияния выбросов
  129. Масштабирование ……… используется для обработки данных, где важны относительные различия, а не абсолютные значения
  130. ………. — это данные, которые представляют собой категории или метки и имеют ограниченный набор значений.
  131. Что из перечисленного не является методом кодирования категориальных признаков?
  132. Для работы с порядковыми категориальными признаками подходит метод кодирования …..
  133. Что происходит при использовании One-hot encoding на категориальных данных?
  134. Основным недостатком метода One-hot encoding, является ……
  135. Основное достоинство Label encoding заключается в …….
  136. Метод кодирования ……… может привести к проблемам в модели из-за ложного порядка категорий
  137. Какой метод кодирования признаков помогает уменьшить размерность по сравнению с One-hot encoding?
  138. Что из перечисленного является недостатком Frequency encoding?
  139. Установите соответствие между методами кодирования и их преимуществами/недостатками
  140. Какой из методов кодирования может привести к переобучению, если не применять регуляризацию?
  141. Установите соответствие между методами кодирования и типами данных, к которым они применимы
  142. Для работы с деревьями решений наиболее эффективным методом кодирования может быть ……..
  143. Упорядочите методы кодирования по их устойчивости к переобучению
  144. ……. Работает таким образом , что преобразует категорию в порядковое число и затем в его бинарное представление.
  145. Какой метод кодирования подходит для данных с большим количеством уникальных значений в категориальном признаке?
  146. Данный метод кодирования………. зависит от распределения целевого признака
  147. Упорядочите этапы процесса применения One-Hot Encoding
  148. Почему важно правильно выбирать метод кодирования для категориальных признаков?
  149. Какой метод кодирования позволит сохранить информацию о частоте категорий?
  150. Что такое важность признаков в контексте регрессионного анализа?
  151. Метод …….. используется для оценки важности признаков в линейной регрессии?
  152. Что показывает знак коэффициента в линейной регрессии?
  153. …….. – это метод, который удаляет наименее значимые признаки из модели?
  154. Что представляет собой нормативизация данных в контексте регрессии?
  155. Метод регуляризации ………. может помочь в оценке важности признаков
  156. Как происходит выборка признаков при использовании метода Recursive Feature Elimination (RFE)?
  157. Что такое метод отбора на основе деревьев решений?
  158. Методом отбора признаков на основе статистического тестирования , является метод ……
  159. Как можно наглядно представить важность признаков, выявленную регрессионным анализом?
  160. Установите соответствие между типами регрессии и их характеристиками
  161. Метод …….. не относится к процессу отбора признаков
  162. Установите соответствие между коэффициентами регрессии и их интерпретацией
  163. Процесс удаления менее значимых признаков для повышения производительности модели называется — ……..
  164. Упорядочите этапы процесса рекурсивного устранения функций:
  165. Метод ………. позволяет оценить важность признаков без их использования в предварительной модели
  166. Упорядочите этапы процесса прямого выбора признаков:
  167. Установите соответствие между метриками оценки модели и их назначением
  168. Какой метод может быть использован для ранжирования признаков по уровню их значимости?
  169. Что из перечисленного может являться целью отбора признаков?
  170. Метод для исследования зависимости одной количественной переменной от нескольких независимых переменных – это ……
  171. Какое из уравнений представляет множественную линейную регрессию?
  172. Что такое коэффициент детерминации \( R^2 \) в множественной регрессии?
  173. Метод ………. используется для оценки параметров множественной регрессии
  174. Какое предположение делается относительно ошибок в модели множественной регрессии?
  175. Какой из следующих факторов может привести к мультиколлинеарности?
  176. Показатель…………… используется для оценки статистической значимости каждого из коэффициентов независимых переменных?
  177. Что означает высокая p-значимость независимой переменной?
  178. Упорядочите этапы проверки предположений многомерной линейной регрессии:
  179. Упорядочите этапы интерпретации результатов модели многомерной линейной регрессии:
  180. Какая из нижеуказанных методик используется для борьбы с мультиколлинеарностью?
  181. Установите соответствие между методом стандартизации и его описанием.
  182. Для чего используется стандартизация независимых переменных в регрессионной модели?
  183. Метод ………………. помогает определить вклад каждого признака в конечный предсказанный результат?
  184. Что делает метод регуляризации Lasso в множественной регрессии?
  185. Проверить гомоскедастичность ошибок в модели можно построением …………. предсказанных значений против остатков
  186. Установите соответствие между типами переменных и необходимостью их
  187. Какой способ наиболее верный для выбора модели на основе её способности к обобщению?
  188. Какое из следующих утверждений верно относительно интерпретации коэффициента в множественной регрессии?
  189. Предотвратить переобучение модели можно снижением сложности модели или использованием ……………..
  190. Какой из нижеперечисленных методов является линейным классификатором?
  191. Что такое случайный лес?
  192. Функцию активации ……. чаще всего используют на выходном слое нейронной сети в задаче бинарной классификации
  193. Метод, который уменьшает предвзятость в данных с дисбалансом классов это — ………
  194. Зависимость между истинно положительными и ложно положительными показателями, представляет собой ……..
  195. Какой из методов будет более устойчивым к выбросам в данных?
  196. Что такое гиперпараметры в контексте алгоритмов классификации?
  197. ……….. – это метрика, вычисляемая как среднее значение точности и полноты
  198. Какой из следующих алгоритмов классификации использует принцип максимизации расстояния между классами?
  199. Упорядочите типы алгоритмов классификации по их сложности (от простого к сложному).
  200. …………. – это подход для оценки устойчивости модели
  201. Метод …………. используется для уменьшения размерности данных перед классификацией
  202. Установите соответствие между терминами и их описаниями.
  203. ………… метрика наиболее устойчива к проблеме дисбаланса классов
  204. Что делает стратифицированная кросс-валидация?
  205. Метод ………….. относится к байесовским алгоритмам
  206. Для чего можно использовать ансамблевые методы?
  207. Упорядочите шаги подготовки данных для задачи классификации.
  208. Какое преимущество дает использование нелинейных ядер в SVM?
  209. Какая техника позволяет избежать переобучения в нейронных сетях?
  210. Что такое метод k-ближайших соседей (k-NN)?
  211. Ключевой параметр, который нужно задать в методе k-NN это — ……
  212. Метод ………, основан на принципе классификации данных на основе ближайших соседей
  213. Как влияет увеличение значения k на модель?
  214. Каким образом измеряется расстояние между точками в k-NN?
  215. Что происходит, если k равно 1 в k-NN?
  216. Как можно бороться с проблемой несбалансированности классов в k-NN?
  217. ……………. сложность вычислений присуща методу k-NN на больших наборах данных
  218. Метод k-NN, помимо классификации может использоваться для ……
  219. Какое влияние имеет нормализация данных на k-NN?
  220. Чувствительнее всего к масштабу в алгоритме k-NN ……. данные
  221. Установите соответствие между аспектами метода K-ближайших соседей и их описаниями.
  222. Как можно выбрать оптимальное значение k для модели?
  223. Упорядочите шаги, необходимые для применения метода K-ближайших соседей, от первого к последнему.
  224. В каком случае метод k-NN может проигрывать по точности другим методам?
  225. Вид кросс-валидации ………… чаще всего используется для выбора k в k-NN
  226. Поможет ускорить работу алгоритма k-NN, применение структур данных, таких как k-d tree или ……………
  227. Какой из следующих факторов НЕ является ограничением метода k-NN?
  228. Какую проблему может создать слишком большое значение k?
  229. Какая из следующих функций может использоваться для вычисления весов соседей в более сложных вариантах k-NN?
  230. .…….. – это классификация данных на два возможных класса.
  231. Какой из следующих алгоритмов не используется для бинарной классификации?
  232. График, иллюстрирующий качество бинарного классификатора это — ………
  233. Что показывает показатель точности (accuracy) модели?
  234. Среднее гармоническое точности и полноты это — …………..
  235. Какое из следующих утверждений верно для логистической регрессии?
  236. Что такое порог отсечения (threshold) в контексте классификации?
  237. Упорядочите этапы, необходимые для оценки качества модели бинарной классификации.
  238. Какой подход можно использовать при дисбалансе классов в наборе данных?
  239. Что такое переобучение в контексте бинарной классификации?
  240. Как изменится F1-мера, если точность высокая, а полнота низкая?
  241. Почему важно оценивать модель на тестовом наборе данных?
  242. Какой из следующих подходов подходит для уменьшения переобучения?
  243. Что такое AUC (Area Under Curve) для кривой ROC?
  244. Показатель ……….. устойчив к дисбалансу классов
  245. Шум в данных на модели бинарной классификации, может привести к……..
  246. Что такое True Positive (TP) в контексте бинарной классификации?
  247. Для чего используется перекрестная проверка (cross-validation)?
  248. Установите соответствие между методами и их описаниями.
  249. Метод ………….. лучше подходит для не линейно разделимых данных
  250. Модель, делающая предсказания на основе линейной комбинации входных признаков это — …………
  251. Что представляет собой гиперплоскость в контексте линейного классификатора?
  252. Какова формула уравнения гиперплоскости в линейном классификаторе?
  253. Что такое отступ ( или «margin») объекта относительно гиперплоскости?
  254. Какой из этих классификаторов является линейным?
  255. Как отступ объекта влияет на уверенность классификатора в своём предсказании?
  256. Каково значение отступа для правильно классифицированных объектов?
  257. Установите соответствие между терминами и их определениями.
  258. Что произойдет с гиперплоскостью, если добавить к классификатору регуляризацию?
  259. Упорядочите шаги для оценки производительности линейного классификатора.
  260. Что отражает вектор весов в линейном классификаторе?
  261. …….. – это метод , который максимизирует отступ между двумя классами
  262. Какое из утверждений о гиперплоскости верное?
  263. При увеличении количества признаков на гиперплоскость , …… размерность гиперплоскости
  264. Отступ объекта считается оптимальным, когда он ……..
  265. Метод SVM предпочтителен для задач с линейно разделяемыми классами, по причине ………
  266. Что происходит с точностью линейного классификатора при увеличении размерности признаков?
  267. Каким образом в линейных классификаторах обычно добавляют нелинейность?
  268. Что произойдет с гиперплоскостью, если ошибочно увеличивать коэффициенты модели?
  269. Роль регуляризации в линейных классификаторах является — ……….
  270. Что такое логистическая регрессия?
  271. Функция, используемая в логистической регрессии для преобразования линейной комбинации признаков называется — ……………
  272. Диапазон значений ……… принимает сигмоидная функция
  273. Какой loss (функция потерь) используется в логистической регрессии?
  274. Значение 0.5 на выходе сигмоидной функции для двоичной классификации означает ………..
  275. Упорядочите действия при интерпретации коэффициентов логистической регрессии.
  276. Как решается проблема переобучения в логистической регрессии?
  277. Часто используемый в логистической регрессии вид регуляризации ……….
  278. Процесс нахождения оптимальных коэффициентов логистической регрессии называется ……………
  279. Какой алгоритм оптимизации часто используется в логистической регрессии?
  280. Что произойдет с вероятностями на выходе логистической регрессии, если признак сильно коррелирует с целевой переменной?
  281. Установите соответствие между метриками и их описанием.
  282. Как логистическая регрессия решает многоклассовые задачи классификации?
  283. Какой недостаток имеет логистическая регрессия?
  284. Функция активации softmax в логистической регрессии используется для …………..
  285. Какова роль bias (свободного члена) в логистической регрессии?
  286. Зачем нужно стандартизировать признаки перед использованием логистической регрессии?
  287. Как можно оценить качество модели логистической регрессии?
  288. Почему логистическая регрессия является линейным классификатором?
  289. При каких условиях логистическая регрессия может плохо справляться с задачей классификации?
  290. Что такое метод «один против всех» (one-vs-all) в многоклассовой классификации?
  291. Что такое метод «один против одного» (one-vs-one) в многоклассовой классификации?
  292. При наличии 5 классов требуется …. классификаторов для метода «один против всех»
  293. При наличии 4 классов требуется …. классификаторов для метода «один против всех»
  294. Какой из следующих методов менее вероятно встретит проблему несбалансированности классов?
  295. Какой подход лучше подходит для больших наборов данных с большим количеством классов?
  296. Установите соответствие между методами многоклассовой классификации и их описанием.
  297. Как решается конфликт в методе «один против одного», если несколько классификаторов дают разные результаты для одного примера?
  298. Какой из следующих методов классификации обычно требует большего объема памяти для обучения?
  299. Что из следующего является преимуществом метода «один против одного»?
  300. Сложность построения моделей в методе «один против другого» определяется квадратичной зависимостью от
  301. Упорядочите этапы реализации метода One-vs-One (OvO) для многоклассовой классификации.
  302. Каковы недостатки метода «один против всех»?
  303. Какая проблема решается при помощи вероятностных межклассовых шкал в многоклассовой классификации?
  304. Лучше использовать метод ……… , если классы взаимосвязаны (близки) друг с другом?
  305. Какая из следующих задач лучше подходит для метода «один против всех»?
  306. Метод ………. может стать более ресурсозатратным при большом числе классов
  307. Какой из методов проще интерпретировать?
  308. Какой из следующих методов чувствителен к правильной настройке порогов?
  309. Метод ……. легче дооптимизировать при наличии новых данных
  310. Что такое линейный классификатор?
  311. Какие из следующих моделей относятся к линейным классификаторам?
  312. Какую задачу НЕ решают линейные классификаторы?
  313. Какое из преимуществ характерно для линейных классификаторов?
  314. Какой недостаток имеет линейный классификатор?
  315. Какой метод помогает учесть нелинейные зависимости в данных для линейного классификатора?
  316. К какому из недостатков может привести большое количество признаков в линейной модели?
  317. Чем линейные классификаторы особенно эффективны по сравнению с другими методами?
  318. Какой из следующих методов НЕ относится к улучшению линейного классификатора?
  319. Установите соответствие между примерами использования линейных классификаторов и их описаниями:
  320. Установите соответствие между преимуществами линейных классификаторов и их описанием:
  321. Соответствие между недостатками линейных классификаторов и их характеристиками:
  322. Установите соответствие между методами улучшения и их назначениями:
  323. Выберите соответствие между задачами линейных классификаторов и реальными примерами их выполнения:
  324. Соответствие между типами задач линейных классификаторов и их свойствами:
  325. Установите соответствие между проблемами линейных классификаторов и методами их решения:
  326. Упорядочьте действия для работы с нелинейно разделёнными данными:
  327. Упорядочьте недостатки линейного классификатора в порядке возрастания влияния на качество работы модели при крупных наборах данных:
  328. Упорядочьте этапы анализа данных, необходимых для работы линейного классификатора:
  329. Линейный классификатор — это модель, которая делает предсказания, основываясь на … входных признаков.
  330. Какой из следующих терминов описывает вероятность принадлежности объекта к классу +1 в логистической регрессии?
  331. Установите соответствие между метриками и их определениями:
  332. В логистической регрессии максимизация правдоподобия равносильна минимизации …….
  333. Какой из следующих показателей описывает долю неправильно классифицированных объектов класса -1?
  334. Какой из следующих методов используется для оценки качества бинарной классификации, основанный на соотношении истинных положительных и всех положительных предсказаний?
  335. Логистическая регрессия является Accuracy классификатором …….
  336. Какой из следующих показателей описывает долю правильно классифицированных положительных примеров среди всех объектов?
  337. Упорядочите метрики качества классификации по возрастанию их сложности:
  338. Какой из следующих методов используется для визуализации соотношения между истинно положительными и ложно положительными результатами классификации?
  339. Какой из следующих показателей рассчитывается как среднее гармоническое между precision и recall?
  340. Показатель ……. описывает общую точность предсказания модели.
  341. Какой Для минимизации функции потерь в логистической регрессии используется метод …….
  342. ROC-кривая строится на основе значений TPR и ……..
  343. Пороговое значение классификации можно варьировать для вычисления ……. и FPR
  344. Какой из следующих алгоритмов используется для реализации логистической регрессии в Python?
  345. ……. — это функция, используемая для перевода произвольного вектора в нормированный вектор дискретного распределения.
  346. …………- это метрика, которая учитывает как истинные положительные, так и ложные положительные предсказания.
  347. Какой из следующих показателей является графическим представлением качества бинарной классификации?
  348. Какой из следующих показателей описывает долю правильно классифицированных положительных примеров?
  349. Какой Завершите предложение: Показатель, описывающий долю ложных положительных предсказаний, называется…….
  350. Какой из следующих методов классификации является метрическим методом?
  351. В методе k-ближайших соседей выбор соседей производится на основании меры ………
  352. Какой из следующих методов является примером алгоритма, основанного на использовании ядер?
  353. Какой параметр необходимо выбрать при использовании метода Парзеновского окна?
  354. В задаче классификации с несбалансированной выборкой часто применяют метод ……… для увеличения числа объектов меньшего класса.
  355. Какой из следующих методов может помочь справиться с дисбалансом классов?
  356. Что означает SVM в контексте машинного обучения?
  357. В методе кросс-валидации стратификация используется для ………
  358. Упорядочите шаги полного цикла классификации в правильном порядке:
  359. ________ — это метод, который позволяет уменьшить размерность пространства данных с помощью линейной комбинации признаков.
  360. Какой из следующих типов ядер НЕ используется в SVM?
  361. Для работы с несбалансированной выборкой часто используются методы оверсэмплинг и ………
  362. Какова цель обучения с использованием SVM?
  363. Какая из перечисленных метрик является ключевой для оценки классификации?
  364. Установите соответствие между методами и их описаниями:
  365. Одним из способов борьбы с дисбалансом классов является метод………
  366. Методом, основанным на расстоянии, который может использоваться для классификации, является………
  367. Применяется при наличии двух классов с различным количеством объектов в обучающей выборке, метод ………
  368. В контексте SVM, такое ядро как «радикальное базисное» обычно используется для ………
  369. Какова основная идея метода k-ближайших соседей?
  370. Что такое дерево решений?
  371. Дерево решений имеет ……….. структуру
  372. Конечные узлы, представляющие прогноз , это ….. в дереве решений
  373. Места, где происходит разбиение данных , это …… в дереве решений
  374. Упорядочите этапы процесса постобработки дерева решений для предотвращения переобучения.
  375. Что оценивает метрика Gini в дереве решений?
  376. Какой критерий используется для разбиения в задаче классификации в дереве решений?
  377. Что произойдет, если дерево решений будет слишком большим?
  378. Каковы методы борьбы с переобучением в деревьях решений?
  379. Что такое «обрезка» дерева решений?
  380. Каков основной недостаток деревьев решений?
  381. Длина самого длинного пути от корня до листа это ……… дерева решений
  382. Установите соответствие между параметрами настройки дерева решений и их описаниями.
  383. Использованием ансамблей, таких как …….. увеличит стабильность и обобщающую способность при использовании деревьев решений
  384. Какие данные могут быть использованы в дереве решений?
  385. Что из перечисленного редко используется для разбиения в деревьях решений?
  386. Что происходит на каждом этапе построения дерева решений?
  387. Для уменьшения вариативности и улучшения точности модели , используется техника ………… в деревьях решений
  388. ……….. может быть использована как альтернатива индексу в деревьях решений для задач классификации
  389. Упорядочите шаги, необходимые для оценки качества дерева решений.
  390. Набор данных о разных видах растений представляет собой датасет ………..
  391. В датасете представлено …… класса ирисов
  392. Какие виды ирисов содержатся в датасете?
  393. Сколько всего экземпляров (строк) содержит датасет?
  394. …………….. признака содержит каждый экземпляр датасета (без учета метки класса)
  395. Какие признаки измеряются в датасете?
  396. Метка класса представлена в датасете через ……..
  397. Метод …………. можно использовать для визуализации датасета
  398. Установите соответствие между видами ирисов и их характеристиками.
  399. Какой метод машинного обучения часто используется для работы с этим датасетом в учебных целях?
  400. В ……………. году сэр Рональд Фишер опубликовал работу с использованием датасета «Ирисы»?
  401. Какой алгоритм чаще всего используется для визуализации границ принятия решений с помощью этого датасета?
  402. Какое среднее значение чаще всего рассчитывается для каждого признака в датасете?
  403. Библиотека Python …………… предлагает встроенный доступ к датасету «Ирисы»
  404. Какой из нижеперечисленных алгоритмов классификации не подходит для работы с этим датасетом?
  405. Установите соответствие между методами анализа данных и их применением к датасету ирисы.
  406. Какую метрику можно использовать для оценки точности модели, обученной на этом датасете?
  407. Чем полезен датасет «Ирисы» для обучения в области машинного обучения?
  408. Какой из следующих признаков обычно имеет наибольший стандартное отклонение в Ирисе Верджиника?
  409. …………… — это  вид ирисов который имеет обычно наиболее варьируемую ширину лепестков
  410. Какой из следующих методов является примером ансамблевого подхода?
  411. Алгоритм ………….. , основанный на последовательном обучении подмоделей, учитывает ошибки предыдущих.
  412. Какой алгоритм последовательно обучает подмодели с учетом ошибок предыдущих?
  413. Метод …………..объединяет предсказания нескольких моделей и уменьшает вариативность.
  414. Какой термин описывает использование нескольких моделей для повышения точности предсказаний?
  415. В ………….. обучается одна мета-модель, использующая предсказания нескольких подмоделей.
  416. Какой из следующих методов не является ансамблем?
  417. Проблема………….. , когда модель слишком хорошо подстраивается под обучающие данные, критична для всех моделей.
  418. Какой метод использует скорость уменьшения ошибки на обучающей выборке для мульти-революционного обучения?
  419. Метод ………….. используется для увеличения разнообразия предсказаний в ансамбле.
  420. Какой метод комбинирует результаты нескольких моделей для улучшения общей точности?
  421. Использование метрики ………….. позволяет оценить производительность модели в ансамбле.
  422. Какой из следующих факторов оказывает наибольшее влияние на качество ансамбля?
  423. ………….. подмодели обучаются на подвыборках данных, чтобы снизить переобучение.
  424. Какой метод предполагает использование отдельной модели для комбинации предсказаний подмоделей?
  425. Для улучшения обобщающей способности используется ………….. моделей.
  426. Какой из следующих методов использует бутстрэпирование?
  427. При обучении моделей в ………….. каждая подмодель обучается независимо от других.
  428. Упорядочите этапы алгоритма бустинга:
  429. Установите соответствие между термином и его описанием:
  430. Какой алгоритм является примером метода бустинга?
  431. В библиотеке sklearn реализован метод ……. для бустинга.
  432. Какой из следующих методов использует градиентный спуск для уменьшения ошибки?
  433. ……. является эффективным алгоритмом для работы с разреженными данными.
  434. В какое время обучения XGBoost учитывает регуляризацию для улучшения обобщающей способности?
  435. Метод, который последовательно обучает модели на основе ошибок предыдущей, называется …….
  436. Какой алгоритм использует взвешивание обучающих экземпляров для улучшения модели?
  437. Параметр learning_rate определяет ……. в модели XGBoost.
  438. Какой из следующих алгоритмов наиболее эффективен для обработки категориальных признаков?
  439. Завершите предложение: Поиск оптимума между ……….и точностью для модели. При использовании ансамбля отдельные модели могут демонстрировать достаточную точность при меньшем разбросе значений..
  440. Упорядочите этапы работы AdaBoost:
  441. Какой из следующих параметров присваивается каждому классификатору в AdaBoost в зависимости от его производительности?
  442. Какой из следующих аспектов помогает избежать переобучения в XGBoost при использовании регуляризации?
  443. Применение AdaBoost позволяет улучшить ……. модели.
  444. XGBoost используется в соревнованиях по машинному обучению благодаря своей …….
  445. В алгоритме ……. используется метод градиентного спуска для устранения ошибок.
  446. Какой тип моделей комбинирует бустинг в своем процессе обучения?
  447. Какой из следующих признаков CatBoost может обрабатывать автоматически, тем самым сокращая время подготовки данных?
  448. Параметр n_estimators в XGBoost определяет количество …….
  449. Установите соответствие между термином и его описанием:
  450. Какой алгоритм в кластеризации использует расстояние до ближайшего соседа?
  451. Кластеризация — это техника, использующаяся для ……… объектов на основе их характеристик.
  452. Метод, основанный на плотности, который может находить кластеры произвольной формы, называется ………
  453. Какой из следующих алгоритмов является иерархическим?
  454. Алгоритм EM используется для ………
  455. Упорядочите этапы работы алгоритма K-средних:
  456. Мера, используемая для оценки качества кластеризации, называется ………
  457. Какой из следующих методов кластеризации не требует предварительной инициализации кластеров?
  458. Кластеризация помогает в задачах анализа и…….. данных.
  459. Какой метод кластеризации предполагает, что кластеры имеют сферическую форму?
  460. Установите соответствие между методом кластеризации и его характеристикой:
  461. Алгоритм, который использует плотность для формирования кластеров, называется ………
  462. Какой метод кластеризации требует указания количества кластеров до начала работы?
  463. В иерархической кластеризации возможны два подхода: агломеративная и ………
  464. Какой из следующих методов кластеризации основан на плотностном подходе?
  465. Какой подход в иерархической кластеризации заключается в объединении небольших кластеров в большие?
  466. ВК кластеризации используется для агломеративного подхода, где ……… кластеры объединяются.
  467. Метод HDBSCAN является ……… версией DBSCAN.
  468. Какой алгоритм является простым и популярным выбором для кластеризации в задачах сегментации?
  469. Какой индекс используется для оценки качества разделения кластеров?
  470. Какой из следующих методов использует расстояние до ближайшего соседа для классификации?
  471. Алгоритм K-средних требует указания ……… заранее.
  472. Какой из следующих алгоритмов является плотностным методом кластеризации?
  473. Для улучшения алгоритма DBSCAN был предложен метод ………
  474. Упорядочите этапы алгоритма бустинга:
  475. Метод K-средних основан на минимизации ……… внутри кластеров.
  476. Алгоритм, который работает на основе вероятностной модели, называется ………
  477. Как называется техника, которая использует расстояния для агрегирования данных в кластеры в методе иерархической кластеризации?
  478. При помощи метода ближайших соседей можно легко классифицировать ………
  479. Установите соответствие между методом кластеризации и его характеристикой:
  480. EM-алгоритм используется для кластеризации, основанной на ………..
  481. Метод K-средних не подходит, если кластеры имеют ……….. форму.
  482. Какая метрика используется для оценки качества кластеризации в методе K-средних?
  483. По каким критериям при агломеративной иерархической кластеризации, методы различаются ?
  484. Алгоритм HDBSCAN улучшает DBSCAN, добавляя ………..
  485. Какое из следующих утверждений верно в отношении обучения модели?
  486. Какой из следующих недостатков часто наблюдается у алгоритма ближайших соседей (KNN) при работе с высокоразмерными данными?
  487. Необходимо создать подвыборки методом бутстрапа. Упорядочите этапы алгоритма бэгинга.
  488. Какой из следующих алгоритмов не требует задания количества кластеров?
  489. Какой из следующих методов не базируется на алгоритмах машинного обучения?
  490. Какова основная цель метода случайных проекций?
  491. К какому типу методов относится Метод случайных проекций?
  492. Метод ………… является примером случайных проекций?
  493. Как случайные проекции влияют на вычислительную сложность обработки данных?
  494. Для …………..метод случайных проекций особенно полезен
  495. Направления проекции выбираются …………….в методе случайных проекций?
  496. Какое преимущество у метода случайных проекций по сравнению с методом главных компонент (PCA)?
  497. Необходимо заранее определить ……………. в методе случайных проекций
  498. Что происходит с геометрическими расстояниями при использовании случайных проекций?
  499. В основе метода случайных проекций лежит ключевой математический факт ……..
  500. Какие преобразования необходимо сделать с данными перед применением метода случайных проекций?
  501. Как случайные проекции влияют на пространственную структуру данных?
  502. Упорядочите этапы алгоритма случайных проекций.
  503. Какой из следующих методов можно комбинировать со случайными проекциями для улучшения качества модели?
  504. Наличие «шума» при использовании метода случайных проекций …………. надежность метода
  505. Могут ли случайные проекции изменить внутренние корреляции в данных?
  506. Какому требованию должны соответствовать случайные матрицы проекции?
  507. Какая ошибка может возникать при слишком сильном уменьшении размерности методом случайных проекций?
  508. Как метод случайных проекций может быть полезен для ускорения алгоритмов машинного обучения?
  509. Установите соответствие между методами понижения размерности и их типами данных, для которых они наиболее подходят.
  510. Метод уменьшения размерности это метод- ……
  511. Основная цель метода главных компонент уменьшить количество ……
  512. Какую математическую процедуру использует PCA для уменьшения размерности?
  513. Что из нижеперечисленного сохраняет метод главных компонент?
  514. …….. — это ось в пространстве главных компонент?
  515. Сумма дисперсий главных компонент по сравнению с исходными данными …….
  516. Операция ……… обычно предшествует применению метода PCA
  517. Что происходит с коррелированными признаками после применения PCA?
  518. Как определить количество главных компонент, достаточно для расшифровки данных с минимальными потерями?
  519. Какой метод используется для оценки важности каждой главной компоненты?
  520. Чем является каждая главная компонента в методе PCA?
  521. Какая из следующих ситуаций наиболее подходит для применения PCA?
  522. Что из перечисленного нельзя сделать с помощью PCA?
  523. Установите соответствия между терминами и их недостатками.
  524. Как влияет на результат PCA наличие нечисловых данных в наборе?
  525. Как определяется направление первых главных компонент?
  526. Для чего используется график Scree Plot в контексте PCA?
  527. Упорядочите применения метода главных компонент.
  528. Что такое «объясненная дисперсия» в PCA?
  529. PCA не рекомендуется использовать для категоричных данных, потому что PCA работает только с …………
  530. Какое преобразование данных часто предшествует применению метода главных компонент?
  531. Метод линейной алгебры ……………. используется для нахождения главных компонент?
  532. Что такое собственные векторы в контексте PCA?
  533. Какое условие накладывается на собственные векторы при их расчете для PCA?
  534. Что отражает значение собственных чисел в методе PCA?
  535. Как определяется ковариационная матрица данных в PCA?
  536. Ортогональная база в PCA представляет из себя набор векторов, …………друг другу
  537. Какой шаг выполняется после нахождения собственных векторов и собственных значений в PCA?
  538. Матрица ……….. преобразует исходные данные в пространство главных компонент
  539. Сколько главных компонент можно извлечь из набора данных размерности \( n \times p \) (где \( n \) — количество наблюдений, \( p \) — количество признаков)?
  540. Упорядочите алгоритм нахождения производной функции:
  541. К ……………… значениям собственных чисел главных компонент стоит присмотреться в первую очередь
  542. Как PCA поможет справиться с мультиколлинеарностью признаков?
  543. Что происходит с размерностью данных после применения PCA?
  544. Установите соответствие между методами решения уравнений и их описаниями:
  545. При каких условиях следует использовать корреляционную матрицу вместо ковариационной в PCA?
  546. Когда один из признаков полностью зависит от другого ,определитель ковариационной матрицы принимает значение…………..
  547. Общая доля дисперсии, объясненная выбранными главными компонентами это — ……… в контексте PCA
  548. Какое преобразование данных выполняется в методе центровки?
  549. Зачем проводится стандартизация данных перед применением PCA?
  550. Какой метод используется для многомерного шкалирования?
  551. Визуализация данных начинается с …………… информации.
  552. t-SNE является улучшением предыдущего метода ……………
  553. Упорядочите шаги процесса многомерного шкалирования:
  554. Технологии визуализации помогают в …………… и анализе больших данных.
  555. Какой термин описывает процесс уменьшения количества переменных для упрощения анализа?
  556. Установите соответствие между методом и его характеристикой:
  557. Для какого типа данных наиболее полезно использовать визуализацию?
  558. t-SNE лучше всего подходит для визуализации данных с …………… структурой.
  559. Какой метод оптимизации используется в многомерном шкалировании?
  560. Примеры задач, решаемых с помощью визуализации, включают …………… и анализ данных.
  561. Метод оптимизации, используемый в многомерном шкалировании – это …………… метод градиентного спуска.
  562. Визуализация помогает …………… данные, чтобы выявить скрытые зависимости.
  563. Какой из ниже перечисленных методов наименее относится к визуализации?
  564. Какой метод визуализации данных предназначен для сохранения локальной структуры распределения данных при переходе из высокоразмерного пространства в низкоразмерное?
  565. Для обеспечения хорошей визуализации t-SNE требуется …………… параметров.
  566. На каком принципе основаны методы SNE и t-SNE для минимизации различий между данными?
  567. Какой метод многомерного шкалирования предназначен для сохранения локальных связей между соседями?
  568. Какой тип данных может обрабатывать многомерное шкалирование?
  569. Поиск аномалий в данных берет свое начало из …………….. области.
  570. Какой алгоритм обычно используется для классификации, чувствительной к аномалиям?
  571. Какой метод визуализации данных предназначен для сохранения локальной структуры при переходе из высокоразмерного пространства в низкоразмерное?
  572. Для какой цели чаще всего применяется модель смеси распределений?
  573. Что из нижеперечисленного относится к непараметрическим подходам?
  574. ……… ядро используется для создания нелинейных моделей.
  575. В каком случае подбор гиперпараметров может быть особенно проблематичным?
  576. Упорядочите методы поиска аномалий:
  577. Какой из следующих методов может быть использован для сглаживания функций?
  578. Какие функции часто используются для улучшения качества модели при поиске аномалий?
  579. Для повышения гибкости модели в SVM используется тип ядра — ……..
  580. В рамках машинного обучения, один из типов аномалий, которые можно обнаружить, называется …………….. аномалиями.
  581. Какие из следующих методов не используют параметрический подход?
  582. Установите соответствие между подходами и их определениями:
  583. Метод, используемый для оценки аномалий, в котором объекты классифицируются по удаленности на основе их признаков, называется ……………
  584. Применение ядерных функций позволяет …………… сложные зависимости в данных.
  585. В анализе аномалий часто сталкиваются с проблемами высокоразмерных данных, которые связаны с …………… и малым количеством образцов.
  586. Какой из следующих методов позволяет использовать различные виды ядер в SVM?
  587. Одна из причин, по которой используются нелинейные ядра, заключается в …………… размерности пространства признаков.
  588. Сглаживание функций ядра помогает уменьшить …………… в данных.
  589. Набор данных MNIST представляет собой …..
  590. В наборе данных MNIST имеется …… классов
  591. Какова размерность каждого изображения в MNIST?
  592. На наборе данных MNIST решается такая задача машинного обучения как …..
  593. Как происходит нормализация данных в примере с MNIST?
  594. Какой объем данных содержит обучающая выборка MNIST?
  595. Какой алгоритм классификации часто используется в задачах на MNIST?
  596. Как поступают с пикселями изображений MNIST для подачи в нейронные сети?
  597. Метрикой ………….. обычно оценивается точность классификации на MNIST
  598. Что такое «overfitting» в контексте работы с MNIST?
  599. Какой метод регуляризации можно использовать для снижения переобучения на MNIST?
  600. Какой прием применяется для улучшения обобщающей способности модели при работе с MNIST?
  601. Установите соответствие между терминами и их описаниями:
  602. Цель валидационной выборки в контексте MNIST настроить……
  603. Что представляет собой набор тестовых данных MNIST?
  604. Техникой………… можно воспользоваться для визуализации работы модели на MNIST?
  605. Какая техника уменьшает размерность данных, сохраняя их важные признаки в контексте MNIST?
  606. Какой подход часто используется для подбора гиперпараметров модели на MNIST?
  607. Какой вид нейронной сети показал высокую эффективность на задачи распознавания цифр MNIST?
  608. Упорядочите следующие шаги обработки данных в правильной последовательности при работе с набором данных MNIST для обучения модели классификации рукописных цифр.
  609. Элементарная вычислительная единица, осуществляющая операции взвешенного суммирования и нелинейной активации в контексте искусственных нейронных сетей это — ……
  610. Операция, выполняемая линейным слоем в нейронной сети это — ….
  611. Какая функция активации превращает линейную комбинацию входов в выход в диапазоне (0, 1)?
  612. Для задач классификации с несколькими классами подходит вид функции активации …….
  613. Какая функция активации имеет вид: \( f(x) = \max(0, x) \)?
  614. Чем линейный слой отличается от функции активации?
  615. Какая из функций активации является недифференцируемой в некоторых точках?
  616. ………… необходима для использования градиентного спуска
  617. Установите соответствие между функциями активации и их свойствами. acdb
  618. Какая из следующих функций активации имеет значения выходов в диапазоне от -1 до 1?
  619. Линейная функция активации чаще всего используется для такого типа задач
    как …..
  620. Чем характеризуется Leaky ReLU по сравнению с обычным ReLU?
  621. Что необходимо для того, чтобы функция активации могла быть применена в многослойной нейронной сети?
  622. Функция активации ……. особенно полезна для обработки вероятностных моделей
  623. Какая характеристика делает softmax подходящей для многоклассовой классификации?
  624. Какая функция активации позволяет частично решить проблему «мертвых» нейронов?
  625. У какой функции активации производная максимально проста и постоянна для положительных значений входного сигнала?
  626. Упорядочите функции активации по их популярности в нейронных сетях (от наиболее популярной к наименее популярной). 
  627. Какой недостаток ReLU пытаются преодолеть его модификации, такие как Parametric ReLU (PReLU)?
  628. Что из нижеописанного иллюстрирует работу линейного слоя?
  629. Линейная комбинация входов в контексте нейронных сетей это — …..
  630. Какова основная формула для линейного слоя?
  631. Какие элементы входят в состав линейного слоя?
  632. Что происходит, если нейронный слой состоит только из линейных операций?
  633. Назначение функции активации в нейронных сетях заключается в ……
  634. Какая функция активации является наиболее распространённой?
  635. Градиентная проблема, связанная с использованием функции активации Sigmoid заключается в ….
  636. Какой из следующих слоёв не является линейным?
  637. Упорядочите процессы обучения нейронной сети по этапам (от первого к последнему). 1234
  638. Какой из вариантов является преимуществом использования нескольких линейных слоёв с функциями активации?
  639. Каково влияние добавления слоёв с функциями активации на обобщающую способность модели?
  640. Модель хорошо работает на обучающих данных, но плохо — на тестовых, в контексте нейронных сетей это — ……
  641. Что происходит с весами в линейном слое в процессе обучения?
  642. Что такое «событие затухания градиента»?
  643. Как линейный слой преобразует входные данные?
  644. Назначение параметра «б» (bias) в линейном слое — ……..
  645. Чаще всего используется метод …… для оптимизации весов в нейронных сетях
  646. Установите соответствие между конфигурациями моделей и типами задач, где они обычно применяются.
  647. Почему стоит использовать функции активации, такие как ReLU, в современных нейросетях?
  648. Какой из перечисленных слоёв может быть использован для решения задач классификации, используя линейные слои и функции активации?
  649. Что такое функция ошибки в контексте машинного обучения?
  650. Как называется метод, который используется для минимизации функции ошибки в нейросетях?
  651. Что происходит при применении градиентного спуска?
  652. Что представляет собой метод обратного распространения ошибки?
  653. Что такое затухающие градиенты?
  654. Какие функции активации могут помочь справиться с проблемой затухающих градиентов?
  655. Какую проблему вызывает взрывающийся градиент?
  656. Как можно избежать проблемы взрывающихся градиентов?
  657. Метод, который используется для минимизации функции ошибки путем корректировки весов модели, называется …
  658. Проблема, когда градиенты слишком большие и приводят к нестабильности, называется …
  659. Метод, который используется для распространения ошибок и вычисления градиентов в нейросети, называется …
  660. При применении функции активации ReLU, значение нейрона будет … для отрицательных входов.
  661. Проблема, когда градиенты становятся слишком малыми, что мешает обучению, называется …
  662. Для борьбы с затухающими градиентами часто используют функцию активации …
  663. Установите соответствие между проблемами и их решениями:
  664. Установите соответствие между функциями активации и их свойствами:
  665. Установите соответствие между методами и их назначением:
  666. Упорядочите этапы обучения нейросети с использованием градиентного спуска:
  667. Упорядочите этапы борьбы с проблемой затухающих градиентов:
  668. Упорядочите шаги, которые необходимо выполнить для исправления проблемы взрывающихся градиентов:
  669. Почему слишком большое количество слоев в нейросети может быть проблемой?
  670. Что такое Dropout в нейросетях?
  671. Что позволяет делать Batch Normalization в нейросетях?
  672. Почему нельзя делать слишком много гиперпараметров при построении модели?
  673. Какой инструмент используется в Colab для мониторинга обучения нейросети?
  674. Какую задачу решает Keras Tuner?
  675. Что происходит при применении Dropout в нейросети?
  676. Какой из факторов может привести к излишней сложности модели?
  677. Dropout — это метод регуляризации, который заключается в …
  678. При использовании Batch Normalization необходимо нормализовать …
  679. Основная цель использования Dropout в нейросетях — это …
  680. В Colab для отслеживания графиков обучения и визуализации процесса используется …
  681. Излишнее количество гиперпараметров в модели может привести к …
  682. С помощью Keras Tuner можно …
  683. Установите соответствие между методами и их назначением в нейросетях:
  684. Установите соответствие между инструментами и их назначением:
  685. Установите соответствие между проблемами и их решениями:
  686. Упорядочите этапы работы с гиперпараметрами в Keras Tuner:
  687. Упорядочите шаги использования Dropout в модели:
  688. Упорядочите этапы использования Batch Normalization:
  689. Последовательность данных, отсортированных по времени это — …..
  690. Каковы основные компоненты временного ряда?
  691. Что такое сезонность во временном ряде?
  692. Какие типы моделей используются для анализа временных рядов?
  693. Долговременное изменение уровня данных в контексте временных рядов это — ….
  694. Каковы основные особенности временных данных?
  695. Связь между наблюдениями в одном временном ряду это — ….
  696. Определение конкретных вопросов для анализа временных данных, в контексте анализа временных рядов это — …..
  697. Какой метод может быть использован для прогнозирования временных рядов?
  698. Что такое регрессионный анализ?
  699. Какова основная цель при использовании регрессионного анализа?
  700. Константы, задающие соотношения между переменными в контексте регрессионного анализа это — …….
  701. Упорядочите методы обработки временных данных по их применению для улучшения анализа (от менее к более сложному).
  702. Что такое «модель ARIMA»?
  703. Какой из следующих методов подходит для обработки временных рядов с трендом?
  704. Что означают термины «нормальность» и «гомоскедастичность» в контексте регрессионного анализа?
  705. Установите соответствие между методами обработки временных данных и их целями.
  706. Что такое «выброс» в контексте временных рядов?
  707. Определить эффективность модели при анализе временных рядов можно по …..
  708. Для чего используется кросс-валидация при анализе временных рядов?
  709. Что такое временной ряд?
  710. Основная задача анализа временных рядов выявить зависимости и ……..
  711. Приведение ряда к стационарному состоянию это — ……. временного ряда
  712. Какой метод можно использовать для стабилизации временного ряда?
  713. Одинаковая дисперсия ошибок регрессионной модели это — …….
  714. Изменяющаяся дисперсия ошибок модели это — ……
  715. Установите соответствие между терминами и их определениями в контексте дифференцирования временных рядов.
  716. Какое из следующих утверждений о дифференцировании временного ряда верно?
  717. Каков основной эффект дифференцирования ряда?
  718. Что означает «стационарность» временного ряда?
  719. Упорядочите процесс диагностики гетероскедастичности по этапам.
  720. ……… — это метод, который используется для устранения тренда и циклических колебаний из временного ряда
  721. Какова основная причина, по которой мы используем логарифмическое преобразование временного ряда?
  722. Какой из следующих методов подходит для проверки наличия гетероскедастичности?
  723. Если временной ряд показывает явный тренд, что необходимо сделать перед его анализом?
  724. Какова цель использования теста Дики-Фуллера?
  725. При каком условии временной ряд считается стационарным по параметрам ACF и PACF?
  726. Разница между текущим и предыдущим значением это — …. временного ряда
  727. Как можно визуально проанализировать временной ряд на наличие сезонности и тренда?
  728. Что может указывать на необходимость применения другого метода анализа временного ряда?
  729. Какую задачу решают рекомендательные системы?
  730. Какой из подходов является базовым для рекомендательных систем?
  731. Коллаборативная фильтрация работает на основе …
  732. В каком случае рекомендуется использовать контентную фильтрацию в рекомендательных системах?
  733. Что такое «матричное разложение» в контексте рекомендательных систем?
  734. Какой из методов является примером подхода «гибридной фильтрации»?
  735. Какой основной параметр используется в методах коллаборативной фильтрации?
  736. Когда рекомендуется использовать подход коллаборативной фильтрации?
  737. Рекомендательная система, использующая данные о предпочтениях других пользователей, называется …
  738. Метод, который использует характеристики продуктов или контента для рекомендаций, называется …
  739. Базовый метод для создания рекомендаций, анализирующий схожие предпочтения пользователей, это …
  740. Если для рекомендации используется информация о товаре (например, его категория), такой подход называется …
  741. Когда рекомендательная система использует информацию как о пользователях, так и о товарах, это называется …
  742. Разделение матрицы предпочтений пользователей на несколько меньших матриц для улучшения рекомендаций называется …
  743. Установите соответствие между методами и их описанием:
  744. Установите соответствие между подходами и их применением в рекомендательных системах:
  745. Установите соответствие между типами данных и методами их обработки в рекомендательных системах:
  746. Упорядочите шаги при применении коллаборативной фильтрации:
  747. Упорядочите этапы создания гибридной рекомендательной системы:
  748. Упорядочите этапы работы с матричным разложением:
  749. Какой из методов является примером User-based kNN?
  750. Что такое item-based kNN?
  751. Что используется для оценки качества работы рекомендательных систем?
  752. Какую метрику используют для оценки точности рекомендаций в рекомендательных системах?
  753. Какой метод является примером матричного разложения?
  754. Что помогает определить качество рекомендательной системы?
  755. Для чего используется метрика RMSE в рекомендательных системах?
  756. Какой из подходов используется для построения рекомендательной системы на основе анализа схожести товаров?
  757. Метод, при котором рекомендации делаются на основе анализа схожести между пользователями, называется …
  758. Матричное разложение используется для …
  759. Метрика, которая вычисляется как корень из средней квадратичной ошибки, называется …
  760. Метод, при котором делаются рекомендации на основе анализа схожести между товарами, называется …
  761. Метод, который делит данные на меньшие компоненты для анализа скрытых факторов, называется …
  762. Метод оценки качества рекомендательных систем, основанный на сравнении рекомендованных товаров с действительными предпочтениями пользователя, называется …
  763. Установите соответствие между методами и их описаниями:
  764. Установите соответствие между метриками и их назначением:
  765. Установите соответствие между методами и их применением:
  766. Упорядочите этапы при использовании метода kNN для рекомендательных систем:
  767. Упорядочите этапы применения матричного разложения (например, SVD):
  768. Упорядочите этапы работы с метриками качества в рекомендательных системах:
  769. Что является основной проблемой одномерного отбора признаков?
  770. Какой метод используется для оценки корреляции между признаками в одномерном отборе?
  771. Какой метод отбора признаков используется в жадном подходе для постепенного добавления признаков?
  772. Что такое алгоритм ADD-DEL в контексте жадного отбора признаков?
  773. Какая модель часто используется для отбора признаков в задачах машинного обучения с использованием методов МО?
  774. Какой алгоритм можно использовать для оценки важности признаков в ансамблях алгоритмов?
  775. Что такое SHAP values?
  776. Какой метод позволяет вычислить, какой вклад каждый признак вносит в итоговый результат модели?
  777. Метод, который использует корреляцию для оценки значимости признаков в задаче отбора, называется …
  778. Жадный метод добавления признаков поочередно в модель называется …
  779. Метод, в котором признаки добавляются и удаляются поочередно для оптимизации модели, называется …
  780. Один из методов машинного обучения, который может быть использован для оценки важности признаков, — это …
  781. Метод, который может быть использован для выбора признаков с помощью анализа их вклада в модель, называется …
  782. Метод, который помогает решить проблему неустойчивости в одномерном отборе признаков, называется …
  783. Установите соответствие между методами и их описаниями:
  784. Установите соответствие между методами отбора признаков и их особенностями:
  785. Установите соответствие между методами отбора признаков и их проблемами:
  786. Упорядочите этапы выполнения одномерного отбора признаков:
  787. Упорядочите этапы выполнения жадного отбора признаков с использованием алгоритма ADD-DEL:
  788. Упорядочите этапы использования методов МО для отбора признаков:
  789. Параметры, которые фиксируются перед обучением модели в контексте машинного обучения это ……
  790. Какую роль играют гиперпараметры в модели машинного обучения?
  791. Техника, при которой перебираются все возможные комбинации гиперпараметров называется ……
  792. Что представляет собой кросс-валидация в процессе подбора гиперпараметров?
  793. Какой из следующих подходов является более эффективным для большого пространства гиперпараметров?
  794. Каковы основные проблемы, связанные с подбором гиперпараметров?
  795. Что такое «переобучение» модели?
  796. Статистический метод, который пытается оптимизировать параметры с помощью вероятностной модели в контексте выбора гиперпараметров называется — …..
  797. Что такое «регуляризация» и как она связана с гиперпараметрами?
  798. Что представляет собой «взаимодействие гиперпараметров»?
  799. Использование метода ……….. может помочь избежать переобучения
  800. Установите соответствие между преимуществами и недостатками методов подборов гиперпараметров
  801. Какой из следующих методов может использоваться для визуализации влияния гиперпараметров на производительность модели?
  802. Алгоритм для автоматизации настройки гиперпараметров в контексте подбора гиперпараметров называется — ……
  803. Упорядочите этапы процессов оценки производительности модели после подбора гиперпараметров.
  804. Что такое «стратегия ранней остановки» (early stopping) в контексте подбора гиперпараметров?
  805. Какова роль валидационного набора данных при подборе гиперпараметров?
  806. Как называются гиперпараметры, которые напрямую влияют на обучение модели, например, скорость обучения?
  807. Какой из следующих подходов чаще используется в качестве метрики для выбора гиперпараметров?
  808. Все возможные значения гиперпараметров, которые могут быть протестированы это — ……
  809. Что является основным отличием между GridSearch и RandomSearch?
  810. Какой фреймворк используется для поиска наилучших параметров с помощью случайного выбора в Python?
  811. Какую цель преследует использование фреймворков GridSearch и RandomSearch?
  812. Какой из фреймворков используется для оптимизации гиперпараметров с использованием байесовских методов?
  813. Как называется метод оптимизации, используемый в Optuna?
  814. Какую задачу решает фреймворк Hyperopt?
  815. Какой фреймворк является наиболее подходящим для выполнения оптимизации с использованием генетических алгоритмов?
  816. Что такое «область поиска» в контексте использования GridSearch и RandomSearch?
  817. Метод, который использует перебор всех возможных комбинаций гиперпараметров, называется …
  818. Фреймворк, использующий байесовскую оптимизацию для выбора гиперпараметров, называется …
  819. Метод, в котором параметры выбираются случайным образом из заданных диапазонов, называется …
  820. Метод, который часто используется для настройки гиперпараметров в машинном обучении и базируется на деревьях решений, называется …
  821. Фреймворк, в котором используется случайный выбор параметров из заранее заданных сеток, называется …
  822. Алгоритм оптимизации гиперпараметров, который использует случайный выбор параметров из заранее определенных диапазонов, называется …
  823. Установите соответствие между фреймворками и их описаниями:
  824. Установите соответствие между методами и их особенностями:
  825. Установите соответствие между фреймворками и методами оптимизации:
  826. Упорядочите этапы использования GridSearch для оптимизации гиперпараметров:
  827. Упорядочите этапы использования RandomSearch для оптимизации гиперпараметров:
  828. Упорядочите этапы работы с фреймворком Optuna:
  829. Что такое векторные пространства в контексте NLP?
  830. Каким образом векторное представление слов помогает в анализе текста?
  831. Какой из методов представляет собой стандартное векторное представление слов, где каждое слово отображается на вектор фиксированной длины?
  832. Какую проблему решает использование векторных пространств для слов?
  833. Какой алгоритм является основным для создания векторных представлений слов в контексте нейронных сетей?
  834. Что такое BERT в контексте обработки естественного языка?
  835. Какую задачу решает BERT?
  836. Какое из представлений слов использует контекст для более точного отображения их значения?
  837. Метод представления слов, который использует фиксированные векторы для слов в заранее определенном контексте, называется …
  838. Модель, основанная на трансформерах, которая обеспечивает контекстуальное представление слов, называется …
  839. Тип векторного представления, при котором для каждого слова создается фиксированный вектор, называется …
  840. Алгоритм, который создает векторные представления слов с учетом контекста, называется …
  841. Метод векторизации слов, который использует n-граммы и позволяет обрабатывать редкие слова, называется …
  842. Представление слов, которое сохраняет семантическую схожесть, называется …
  843. Установите соответствие между методами представления слов и их особенностями:
  844. Установите соответствие между методами и их особенностями:
  845. Установите соответствие между векторными моделями и их принципом работы:
  846. Упорядочите этапы создания векторных представлений слов с использованием Word2Vec:
  847. Упорядочите этапы работы с BERT для извлечения контекстуальных представлений:
  848. Упорядочите этапы создания векторных представлений слов с использованием GloVe:
  849. Какая задача в NLP заключается в определении категории объекта (например, организация, человек)?
  850. Какая из задач NLP предполагает создание модели, которая будет предсказывать следующее слово в предложении?
  851. Что такое NER в контексте обработки текста?
  852. Какая из задач NLP является задачей перевода текста с одного языка на другой?
  853. Какой из методов используется для извлечения именованных сущностей из текста?
  854. Какая из задач включает в себя определение полярности текста (положительный, отрицательный, нейтральный)?
  855. Для чего применяется предобученная нейросеть в NLP?
  856. Что включает в себя использование предобученных нейросетей для решения задач NLP?
  857. Какая задача в NLP связана с извлечением сущностей, таких как имена, даты и места?
  858. Метод в NLP, который включает в себя определение категории текста, например, «спорт» или «новости», называется …
  859. Задача, связанная с предсказанием следующего слова на основе контекста, называется …
  860. Задача в NLP, которая включает в себя перевод текста с одного языка на другой, называется …
  861. Использование уже обученной нейросети без дополнительного обучения на конкретных данных называется …
  862. Какая задача NLP включает в себя анализ эмоций текста, например, определение его полярности (положительный, отрицательный)?
  863. Установите соответствие между задачами NLP и их описаниями:
  864. Установите соответствие между задачами и их примерами:
  865. Установите соответствие между задачами и методами их решения:
  866. Упорядочите этапы работы с моделью для задачи классификации текста:
  867. Упорядочите этапы работы с моделью для предсказания следующего слова:
  868. Упорядочите этапы работы с моделью для задачи перевода текста:
  869. Математическая модель, описывающая зависимость переменной от одной или нескольких других переменных – это ……
  870. Упорядочите этапы процесса линейной регрессии:
  871. Какой из следующих примеров является задачей, решаемой с помощью линейной регрессии?
  872. Для измерения средней абсолютной ошибки используется метрика-
  873. Что такое смещение в контексте линейных моделей?
  874. Какая метрика используется для измерения плотности предсказаний в регрессии?
  875. Какая задача решается с помощью уменьшения размерности признаков?
  876. Признаки, что принимают любое значение в определенном диапазоне называются — ……..
  877. Почему важно обрабатывать пропуски в данных?
  878. Скорость изменения функции потерь в градиентном спуске называется ……….
  879. Алгоритм ………. использует адаптивный подход для обработки редких признаков.
  880. Упорядочите методы регуляризации по их типам:
  881. Какой из следующих параметров в регуляризации Ridge отвечает за степень штрафа?
  882. Приведение данных к определенному диапазону – это …….
  883. Почему масштабирование данных полезно при использовании алгоритмов машинного обучения?
  884. Метод …………. применяется для масштабирования данных
  885. Упорядочите методы кодирования по их устойчивости к переобучению
  886. ……. Работает таким образом , что преобразует категорию в порядковое число и затем в его бинарное представление.
  887. Упорядочите этапы процесса рекурсивного устранения функций:
  888. Метод ………. позволяет оценить важность признаков без их использования в предварительной модели
  889. Упорядочите этапы процесса прямого выбора признаков:
  890. Какой способ наиболее верный для выбора модели на основе её способности к обобщению?
  891. Какое из следующих утверждений верно относительно интерпретации коэффициента в множественной регрессии?
  892. Какой из нижеперечисленных методов является линейным классификатором?
  893. Что такое случайный лес?
  894. Функцию активации ……. чаще всего используют на выходном слое нейронной сети в задаче бинарной классификации
  895. Как можно бороться с проблемой несбалансированности классов в k-NN?
  896. ……………. сложность вычислений присуща методу k-NN на больших наборах данных
  897. Как изменится F1-мера, если точность высокая, а полнота низкая?
  898. Почему важно оценивать модель на тестовом наборе данных?
  899. Какой из следующих подходов подходит для уменьшения переобучения?
  900. Что произойдет с гиперплоскостью, если добавить к классификатору регуляризацию?
  901. Упорядочите шаги для оценки производительности линейного классификатора.
  902. Зачем нужно стандартизировать признаки перед использованием логистической регрессии?
  903. Как можно оценить качество модели логистической регрессии?
  904. Почему логистическая регрессия является линейным классификатором?
  905. Какой из следующих методов чувствителен к правильной настройке порогов?
  906. Метод ……. легче дооптимизировать при наличии новых данных
  907. Соответствие между типами задач линейных классификаторов и их свойствами:
  908. Установите соответствие между проблемами линейных классификаторов и методами их решения:
  909. Упорядочьте действия для работы с нелинейно разделёнными данными:
  910. Какой из следующих показателей является графическим представлением качества бинарной классификации?
  911. Какой из следующих показателей описывает долю правильно классифицированных положительных примеров?
  912. Какой из следующих методов классификации является метрическим методом?
  913. В методе k-ближайших соседей выбор соседей производится на основании меры ………
  914. Какой из следующих методов является примером алгоритма, основанного на использовании ядер?
  915. Установите соответствие между методом кластеризации и его характеристикой:
  916. Алгоритм, который использует плотность для формирования кластеров, называется ………
  917. Как называется техника, которая использует расстояния для агрегирования данных в кластеры в методе иерархической кластеризации?
  918. При помощи метода ближайших соседей можно легко классифицировать ………
  919. Установите соответствие между методом кластеризации и его характеристикой:
  920. Какой из следующих методов можно комбинировать со случайными проекциями для улучшения качества модели?
  921. Наличие «шума» при использовании метода случайных проекций …………. надежность метода
  922. Могут ли случайные проекции изменить внутренние корреляции в данных?
  923. Какой метод используется для оценки важности каждой главной компоненты?
  924. Чем является каждая главная компонента в методе PCA?
  925. Как PCA поможет справиться с мультиколлинеарностью признаков?
  926. Что происходит с размерностью данных после применения PCA?
  927. Установите соответствие между методом и его характеристикой:
  928. Процесс оптимизации в t-SNE включает в себя минимизацию …………… функции.
  929. Для какого типа данных наиболее полезно использовать визуализацию?
  930. Какой из следующих методов позволяет использовать различные виды ядер в SVM?
  931. Одна из причин, по которой используются нелинейные ядра, заключается в …… размерности пространства признаков.
  932. Сглаживание функций ядра помогает уменьшить …………… в данных.
  933. Какой алгоритм классификации часто используется в задачах на MNIST?
  934. Как поступают с пикселями изображений MNIST для подачи в нейронные сети?
  935. Линейная функция активации чаще всего используется для такого типа задач
    как …..
  936. Что из нижеописанного иллюстрирует работу линейного слоя?
  937. Чем характеризуется Leaky ReLU по сравнению с обычным ReLU?
  938. Что такое функция ошибки в контексте машинного обучения?
  939. Как называется метод, который используется для минимизации функции ошибки в нейросетях?
  940. Упорядочите этапы работы с гиперпараметрами в Keras Tuner:
  941. Упорядочите шаги использования Dropout в модели:
  942. Упорядочите этапы использования Batch Normalization:
  943. Связь между наблюдениями в одном временном ряду это — ….
  944. Определение конкретных вопросов для анализа временных данных, в контексте анализа временных рядов это — …..
  945. Какова основная причина, по которой мы используем логарифмическое преобразование временного ряда?
  946. Какой из следующих методов подходит для проверки наличия гетероскедастичности?
  947. Если временной ряд показывает явный тренд, что необходимо сделать перед его анализом?
  948. Установите соответствие между подходами и их применением в рекомендательных системах:
  949. Установите соответствие между типами данных и методами их обработки в рекомендательных системах:
  950. Установите соответствие между методами и их применением:
  951. Упорядочите этапы работы с метриками качества в рекомендательных системах:
  952. Какой метод отбора признаков используется в жадном подходе для постепенного добавления признаков?
  953. Какой алгоритм можно использовать для оценки важности признаков в ансамблях алгоритмов?
  954. Что происходит, если отобрать слишком много признаков в модели машинного обучения?
  955. Отбор признаков с использованием оценки корреляции признаков с целевой переменной называется …
  956. Упорядочите этапы применения метода Forward selection:
  957. Параметры, которые фиксируются перед обучением модели в контексте машинного обучения это ……
  958. Какую роль играют гиперпараметры в модели машинного обучения?
  959. Какая из следующих проблем не связана с подбором гиперпараметров?
  960. Какой фреймворк используется для поиска наилучших параметров с помощью случайного выбора в Python?
  961. Какую цель преследует использование фреймворков GridSearch и RandomSearch?
  962. Какой из фреймворков используется для оптимизации гиперпараметров с использованием байесовских методов?
  963. Установите соответствие между методами и их особенностями:
  964. Упорядочите этапы создания векторных представлений слов с использованием Word2Vec:
  965. Установите соответствие между методами представления слов и их особенностями:
  966. Какая из задач NLP является задачей перевода текста с одного языка на другой?
  967. Какой из методов используется для извлечения именованных сущностей из текста?
  968. Установите соответствие между задачами и методами их решения:
  969. Какой из следующих методов помогает бороться с переобучением?
  970. Какой из следующих факторов характеризует разброс (variance) модели?
  971. Что такое переобучение в контексте машинного обучения?
  972. Какой из следующих методов комбинирует L1 и L2-регуляризации?
  973. Какой из следующих методов является примером L1-регуляризации?
  974. В регуляризации Ridge добавляется штраф за …………. весов.
  975. Что такое мультиколлинеарность?
  976. Какой из следующих методов является примером L2-регуляризации?
  977. Ошибка обобщения модели определяется на …………. выборке.
  978. Кросс-валидация используется для оценки …………. модели.
  979. Регуляризация помогает контролировать …………. модели.
  980. Упорядочите методы регуляризации по их типам:
  981. Какой из следующих параметров в регуляризации Ridge отвечает за степень штрафа?
  982. Какой из следующих методов позволяет избежать коллинеарности признаков в линейной регрессии?
  983. В регуляризации Lasso добавляется штраф за………. весов.
  984. Установите соответствие между методами и их свойствами:
  985. L2-регуляризация также известна как ………….
  986. Мультиколлинеарность возникает, когда признаки образуют …………. комбинации.
  987. L1-регуляризация также известна как  ………….