Скачать тест — (Машинное обучение.sa_ИМО_13da760a.pdf)
- Что из перечисленного НЕ является данными?
- Упорядочите типы машинного обучения:
- Какие из перечисленных компонентов НЕ относятся к машинному обучению?
- Упорядочите шаги в процессе подготовки данных:
- Сегодня данные нужны бизнесу, чтобы:
- Соотнесите в верном соответствии термины и определения
- Что включает в себя компонент «модели» в машинном обучении?
- К направлению……… , Data Science относится задача “Разработка архитектуры хранилища данных”
- Упорядочите этапы разработки ML-проекта:
- ……… — это вид машинного обучения, основанный на использовании только неразмеченных данных
- Соотнесите в верном соответствии термины и определения
- …….. — это вид машинного обучения, основанный на использовании только размеченных данных?
- Соотнесите в верном соответствии термины и определения
- Что означает «unsupervised learning»?
- Принцип ………. используется в weakly-supervised learning для обработки данных
- Процесс оценки эффективности модели на тестовых данных называется ……
- ……….. — это математическое или компьютерное представление процесса или явления, которое помогает прогнозировать результаты и проводить эксперименты.
- Выберите правильные утверждения:
- Соотнесите в верном соответствии термины и определения
- Упорядочите типы задач машинного обучения по уровню сложности :
- Этап разработки ML-проекта включающий в себя сбор и подготовку данных называется …..
- Какие данные являются структурированными?
- Соотнесите в верном соответствии термины и определения
- В чем отличие между машинным обучением, нейронными сетями и глубоким обучением?
- Данный вид обучения …….. , наиболее эффективен для работы с большими объемами неразмеченных данных
- Упорядочите методы предварительной обработки данных:
- Выберите верные утверждения:
- Термин ……… описывает выбор алгоритмов и методов для конкретной задачи в ML-проекте
- В чем отличие между обучением с учителем, обучением без учителя и обучением с частичным привлечением учителя?
- При использовании техники …… , модели учатся находить структуры в данных без направляющего сигнала
- Какие признаки называют числовыми?
- Что отличает категориальные признаки от числовых?
- Признаки, которые могут принимать значение 0 или 1 , известны как …… признаки
- Признаки без порядка между категориями — это …… признаки
- ……. признаком является возраст в целых годах
- …………. – это признаки, обладающие порядком между категориями
- Почему важно различать типы признаков?
- Техника кодирования ………… применяется к категориальным признакам для использования в моделях машинного обучения
- Сопоставьте верно тип признака и описание
- В каком порядке следуют типы признаков по возрастанию их возможности хранения информации?
- Какую информацию несут временные признаки в данных?
- Что может стать следствием неравномерных масштабов числовых признаков?
- При помощи способа ……. обрабатываются текстовые признаки перед использованием в моделях
- Для чего может быть полезна стандартизация признаков?
- ……. — это новые признаки, полученные путем комбинации существующих признаков
- Какая задача решается с помощью уменьшения размерности признаков?
- Признаки, что принимают любое значение в определенном диапазоне называются — ……..
- Почему важно обрабатывать пропуски в данных?
- Какая трансформация часто применяется к числовым признакам для устранения выбросов?
- Установите соответствие между типами данных и характеристиками
- Модель, в которой зависимость между переменными линейная это — …….
- Функция … используется в линейной регрессии для минимизации ошибки?
- «Переменные» в контексте линейной модели это — ……
- Какую зависимую переменную называют в линейной модели?
- Чему равна гипотеза линейной регрессии?
- Для измерения точности линейной модели используется метрика качества — ………
- Метрика, измеряющая долю объясненной вариации – это …..
- Для измерения средней абсолютной ошибки используется метрика-
- Что такое смещение в контексте линейных моделей?
- Какая метрика используется для измерения плотности предсказаний в регрессии?
- Сопоставьте верно термины и определения
- Что характеризует параметр θ в линейной модели?
- Расставьте следующие метрики качества регрессии по убыванию значимости:
- Какая метрика измеряет среднее квадратичное отклонение ошибки?
- Упорядочите следующие метрики качества линейной регрессии по убыванию значимости:
- Какая метрика измеряет разницу между предсказанным и фактическим результатом как абсолютное значение?
- Для чего используется метод наименьших квадратов?
- Метрика точности …….. наиболее чувствительна к выбросам
- Метрика …………….. используется для оценки качества модели при больших ошибках
- Математическая модель, описывающая зависимость переменной от одной или нескольких других переменных – это ……
- Упорядочите этапы процесса линейной регрессии:
- Какой из следующих примеров является задачей, решаемой с помощью линейной регрессии?
- …….. переменная в контексте линейной регрессии, это переменная, которую мы пытаемся предсказать
- Что означает коэффициент в уравнении линейной регрессии?
- Какая задача может быть решена с помощью линейной регрессии?
- Чаще всего …….. типа данные используются в качестве входных для линейной регрессии
- Линейная регрессия может быть использована в экономике, для предсказания изменения …….. на товары
- Упорядочите методы оценки качества модели линейной регрессии:
- Как линейная регрессия может помочь в маркетинге?
- Метод ……… используется для нахождения оптимальных коэффициентов в линейной регрессии
- Что значит «переобучение» в контексте линейной регрессии?
- Чем отличается линейная регрессия от полиномиальной?
- Как можно проверить качество модели линейной регрессии?
- Помешать точности модели линейной регрессии может ……. признаков
- Установите соответствие между терминами и их определениями:
- При каких условиях линейная регрессия дает наилучшие результаты?
- Установите соответствие между методами оценки и их описаниями:
- В чем отличие множественной линейной регрессии от простой?
- Метод ………. может использоваться для снижения влияния выбросов на линейную регрессию
- Какой метод используется для минимизации функции потерь в линейной регрессии?
- Какой из методов использует информацию о предыдущих градиентах для адаптации размера шага?
- Какой из следующих параметров используется для оценки качества модели в контексте регрессии?
- Какой из следующих методов является стохастическим?
- Какой алгоритм требует вычисления градиента на всей выборке для обновления весов?
- В процессе обучения линейной модели используется функция потерь, известная как ……….
- Упорядочите методы оптимизации по сложности (от простого к сложному):
- Метод ………. позволяет изменять скорость обучения с течением времени.
- Какой из методов позволяет избежать колебаний в процессе обучения?
- Скорость изменения функции потерь в градиентном спуске называется ……….
- Алгоритм ………. использует адаптивный подход для обработки редких признаков.
- Общее количество итераций, выполняемых в процессе обучения, называется ……….
- В стохастическом градиентном спуске градиент вычисляется на ……….
- Какой метод, который учитывает информацию о предыдущих градиентах для корректировки шага, называется ……….
- Какой из следующих методов используется для решения задачи регрессии?
- В стохастическом градиентном спуске выбирается случайная ………. для вычисления градиента.
- Какой параметр обозначает размер шага при обновлении весов в градиентном спуске?
- Какой метод используется для вычисления адаптивного градиента, учитывая накопленные градиенты?
- Установите соответствие между методами и их описаниями:
- Метод ……… используют для повышения скорости обучения и избегания переобучения
- Приведение данных к определенному диапазону – это …….
- Почему масштабирование данных полезно при использовании алгоритмов машинного обучения?
- Метод …………. применяется для масштабирования данных
- Какой диапазон применяется при стандартной нормализации данных?
- Приведение к диапазону …… происходит с данными при применении метода Min-Max нормализации
- Алгоритм ……… требует обязательного масштабирования входных данных
- Какой из методов масштабирования лучше подходит для данных с выбросами?
- Что такое Z-преобразование в контексте масштабирования?
- Какую проблему может вызвать несопоставимость масштаба признаков в машинном обучении?
- ………….. — метод масштабирования который сохраняет форму распределения данных
- Для……………… типа данных не рекомендуется использовать метод Min-Max нормализации
- Почему не рекомендуется обучать модель на немасштабированных данных в SVM (метод опорных векторов)?
- Установите соответствие между методами масштабирования и их описаниями:
- Масштабирование робастом использует какую статистику для нормализации данных?
- Какой из методов масштабирования требует знания максимума и минимума данных в выборке?
- Установите соответствие между типами данных и рекомендуемыми методами масштабирования:
- Главный недостаток стандартизации данных – это ……
- Как масштабирование данных влияет на вычислительную эффективность?
- Упорядочите шаги, необходимые для устранения влияния выбросов
- Масштабирование ……… используется для обработки данных, где важны относительные различия, а не абсолютные значения
- ………. — это данные, которые представляют собой категории или метки и имеют ограниченный набор значений.
- Что из перечисленного не является методом кодирования категориальных признаков?
- Для работы с порядковыми категориальными признаками подходит метод кодирования …..
- Что происходит при использовании One-hot encoding на категориальных данных?
- Основным недостатком метода One-hot encoding, является ……
- Основное достоинство Label encoding заключается в …….
- Метод кодирования ……… может привести к проблемам в модели из-за ложного порядка категорий
- Какой метод кодирования признаков помогает уменьшить размерность по сравнению с One-hot encoding?
- Что из перечисленного является недостатком Frequency encoding?
- Установите соответствие между методами кодирования и их преимуществами/недостатками
- Какой из методов кодирования может привести к переобучению, если не применять регуляризацию?
- Установите соответствие между методами кодирования и типами данных, к которым они применимы
- Для работы с деревьями решений наиболее эффективным методом кодирования может быть ……..
- Упорядочите методы кодирования по их устойчивости к переобучению
- ……. Работает таким образом , что преобразует категорию в порядковое число и затем в его бинарное представление.
- Какой метод кодирования подходит для данных с большим количеством уникальных значений в категориальном признаке?
- Данный метод кодирования………. зависит от распределения целевого признака
- Упорядочите этапы процесса применения One-Hot Encoding
- Почему важно правильно выбирать метод кодирования для категориальных признаков?
- Какой метод кодирования позволит сохранить информацию о частоте категорий?
- Что такое важность признаков в контексте регрессионного анализа?
- Метод …….. используется для оценки важности признаков в линейной регрессии?
- Что показывает знак коэффициента в линейной регрессии?
- …….. – это метод, который удаляет наименее значимые признаки из модели?
- Что представляет собой нормативизация данных в контексте регрессии?
- Метод регуляризации ………. может помочь в оценке важности признаков
- Как происходит выборка признаков при использовании метода Recursive Feature Elimination (RFE)?
- Что такое метод отбора на основе деревьев решений?
- Методом отбора признаков на основе статистического тестирования , является метод ……
- Как можно наглядно представить важность признаков, выявленную регрессионным анализом?
- Установите соответствие между типами регрессии и их характеристиками
- Метод …….. не относится к процессу отбора признаков
- Установите соответствие между коэффициентами регрессии и их интерпретацией
- Процесс удаления менее значимых признаков для повышения производительности модели называется — ……..
- Упорядочите этапы процесса рекурсивного устранения функций:
- Метод ………. позволяет оценить важность признаков без их использования в предварительной модели
- Упорядочите этапы процесса прямого выбора признаков:
- Установите соответствие между метриками оценки модели и их назначением
- Какой метод может быть использован для ранжирования признаков по уровню их значимости?
- Что из перечисленного может являться целью отбора признаков?
- Метод для исследования зависимости одной количественной переменной от нескольких независимых переменных – это ……
- Какое из уравнений представляет множественную линейную регрессию?
- Что такое коэффициент детерминации \( R^2 \) в множественной регрессии?
- Метод ………. используется для оценки параметров множественной регрессии
- Какое предположение делается относительно ошибок в модели множественной регрессии?
- Какой из следующих факторов может привести к мультиколлинеарности?
- Показатель…………… используется для оценки статистической значимости каждого из коэффициентов независимых переменных?
- Что означает высокая p-значимость независимой переменной?
- Упорядочите этапы проверки предположений многомерной линейной регрессии:
- Упорядочите этапы интерпретации результатов модели многомерной линейной регрессии:
- Какая из нижеуказанных методик используется для борьбы с мультиколлинеарностью?
- Установите соответствие между методом стандартизации и его описанием.
- Для чего используется стандартизация независимых переменных в регрессионной модели?
- Метод ………………. помогает определить вклад каждого признака в конечный предсказанный результат?
- Что делает метод регуляризации Lasso в множественной регрессии?
- Проверить гомоскедастичность ошибок в модели можно построением …………. предсказанных значений против остатков
- Установите соответствие между типами переменных и необходимостью их
- Какой способ наиболее верный для выбора модели на основе её способности к обобщению?
- Какое из следующих утверждений верно относительно интерпретации коэффициента в множественной регрессии?
- Предотвратить переобучение модели можно снижением сложности модели или использованием ……………..
- Какой из нижеперечисленных методов является линейным классификатором?
- Что такое случайный лес?
- Функцию активации ……. чаще всего используют на выходном слое нейронной сети в задаче бинарной классификации
- Метод, который уменьшает предвзятость в данных с дисбалансом классов это — ………
- Зависимость между истинно положительными и ложно положительными показателями, представляет собой ……..
- Какой из методов будет более устойчивым к выбросам в данных?
- Что такое гиперпараметры в контексте алгоритмов классификации?
- ……….. – это метрика, вычисляемая как среднее значение точности и полноты
- Какой из следующих алгоритмов классификации использует принцип максимизации расстояния между классами?
- Упорядочите типы алгоритмов классификации по их сложности (от простого к сложному).
- …………. – это подход для оценки устойчивости модели
- Метод …………. используется для уменьшения размерности данных перед классификацией
- Установите соответствие между терминами и их описаниями.
- ………… метрика наиболее устойчива к проблеме дисбаланса классов
- Что делает стратифицированная кросс-валидация?
- Метод ………….. относится к байесовским алгоритмам
- Для чего можно использовать ансамблевые методы?
- Упорядочите шаги подготовки данных для задачи классификации.
- Какое преимущество дает использование нелинейных ядер в SVM?
- Какая техника позволяет избежать переобучения в нейронных сетях?
- Что такое метод k-ближайших соседей (k-NN)?
- Ключевой параметр, который нужно задать в методе k-NN это — ……
- Метод ………, основан на принципе классификации данных на основе ближайших соседей
- Как влияет увеличение значения k на модель?
- Каким образом измеряется расстояние между точками в k-NN?
- Что происходит, если k равно 1 в k-NN?
- Как можно бороться с проблемой несбалансированности классов в k-NN?
- ……………. сложность вычислений присуща методу k-NN на больших наборах данных
- Метод k-NN, помимо классификации может использоваться для ……
- Какое влияние имеет нормализация данных на k-NN?
- Чувствительнее всего к масштабу в алгоритме k-NN ……. данные
- Установите соответствие между аспектами метода K-ближайших соседей и их описаниями.
- Как можно выбрать оптимальное значение k для модели?
- Упорядочите шаги, необходимые для применения метода K-ближайших соседей, от первого к последнему.
- В каком случае метод k-NN может проигрывать по точности другим методам?
- Вид кросс-валидации ………… чаще всего используется для выбора k в k-NN
- Поможет ускорить работу алгоритма k-NN, применение структур данных, таких как k-d tree или ……………
- Какой из следующих факторов НЕ является ограничением метода k-NN?
- Какую проблему может создать слишком большое значение k?
- Какая из следующих функций может использоваться для вычисления весов соседей в более сложных вариантах k-NN?
- .…….. – это классификация данных на два возможных класса.
- Какой из следующих алгоритмов не используется для бинарной классификации?
- График, иллюстрирующий качество бинарного классификатора это — ………
- Что показывает показатель точности (accuracy) модели?
- Среднее гармоническое точности и полноты это — …………..
- Какое из следующих утверждений верно для логистической регрессии?
- Что такое порог отсечения (threshold) в контексте классификации?
- Упорядочите этапы, необходимые для оценки качества модели бинарной классификации.
- Какой подход можно использовать при дисбалансе классов в наборе данных?
- Что такое переобучение в контексте бинарной классификации?
- Как изменится F1-мера, если точность высокая, а полнота низкая?
- Почему важно оценивать модель на тестовом наборе данных?
- Какой из следующих подходов подходит для уменьшения переобучения?
- Что такое AUC (Area Under Curve) для кривой ROC?
- Показатель ……….. устойчив к дисбалансу классов
- Шум в данных на модели бинарной классификации, может привести к……..
- Что такое True Positive (TP) в контексте бинарной классификации?
- Для чего используется перекрестная проверка (cross-validation)?
- Установите соответствие между методами и их описаниями.
- Метод ………….. лучше подходит для не линейно разделимых данных
- Модель, делающая предсказания на основе линейной комбинации входных признаков это — …………
- Что представляет собой гиперплоскость в контексте линейного классификатора?
- Какова формула уравнения гиперплоскости в линейном классификаторе?
- Что такое отступ ( или «margin») объекта относительно гиперплоскости?
- Какой из этих классификаторов является линейным?
- Как отступ объекта влияет на уверенность классификатора в своём предсказании?
- Каково значение отступа для правильно классифицированных объектов?
- Установите соответствие между терминами и их определениями.
- Что произойдет с гиперплоскостью, если добавить к классификатору регуляризацию?
- Упорядочите шаги для оценки производительности линейного классификатора.
- Что отражает вектор весов в линейном классификаторе?
- …….. – это метод , который максимизирует отступ между двумя классами
- Какое из утверждений о гиперплоскости верное?
- При увеличении количества признаков на гиперплоскость , …… размерность гиперплоскости
- Отступ объекта считается оптимальным, когда он ……..
- Метод SVM предпочтителен для задач с линейно разделяемыми классами, по причине ………
- Что происходит с точностью линейного классификатора при увеличении размерности признаков?
- Каким образом в линейных классификаторах обычно добавляют нелинейность?
- Что произойдет с гиперплоскостью, если ошибочно увеличивать коэффициенты модели?
- Роль регуляризации в линейных классификаторах является — ……….
- Что такое логистическая регрессия?
- Функция, используемая в логистической регрессии для преобразования линейной комбинации признаков называется — ……………
- Диапазон значений ……… принимает сигмоидная функция
- Какой loss (функция потерь) используется в логистической регрессии?
- Значение 0.5 на выходе сигмоидной функции для двоичной классификации означает ………..
- Упорядочите действия при интерпретации коэффициентов логистической регрессии.
- Как решается проблема переобучения в логистической регрессии?
- Часто используемый в логистической регрессии вид регуляризации ……….
- Процесс нахождения оптимальных коэффициентов логистической регрессии называется ……………
- Какой алгоритм оптимизации часто используется в логистической регрессии?
- Что произойдет с вероятностями на выходе логистической регрессии, если признак сильно коррелирует с целевой переменной?
- Установите соответствие между метриками и их описанием.
- Как логистическая регрессия решает многоклассовые задачи классификации?
- Какой недостаток имеет логистическая регрессия?
- Функция активации softmax в логистической регрессии используется для …………..
- Какова роль bias (свободного члена) в логистической регрессии?
- Зачем нужно стандартизировать признаки перед использованием логистической регрессии?
- Как можно оценить качество модели логистической регрессии?
- Почему логистическая регрессия является линейным классификатором?
- При каких условиях логистическая регрессия может плохо справляться с задачей классификации?
- Что такое метод «один против всех» (one-vs-all) в многоклассовой классификации?
- Что такое метод «один против одного» (one-vs-one) в многоклассовой классификации?
- При наличии 5 классов требуется …. классификаторов для метода «один против всех»
- При наличии 4 классов требуется …. классификаторов для метода «один против всех»
- Какой из следующих методов менее вероятно встретит проблему несбалансированности классов?
- Какой подход лучше подходит для больших наборов данных с большим количеством классов?
- Установите соответствие между методами многоклассовой классификации и их описанием.
- Как решается конфликт в методе «один против одного», если несколько классификаторов дают разные результаты для одного примера?
- Какой из следующих методов классификации обычно требует большего объема памяти для обучения?
- Что из следующего является преимуществом метода «один против одного»?
- Сложность построения моделей в методе «один против другого» определяется квадратичной зависимостью от
- Упорядочите этапы реализации метода One-vs-One (OvO) для многоклассовой классификации.
- Каковы недостатки метода «один против всех»?
- Какая проблема решается при помощи вероятностных межклассовых шкал в многоклассовой классификации?
- Лучше использовать метод ……… , если классы взаимосвязаны (близки) друг с другом?
- Какая из следующих задач лучше подходит для метода «один против всех»?
- Метод ………. может стать более ресурсозатратным при большом числе классов
- Какой из методов проще интерпретировать?
- Какой из следующих методов чувствителен к правильной настройке порогов?
- Метод ……. легче дооптимизировать при наличии новых данных
- Что такое линейный классификатор?
- Какие из следующих моделей относятся к линейным классификаторам?
- Какую задачу НЕ решают линейные классификаторы?
- Какое из преимуществ характерно для линейных классификаторов?
- Какой недостаток имеет линейный классификатор?
- Какой метод помогает учесть нелинейные зависимости в данных для линейного классификатора?
- К какому из недостатков может привести большое количество признаков в линейной модели?
- Чем линейные классификаторы особенно эффективны по сравнению с другими методами?
- Какой из следующих методов НЕ относится к улучшению линейного классификатора?
- Установите соответствие между примерами использования линейных классификаторов и их описаниями:
- Установите соответствие между преимуществами линейных классификаторов и их описанием:
- Соответствие между недостатками линейных классификаторов и их характеристиками:
- Установите соответствие между методами улучшения и их назначениями:
- Выберите соответствие между задачами линейных классификаторов и реальными примерами их выполнения:
- Соответствие между типами задач линейных классификаторов и их свойствами:
- Установите соответствие между проблемами линейных классификаторов и методами их решения:
- Упорядочьте действия для работы с нелинейно разделёнными данными:
- Упорядочьте недостатки линейного классификатора в порядке возрастания влияния на качество работы модели при крупных наборах данных:
- Упорядочьте этапы анализа данных, необходимых для работы линейного классификатора:
- Линейный классификатор — это модель, которая делает предсказания, основываясь на … входных признаков.
- Какой из следующих терминов описывает вероятность принадлежности объекта к классу +1 в логистической регрессии?
- Установите соответствие между метриками и их определениями:
- В логистической регрессии максимизация правдоподобия равносильна минимизации …….
- Какой из следующих показателей описывает долю неправильно классифицированных объектов класса -1?
- Какой из следующих методов используется для оценки качества бинарной классификации, основанный на соотношении истинных положительных и всех положительных предсказаний?
- Логистическая регрессия является Accuracy классификатором …….
- Какой из следующих показателей описывает долю правильно классифицированных положительных примеров среди всех объектов?
- Упорядочите метрики качества классификации по возрастанию их сложности:
- Какой из следующих методов используется для визуализации соотношения между истинно положительными и ложно положительными результатами классификации?
- Какой из следующих показателей рассчитывается как среднее гармоническое между precision и recall?
- Показатель ……. описывает общую точность предсказания модели.
- Какой Для минимизации функции потерь в логистической регрессии используется метод …….
- ROC-кривая строится на основе значений TPR и ……..
- Пороговое значение классификации можно варьировать для вычисления ……. и FPR
- Какой из следующих алгоритмов используется для реализации логистической регрессии в Python?
- ……. — это функция, используемая для перевода произвольного вектора в нормированный вектор дискретного распределения.
- …………- это метрика, которая учитывает как истинные положительные, так и ложные положительные предсказания.
- Какой из следующих показателей является графическим представлением качества бинарной классификации?
- Какой из следующих показателей описывает долю правильно классифицированных положительных примеров?
- Какой Завершите предложение: Показатель, описывающий долю ложных положительных предсказаний, называется…….
- Какой из следующих методов классификации является метрическим методом?
- В методе k-ближайших соседей выбор соседей производится на основании меры ………
- Какой из следующих методов является примером алгоритма, основанного на использовании ядер?
- Какой параметр необходимо выбрать при использовании метода Парзеновского окна?
- В задаче классификации с несбалансированной выборкой часто применяют метод ……… для увеличения числа объектов меньшего класса.
- Какой из следующих методов может помочь справиться с дисбалансом классов?
- Что означает SVM в контексте машинного обучения?
- В методе кросс-валидации стратификация используется для ………
- Упорядочите шаги полного цикла классификации в правильном порядке:
- ________ — это метод, который позволяет уменьшить размерность пространства данных с помощью линейной комбинации признаков.
- Какой из следующих типов ядер НЕ используется в SVM?
- Для работы с несбалансированной выборкой часто используются методы оверсэмплинг и ………
- Какова цель обучения с использованием SVM?
- Какая из перечисленных метрик является ключевой для оценки классификации?
- Установите соответствие между методами и их описаниями:
- Одним из способов борьбы с дисбалансом классов является метод………
- Методом, основанным на расстоянии, который может использоваться для классификации, является………
- Применяется при наличии двух классов с различным количеством объектов в обучающей выборке, метод ………
- В контексте SVM, такое ядро как «радикальное базисное» обычно используется для ………
- Какова основная идея метода k-ближайших соседей?
- Что такое дерево решений?
- Дерево решений имеет ……….. структуру
- Конечные узлы, представляющие прогноз , это ….. в дереве решений
- Места, где происходит разбиение данных , это …… в дереве решений
- Упорядочите этапы процесса постобработки дерева решений для предотвращения переобучения.
- Что оценивает метрика Gini в дереве решений?
- Какой критерий используется для разбиения в задаче классификации в дереве решений?
- Что произойдет, если дерево решений будет слишком большим?
- Каковы методы борьбы с переобучением в деревьях решений?
- Что такое «обрезка» дерева решений?
- Каков основной недостаток деревьев решений?
- Длина самого длинного пути от корня до листа это ……… дерева решений
- Установите соответствие между параметрами настройки дерева решений и их описаниями.
- Использованием ансамблей, таких как …….. увеличит стабильность и обобщающую способность при использовании деревьев решений
- Какие данные могут быть использованы в дереве решений?
- Что из перечисленного редко используется для разбиения в деревьях решений?
- Что происходит на каждом этапе построения дерева решений?
- Для уменьшения вариативности и улучшения точности модели , используется техника ………… в деревьях решений
- ……….. может быть использована как альтернатива индексу в деревьях решений для задач классификации
- Упорядочите шаги, необходимые для оценки качества дерева решений.
- Набор данных о разных видах растений представляет собой датасет ………..
- В датасете представлено …… класса ирисов
- Какие виды ирисов содержатся в датасете?
- Сколько всего экземпляров (строк) содержит датасет?
- …………….. признака содержит каждый экземпляр датасета (без учета метки класса)
- Какие признаки измеряются в датасете?
- Метка класса представлена в датасете через ……..
- Метод …………. можно использовать для визуализации датасета
- Установите соответствие между видами ирисов и их характеристиками.
- Какой метод машинного обучения часто используется для работы с этим датасетом в учебных целях?
- В ……………. году сэр Рональд Фишер опубликовал работу с использованием датасета «Ирисы»?
- Какой алгоритм чаще всего используется для визуализации границ принятия решений с помощью этого датасета?
- Какое среднее значение чаще всего рассчитывается для каждого признака в датасете?
- Библиотека Python …………… предлагает встроенный доступ к датасету «Ирисы»
- Какой из нижеперечисленных алгоритмов классификации не подходит для работы с этим датасетом?
- Установите соответствие между методами анализа данных и их применением к датасету ирисы.
- Какую метрику можно использовать для оценки точности модели, обученной на этом датасете?
- Чем полезен датасет «Ирисы» для обучения в области машинного обучения?
- Какой из следующих признаков обычно имеет наибольший стандартное отклонение в Ирисе Верджиника?
- …………… — это вид ирисов который имеет обычно наиболее варьируемую ширину лепестков
- Какой из следующих методов является примером ансамблевого подхода?
- Алгоритм ………….. , основанный на последовательном обучении подмоделей, учитывает ошибки предыдущих.
- Какой алгоритм последовательно обучает подмодели с учетом ошибок предыдущих?
- Метод …………..объединяет предсказания нескольких моделей и уменьшает вариативность.
- Какой термин описывает использование нескольких моделей для повышения точности предсказаний?
- В ………….. обучается одна мета-модель, использующая предсказания нескольких подмоделей.
- Какой из следующих методов не является ансамблем?
- Проблема………….. , когда модель слишком хорошо подстраивается под обучающие данные, критична для всех моделей.
- Какой метод использует скорость уменьшения ошибки на обучающей выборке для мульти-революционного обучения?
- Метод ………….. используется для увеличения разнообразия предсказаний в ансамбле.
- Какой метод комбинирует результаты нескольких моделей для улучшения общей точности?
- Использование метрики ………….. позволяет оценить производительность модели в ансамбле.
- Какой из следующих факторов оказывает наибольшее влияние на качество ансамбля?
- ………….. подмодели обучаются на подвыборках данных, чтобы снизить переобучение.
- Какой метод предполагает использование отдельной модели для комбинации предсказаний подмоделей?
- Для улучшения обобщающей способности используется ………….. моделей.
- Какой из следующих методов использует бутстрэпирование?
- При обучении моделей в ………….. каждая подмодель обучается независимо от других.
- Упорядочите этапы алгоритма бустинга:
- Установите соответствие между термином и его описанием:
- Какой алгоритм является примером метода бустинга?
- В библиотеке sklearn реализован метод ……. для бустинга.
- Какой из следующих методов использует градиентный спуск для уменьшения ошибки?
- ……. является эффективным алгоритмом для работы с разреженными данными.
- В какое время обучения XGBoost учитывает регуляризацию для улучшения обобщающей способности?
- Метод, который последовательно обучает модели на основе ошибок предыдущей, называется …….
- Какой алгоритм использует взвешивание обучающих экземпляров для улучшения модели?
- Параметр learning_rate определяет ……. в модели XGBoost.
- Какой из следующих алгоритмов наиболее эффективен для обработки категориальных признаков?
- Завершите предложение: Поиск оптимума между ……….и точностью для модели. При использовании ансамбля отдельные модели могут демонстрировать достаточную точность при меньшем разбросе значений..
- Упорядочите этапы работы AdaBoost:
- Какой из следующих параметров присваивается каждому классификатору в AdaBoost в зависимости от его производительности?
- Какой из следующих аспектов помогает избежать переобучения в XGBoost при использовании регуляризации?
- Применение AdaBoost позволяет улучшить ……. модели.
- XGBoost используется в соревнованиях по машинному обучению благодаря своей …….
- В алгоритме ……. используется метод градиентного спуска для устранения ошибок.
- Какой тип моделей комбинирует бустинг в своем процессе обучения?
- Какой из следующих признаков CatBoost может обрабатывать автоматически, тем самым сокращая время подготовки данных?
- Параметр n_estimators в XGBoost определяет количество …….
- Установите соответствие между термином и его описанием:
- Какой алгоритм в кластеризации использует расстояние до ближайшего соседа?
- Кластеризация — это техника, использующаяся для ……… объектов на основе их характеристик.
- Метод, основанный на плотности, который может находить кластеры произвольной формы, называется ………
- Какой из следующих алгоритмов является иерархическим?
- Алгоритм EM используется для ………
- Упорядочите этапы работы алгоритма K-средних:
- Мера, используемая для оценки качества кластеризации, называется ………
- Какой из следующих методов кластеризации не требует предварительной инициализации кластеров?
- Кластеризация помогает в задачах анализа и…….. данных.
- Какой метод кластеризации предполагает, что кластеры имеют сферическую форму?
- Установите соответствие между методом кластеризации и его характеристикой:
- Алгоритм, который использует плотность для формирования кластеров, называется ………
- Какой метод кластеризации требует указания количества кластеров до начала работы?
- В иерархической кластеризации возможны два подхода: агломеративная и ………
- Какой из следующих методов кластеризации основан на плотностном подходе?
- Какой подход в иерархической кластеризации заключается в объединении небольших кластеров в большие?
- ВК кластеризации используется для агломеративного подхода, где ……… кластеры объединяются.
- Метод HDBSCAN является ……… версией DBSCAN.
- Какой алгоритм является простым и популярным выбором для кластеризации в задачах сегментации?
- Какой индекс используется для оценки качества разделения кластеров?
- Какой из следующих методов использует расстояние до ближайшего соседа для классификации?
- Алгоритм K-средних требует указания ……… заранее.
- Какой из следующих алгоритмов является плотностным методом кластеризации?
- Для улучшения алгоритма DBSCAN был предложен метод ………
- Упорядочите этапы алгоритма бустинга:
- Метод K-средних основан на минимизации ……… внутри кластеров.
- Алгоритм, который работает на основе вероятностной модели, называется ………
- Как называется техника, которая использует расстояния для агрегирования данных в кластеры в методе иерархической кластеризации?
- При помощи метода ближайших соседей можно легко классифицировать ………
- Установите соответствие между методом кластеризации и его характеристикой:
- EM-алгоритм используется для кластеризации, основанной на ………..
- Метод K-средних не подходит, если кластеры имеют ……….. форму.
- Какая метрика используется для оценки качества кластеризации в методе K-средних?
- По каким критериям при агломеративной иерархической кластеризации, методы различаются ?
- Алгоритм HDBSCAN улучшает DBSCAN, добавляя ………..
- Какое из следующих утверждений верно в отношении обучения модели?
- Какой из следующих недостатков часто наблюдается у алгоритма ближайших соседей (KNN) при работе с высокоразмерными данными?
- Необходимо создать подвыборки методом бутстрапа. Упорядочите этапы алгоритма бэгинга.
- Какой из следующих алгоритмов не требует задания количества кластеров?
- Какой из следующих методов не базируется на алгоритмах машинного обучения?
- Какова основная цель метода случайных проекций?
- К какому типу методов относится Метод случайных проекций?
- Метод ………… является примером случайных проекций?
- Как случайные проекции влияют на вычислительную сложность обработки данных?
- Для …………..метод случайных проекций особенно полезен
- Направления проекции выбираются …………….в методе случайных проекций?
- Какое преимущество у метода случайных проекций по сравнению с методом главных компонент (PCA)?
- Необходимо заранее определить ……………. в методе случайных проекций
- Что происходит с геометрическими расстояниями при использовании случайных проекций?
- В основе метода случайных проекций лежит ключевой математический факт ……..
- Какие преобразования необходимо сделать с данными перед применением метода случайных проекций?
- Как случайные проекции влияют на пространственную структуру данных?
- Упорядочите этапы алгоритма случайных проекций.
- Какой из следующих методов можно комбинировать со случайными проекциями для улучшения качества модели?
- Наличие «шума» при использовании метода случайных проекций …………. надежность метода
- Могут ли случайные проекции изменить внутренние корреляции в данных?
- Какому требованию должны соответствовать случайные матрицы проекции?
- Какая ошибка может возникать при слишком сильном уменьшении размерности методом случайных проекций?
- Как метод случайных проекций может быть полезен для ускорения алгоритмов машинного обучения?
- Установите соответствие между методами понижения размерности и их типами данных, для которых они наиболее подходят.
- Метод уменьшения размерности это метод- ……
- Основная цель метода главных компонент уменьшить количество ……
- Какую математическую процедуру использует PCA для уменьшения размерности?
- Что из нижеперечисленного сохраняет метод главных компонент?
- …….. — это ось в пространстве главных компонент?
- Сумма дисперсий главных компонент по сравнению с исходными данными …….
- Операция ……… обычно предшествует применению метода PCA
- Что происходит с коррелированными признаками после применения PCA?
- Как определить количество главных компонент, достаточно для расшифровки данных с минимальными потерями?
- Какой метод используется для оценки важности каждой главной компоненты?
- Чем является каждая главная компонента в методе PCA?
- Какая из следующих ситуаций наиболее подходит для применения PCA?
- Что из перечисленного нельзя сделать с помощью PCA?
- Установите соответствия между терминами и их недостатками.
- Как влияет на результат PCA наличие нечисловых данных в наборе?
- Как определяется направление первых главных компонент?
- Для чего используется график Scree Plot в контексте PCA?
- Упорядочите применения метода главных компонент.
- Что такое «объясненная дисперсия» в PCA?
- PCA не рекомендуется использовать для категоричных данных, потому что PCA работает только с …………
- Какое преобразование данных часто предшествует применению метода главных компонент?
- Метод линейной алгебры ……………. используется для нахождения главных компонент?
- Что такое собственные векторы в контексте PCA?
- Какое условие накладывается на собственные векторы при их расчете для PCA?
- Что отражает значение собственных чисел в методе PCA?
- Как определяется ковариационная матрица данных в PCA?
- Ортогональная база в PCA представляет из себя набор векторов, …………друг другу
- Какой шаг выполняется после нахождения собственных векторов и собственных значений в PCA?
- Матрица ……….. преобразует исходные данные в пространство главных компонент
- Сколько главных компонент можно извлечь из набора данных размерности \( n \times p \) (где \( n \) — количество наблюдений, \( p \) — количество признаков)?
- Упорядочите алгоритм нахождения производной функции:
- К ……………… значениям собственных чисел главных компонент стоит присмотреться в первую очередь
- Как PCA поможет справиться с мультиколлинеарностью признаков?
- Что происходит с размерностью данных после применения PCA?
- Установите соответствие между методами решения уравнений и их описаниями:
- При каких условиях следует использовать корреляционную матрицу вместо ковариационной в PCA?
- Когда один из признаков полностью зависит от другого ,определитель ковариационной матрицы принимает значение…………..
- Общая доля дисперсии, объясненная выбранными главными компонентами это — ……… в контексте PCA
- Какое преобразование данных выполняется в методе центровки?
- Зачем проводится стандартизация данных перед применением PCA?
- Какой метод используется для многомерного шкалирования?
- Визуализация данных начинается с …………… информации.
- t-SNE является улучшением предыдущего метода ……………
- Упорядочите шаги процесса многомерного шкалирования:
- Технологии визуализации помогают в …………… и анализе больших данных.
- Какой термин описывает процесс уменьшения количества переменных для упрощения анализа?
- Установите соответствие между методом и его характеристикой:
- Для какого типа данных наиболее полезно использовать визуализацию?
- t-SNE лучше всего подходит для визуализации данных с …………… структурой.
- Какой метод оптимизации используется в многомерном шкалировании?
- Примеры задач, решаемых с помощью визуализации, включают …………… и анализ данных.
- Метод оптимизации, используемый в многомерном шкалировании – это …………… метод градиентного спуска.
- Визуализация помогает …………… данные, чтобы выявить скрытые зависимости.
- Какой из ниже перечисленных методов наименее относится к визуализации?
- Какой метод визуализации данных предназначен для сохранения локальной структуры распределения данных при переходе из высокоразмерного пространства в низкоразмерное?
- Для обеспечения хорошей визуализации t-SNE требуется …………… параметров.
- На каком принципе основаны методы SNE и t-SNE для минимизации различий между данными?
- Какой метод многомерного шкалирования предназначен для сохранения локальных связей между соседями?
- Какой тип данных может обрабатывать многомерное шкалирование?
- Поиск аномалий в данных берет свое начало из …………….. области.
- Какой алгоритм обычно используется для классификации, чувствительной к аномалиям?
- Какой метод визуализации данных предназначен для сохранения локальной структуры при переходе из высокоразмерного пространства в низкоразмерное?
- Для какой цели чаще всего применяется модель смеси распределений?
- Что из нижеперечисленного относится к непараметрическим подходам?
- ……… ядро используется для создания нелинейных моделей.
- В каком случае подбор гиперпараметров может быть особенно проблематичным?
- Упорядочите методы поиска аномалий:
- Какой из следующих методов может быть использован для сглаживания функций?
- Какие функции часто используются для улучшения качества модели при поиске аномалий?
- Для повышения гибкости модели в SVM используется тип ядра — ……..
- В рамках машинного обучения, один из типов аномалий, которые можно обнаружить, называется …………….. аномалиями.
- Какие из следующих методов не используют параметрический подход?
- Установите соответствие между подходами и их определениями:
- Метод, используемый для оценки аномалий, в котором объекты классифицируются по удаленности на основе их признаков, называется ……………
- Применение ядерных функций позволяет …………… сложные зависимости в данных.
- В анализе аномалий часто сталкиваются с проблемами высокоразмерных данных, которые связаны с …………… и малым количеством образцов.
- Какой из следующих методов позволяет использовать различные виды ядер в SVM?
- Одна из причин, по которой используются нелинейные ядра, заключается в …………… размерности пространства признаков.
- Сглаживание функций ядра помогает уменьшить …………… в данных.
- Набор данных MNIST представляет собой …..
- В наборе данных MNIST имеется …… классов
- Какова размерность каждого изображения в MNIST?
- На наборе данных MNIST решается такая задача машинного обучения как …..
- Как происходит нормализация данных в примере с MNIST?
- Какой объем данных содержит обучающая выборка MNIST?
- Какой алгоритм классификации часто используется в задачах на MNIST?
- Как поступают с пикселями изображений MNIST для подачи в нейронные сети?
- Метрикой ………….. обычно оценивается точность классификации на MNIST
- Что такое «overfitting» в контексте работы с MNIST?
- Какой метод регуляризации можно использовать для снижения переобучения на MNIST?
- Какой прием применяется для улучшения обобщающей способности модели при работе с MNIST?
- Установите соответствие между терминами и их описаниями:
- Цель валидационной выборки в контексте MNIST настроить……
- Что представляет собой набор тестовых данных MNIST?
- Техникой………… можно воспользоваться для визуализации работы модели на MNIST?
- Какая техника уменьшает размерность данных, сохраняя их важные признаки в контексте MNIST?
- Какой подход часто используется для подбора гиперпараметров модели на MNIST?
- Какой вид нейронной сети показал высокую эффективность на задачи распознавания цифр MNIST?
- Упорядочите следующие шаги обработки данных в правильной последовательности при работе с набором данных MNIST для обучения модели классификации рукописных цифр.
- Элементарная вычислительная единица, осуществляющая операции взвешенного суммирования и нелинейной активации в контексте искусственных нейронных сетей это — ……
- Операция, выполняемая линейным слоем в нейронной сети это — ….
- Какая функция активации превращает линейную комбинацию входов в выход в диапазоне (0, 1)?
- Для задач классификации с несколькими классами подходит вид функции активации …….
- Какая функция активации имеет вид: \( f(x) = \max(0, x) \)?
- Чем линейный слой отличается от функции активации?
- Какая из функций активации является недифференцируемой в некоторых точках?
- ………… необходима для использования градиентного спуска
- Установите соответствие между функциями активации и их свойствами. acdb
- Какая из следующих функций активации имеет значения выходов в диапазоне от -1 до 1?
- Линейная функция активации чаще всего используется для такого типа задач
как ….. - Чем характеризуется Leaky ReLU по сравнению с обычным ReLU?
- Что необходимо для того, чтобы функция активации могла быть применена в многослойной нейронной сети?
- Функция активации ……. особенно полезна для обработки вероятностных моделей
- Какая характеристика делает softmax подходящей для многоклассовой классификации?
- Какая функция активации позволяет частично решить проблему «мертвых» нейронов?
- У какой функции активации производная максимально проста и постоянна для положительных значений входного сигнала?
- Упорядочите функции активации по их популярности в нейронных сетях (от наиболее популярной к наименее популярной).
- Какой недостаток ReLU пытаются преодолеть его модификации, такие как Parametric ReLU (PReLU)?
- Что из нижеописанного иллюстрирует работу линейного слоя?
- Линейная комбинация входов в контексте нейронных сетей это — …..
- Какова основная формула для линейного слоя?
- Какие элементы входят в состав линейного слоя?
- Что происходит, если нейронный слой состоит только из линейных операций?
- Назначение функции активации в нейронных сетях заключается в ……
- Какая функция активации является наиболее распространённой?
- Градиентная проблема, связанная с использованием функции активации Sigmoid заключается в ….
- Какой из следующих слоёв не является линейным?
- Упорядочите процессы обучения нейронной сети по этапам (от первого к последнему). 1234
- Какой из вариантов является преимуществом использования нескольких линейных слоёв с функциями активации?
- Каково влияние добавления слоёв с функциями активации на обобщающую способность модели?
- Модель хорошо работает на обучающих данных, но плохо — на тестовых, в контексте нейронных сетей это — ……
- Что происходит с весами в линейном слое в процессе обучения?
- Что такое «событие затухания градиента»?
- Как линейный слой преобразует входные данные?
- Назначение параметра «б» (bias) в линейном слое — ……..
- Чаще всего используется метод …… для оптимизации весов в нейронных сетях
- Установите соответствие между конфигурациями моделей и типами задач, где они обычно применяются.
- Почему стоит использовать функции активации, такие как ReLU, в современных нейросетях?
- Какой из перечисленных слоёв может быть использован для решения задач классификации, используя линейные слои и функции активации?
- Что такое функция ошибки в контексте машинного обучения?
- Как называется метод, который используется для минимизации функции ошибки в нейросетях?
- Что происходит при применении градиентного спуска?
- Что представляет собой метод обратного распространения ошибки?
- Что такое затухающие градиенты?
- Какие функции активации могут помочь справиться с проблемой затухающих градиентов?
- Какую проблему вызывает взрывающийся градиент?
- Как можно избежать проблемы взрывающихся градиентов?
- Метод, который используется для минимизации функции ошибки путем корректировки весов модели, называется …
- Проблема, когда градиенты слишком большие и приводят к нестабильности, называется …
- Метод, который используется для распространения ошибок и вычисления градиентов в нейросети, называется …
- При применении функции активации ReLU, значение нейрона будет … для отрицательных входов.
- Проблема, когда градиенты становятся слишком малыми, что мешает обучению, называется …
- Для борьбы с затухающими градиентами часто используют функцию активации …
- Установите соответствие между проблемами и их решениями:
- Установите соответствие между функциями активации и их свойствами:
- Установите соответствие между методами и их назначением:
- Упорядочите этапы обучения нейросети с использованием градиентного спуска:
- Упорядочите этапы борьбы с проблемой затухающих градиентов:
- Упорядочите шаги, которые необходимо выполнить для исправления проблемы взрывающихся градиентов:
- Почему слишком большое количество слоев в нейросети может быть проблемой?
- Что такое Dropout в нейросетях?
- Что позволяет делать Batch Normalization в нейросетях?
- Почему нельзя делать слишком много гиперпараметров при построении модели?
- Какой инструмент используется в Colab для мониторинга обучения нейросети?
- Какую задачу решает Keras Tuner?
- Что происходит при применении Dropout в нейросети?
- Какой из факторов может привести к излишней сложности модели?
- Dropout — это метод регуляризации, который заключается в …
- При использовании Batch Normalization необходимо нормализовать …
- Основная цель использования Dropout в нейросетях — это …
- В Colab для отслеживания графиков обучения и визуализации процесса используется …
- Излишнее количество гиперпараметров в модели может привести к …
- С помощью Keras Tuner можно …
- Установите соответствие между методами и их назначением в нейросетях:
- Установите соответствие между инструментами и их назначением:
- Установите соответствие между проблемами и их решениями:
- Упорядочите этапы работы с гиперпараметрами в Keras Tuner:
- Упорядочите шаги использования Dropout в модели:
- Упорядочите этапы использования Batch Normalization:
- Последовательность данных, отсортированных по времени это — …..
- Каковы основные компоненты временного ряда?
- Что такое сезонность во временном ряде?
- Какие типы моделей используются для анализа временных рядов?
- Долговременное изменение уровня данных в контексте временных рядов это — ….
- Каковы основные особенности временных данных?
- Связь между наблюдениями в одном временном ряду это — ….
- Определение конкретных вопросов для анализа временных данных, в контексте анализа временных рядов это — …..
- Какой метод может быть использован для прогнозирования временных рядов?
- Что такое регрессионный анализ?
- Какова основная цель при использовании регрессионного анализа?
- Константы, задающие соотношения между переменными в контексте регрессионного анализа это — …….
- Упорядочите методы обработки временных данных по их применению для улучшения анализа (от менее к более сложному).
- Что такое «модель ARIMA»?
- Какой из следующих методов подходит для обработки временных рядов с трендом?
- Что означают термины «нормальность» и «гомоскедастичность» в контексте регрессионного анализа?
- Установите соответствие между методами обработки временных данных и их целями.
- Что такое «выброс» в контексте временных рядов?
- Определить эффективность модели при анализе временных рядов можно по …..
- Для чего используется кросс-валидация при анализе временных рядов?
- Что такое временной ряд?
- Основная задача анализа временных рядов выявить зависимости и ……..
- Приведение ряда к стационарному состоянию это — ……. временного ряда
- Какой метод можно использовать для стабилизации временного ряда?
- Одинаковая дисперсия ошибок регрессионной модели это — …….
- Изменяющаяся дисперсия ошибок модели это — ……
- Установите соответствие между терминами и их определениями в контексте дифференцирования временных рядов.
- Какое из следующих утверждений о дифференцировании временного ряда верно?
- Каков основной эффект дифференцирования ряда?
- Что означает «стационарность» временного ряда?
- Упорядочите процесс диагностики гетероскедастичности по этапам.
- ……… — это метод, который используется для устранения тренда и циклических колебаний из временного ряда
- Какова основная причина, по которой мы используем логарифмическое преобразование временного ряда?
- Какой из следующих методов подходит для проверки наличия гетероскедастичности?
- Если временной ряд показывает явный тренд, что необходимо сделать перед его анализом?
- Какова цель использования теста Дики-Фуллера?
- При каком условии временной ряд считается стационарным по параметрам ACF и PACF?
- Разница между текущим и предыдущим значением это — …. временного ряда
- Как можно визуально проанализировать временной ряд на наличие сезонности и тренда?
- Что может указывать на необходимость применения другого метода анализа временного ряда?
- Какую задачу решают рекомендательные системы?
- Какой из подходов является базовым для рекомендательных систем?
- Коллаборативная фильтрация работает на основе …
- В каком случае рекомендуется использовать контентную фильтрацию в рекомендательных системах?
- Что такое «матричное разложение» в контексте рекомендательных систем?
- Какой из методов является примером подхода «гибридной фильтрации»?
- Какой основной параметр используется в методах коллаборативной фильтрации?
- Когда рекомендуется использовать подход коллаборативной фильтрации?
- Рекомендательная система, использующая данные о предпочтениях других пользователей, называется …
- Метод, который использует характеристики продуктов или контента для рекомендаций, называется …
- Базовый метод для создания рекомендаций, анализирующий схожие предпочтения пользователей, это …
- Если для рекомендации используется информация о товаре (например, его категория), такой подход называется …
- Когда рекомендательная система использует информацию как о пользователях, так и о товарах, это называется …
- Разделение матрицы предпочтений пользователей на несколько меньших матриц для улучшения рекомендаций называется …
- Установите соответствие между методами и их описанием:
- Установите соответствие между подходами и их применением в рекомендательных системах:
- Установите соответствие между типами данных и методами их обработки в рекомендательных системах:
- Упорядочите шаги при применении коллаборативной фильтрации:
- Упорядочите этапы создания гибридной рекомендательной системы:
- Упорядочите этапы работы с матричным разложением:
- Какой из методов является примером User-based kNN?
- Что такое item-based kNN?
- Что используется для оценки качества работы рекомендательных систем?
- Какую метрику используют для оценки точности рекомендаций в рекомендательных системах?
- Какой метод является примером матричного разложения?
- Что помогает определить качество рекомендательной системы?
- Для чего используется метрика RMSE в рекомендательных системах?
- Какой из подходов используется для построения рекомендательной системы на основе анализа схожести товаров?
- Метод, при котором рекомендации делаются на основе анализа схожести между пользователями, называется …
- Матричное разложение используется для …
- Метрика, которая вычисляется как корень из средней квадратичной ошибки, называется …
- Метод, при котором делаются рекомендации на основе анализа схожести между товарами, называется …
- Метод, который делит данные на меньшие компоненты для анализа скрытых факторов, называется …
- Метод оценки качества рекомендательных систем, основанный на сравнении рекомендованных товаров с действительными предпочтениями пользователя, называется …
- Установите соответствие между методами и их описаниями:
- Установите соответствие между метриками и их назначением:
- Установите соответствие между методами и их применением:
- Упорядочите этапы при использовании метода kNN для рекомендательных систем:
- Упорядочите этапы применения матричного разложения (например, SVD):
- Упорядочите этапы работы с метриками качества в рекомендательных системах:
- Что является основной проблемой одномерного отбора признаков?
- Какой метод используется для оценки корреляции между признаками в одномерном отборе?
- Какой метод отбора признаков используется в жадном подходе для постепенного добавления признаков?
- Что такое алгоритм ADD-DEL в контексте жадного отбора признаков?
- Какая модель часто используется для отбора признаков в задачах машинного обучения с использованием методов МО?
- Какой алгоритм можно использовать для оценки важности признаков в ансамблях алгоритмов?
- Что такое SHAP values?
- Какой метод позволяет вычислить, какой вклад каждый признак вносит в итоговый результат модели?
- Метод, который использует корреляцию для оценки значимости признаков в задаче отбора, называется …
- Жадный метод добавления признаков поочередно в модель называется …
- Метод, в котором признаки добавляются и удаляются поочередно для оптимизации модели, называется …
- Один из методов машинного обучения, который может быть использован для оценки важности признаков, — это …
- Метод, который может быть использован для выбора признаков с помощью анализа их вклада в модель, называется …
- Метод, который помогает решить проблему неустойчивости в одномерном отборе признаков, называется …
- Установите соответствие между методами и их описаниями:
- Установите соответствие между методами отбора признаков и их особенностями:
- Установите соответствие между методами отбора признаков и их проблемами:
- Упорядочите этапы выполнения одномерного отбора признаков:
- Упорядочите этапы выполнения жадного отбора признаков с использованием алгоритма ADD-DEL:
- Упорядочите этапы использования методов МО для отбора признаков:
- Параметры, которые фиксируются перед обучением модели в контексте машинного обучения это ……
- Какую роль играют гиперпараметры в модели машинного обучения?
- Техника, при которой перебираются все возможные комбинации гиперпараметров называется ……
- Что представляет собой кросс-валидация в процессе подбора гиперпараметров?
- Какой из следующих подходов является более эффективным для большого пространства гиперпараметров?
- Каковы основные проблемы, связанные с подбором гиперпараметров?
- Что такое «переобучение» модели?
- Статистический метод, который пытается оптимизировать параметры с помощью вероятностной модели в контексте выбора гиперпараметров называется — …..
- Что такое «регуляризация» и как она связана с гиперпараметрами?
- Что представляет собой «взаимодействие гиперпараметров»?
- Использование метода ……….. может помочь избежать переобучения
- Установите соответствие между преимуществами и недостатками методов подборов гиперпараметров
- Какой из следующих методов может использоваться для визуализации влияния гиперпараметров на производительность модели?
- Алгоритм для автоматизации настройки гиперпараметров в контексте подбора гиперпараметров называется — ……
- Упорядочите этапы процессов оценки производительности модели после подбора гиперпараметров.
- Что такое «стратегия ранней остановки» (early stopping) в контексте подбора гиперпараметров?
- Какова роль валидационного набора данных при подборе гиперпараметров?
- Как называются гиперпараметры, которые напрямую влияют на обучение модели, например, скорость обучения?
- Какой из следующих подходов чаще используется в качестве метрики для выбора гиперпараметров?
- Все возможные значения гиперпараметров, которые могут быть протестированы это — ……
- Что является основным отличием между GridSearch и RandomSearch?
- Какой фреймворк используется для поиска наилучших параметров с помощью случайного выбора в Python?
- Какую цель преследует использование фреймворков GridSearch и RandomSearch?
- Какой из фреймворков используется для оптимизации гиперпараметров с использованием байесовских методов?
- Как называется метод оптимизации, используемый в Optuna?
- Какую задачу решает фреймворк Hyperopt?
- Какой фреймворк является наиболее подходящим для выполнения оптимизации с использованием генетических алгоритмов?
- Что такое «область поиска» в контексте использования GridSearch и RandomSearch?
- Метод, который использует перебор всех возможных комбинаций гиперпараметров, называется …
- Фреймворк, использующий байесовскую оптимизацию для выбора гиперпараметров, называется …
- Метод, в котором параметры выбираются случайным образом из заданных диапазонов, называется …
- Метод, который часто используется для настройки гиперпараметров в машинном обучении и базируется на деревьях решений, называется …
- Фреймворк, в котором используется случайный выбор параметров из заранее заданных сеток, называется …
- Алгоритм оптимизации гиперпараметров, который использует случайный выбор параметров из заранее определенных диапазонов, называется …
- Установите соответствие между фреймворками и их описаниями:
- Установите соответствие между методами и их особенностями:
- Установите соответствие между фреймворками и методами оптимизации:
- Упорядочите этапы использования GridSearch для оптимизации гиперпараметров:
- Упорядочите этапы использования RandomSearch для оптимизации гиперпараметров:
- Упорядочите этапы работы с фреймворком Optuna:
- Что такое векторные пространства в контексте NLP?
- Каким образом векторное представление слов помогает в анализе текста?
- Какой из методов представляет собой стандартное векторное представление слов, где каждое слово отображается на вектор фиксированной длины?
- Какую проблему решает использование векторных пространств для слов?
- Какой алгоритм является основным для создания векторных представлений слов в контексте нейронных сетей?
- Что такое BERT в контексте обработки естественного языка?
- Какую задачу решает BERT?
- Какое из представлений слов использует контекст для более точного отображения их значения?
- Метод представления слов, который использует фиксированные векторы для слов в заранее определенном контексте, называется …
- Модель, основанная на трансформерах, которая обеспечивает контекстуальное представление слов, называется …
- Тип векторного представления, при котором для каждого слова создается фиксированный вектор, называется …
- Алгоритм, который создает векторные представления слов с учетом контекста, называется …
- Метод векторизации слов, который использует n-граммы и позволяет обрабатывать редкие слова, называется …
- Представление слов, которое сохраняет семантическую схожесть, называется …
- Установите соответствие между методами представления слов и их особенностями:
- Установите соответствие между методами и их особенностями:
- Установите соответствие между векторными моделями и их принципом работы:
- Упорядочите этапы создания векторных представлений слов с использованием Word2Vec:
- Упорядочите этапы работы с BERT для извлечения контекстуальных представлений:
- Упорядочите этапы создания векторных представлений слов с использованием GloVe:
- Какая задача в NLP заключается в определении категории объекта (например, организация, человек)?
- Какая из задач NLP предполагает создание модели, которая будет предсказывать следующее слово в предложении?
- Что такое NER в контексте обработки текста?
- Какая из задач NLP является задачей перевода текста с одного языка на другой?
- Какой из методов используется для извлечения именованных сущностей из текста?
- Какая из задач включает в себя определение полярности текста (положительный, отрицательный, нейтральный)?
- Для чего применяется предобученная нейросеть в NLP?
- Что включает в себя использование предобученных нейросетей для решения задач NLP?
- Какая задача в NLP связана с извлечением сущностей, таких как имена, даты и места?
- Метод в NLP, который включает в себя определение категории текста, например, «спорт» или «новости», называется …
- Задача, связанная с предсказанием следующего слова на основе контекста, называется …
- Задача в NLP, которая включает в себя перевод текста с одного языка на другой, называется …
- Использование уже обученной нейросети без дополнительного обучения на конкретных данных называется …
- Какая задача NLP включает в себя анализ эмоций текста, например, определение его полярности (положительный, отрицательный)?
- Установите соответствие между задачами NLP и их описаниями:
- Установите соответствие между задачами и их примерами:
- Установите соответствие между задачами и методами их решения:
- Упорядочите этапы работы с моделью для задачи классификации текста:
- Упорядочите этапы работы с моделью для предсказания следующего слова:
- Упорядочите этапы работы с моделью для задачи перевода текста:
- Математическая модель, описывающая зависимость переменной от одной или нескольких других переменных – это ……
- Упорядочите этапы процесса линейной регрессии:
- Какой из следующих примеров является задачей, решаемой с помощью линейной регрессии?
- Для измерения средней абсолютной ошибки используется метрика-
- Что такое смещение в контексте линейных моделей?
- Какая метрика используется для измерения плотности предсказаний в регрессии?
- Какая задача решается с помощью уменьшения размерности признаков?
- Признаки, что принимают любое значение в определенном диапазоне называются — ……..
- Почему важно обрабатывать пропуски в данных?
- Скорость изменения функции потерь в градиентном спуске называется ……….
- Алгоритм ………. использует адаптивный подход для обработки редких признаков.
- Упорядочите методы регуляризации по их типам:
- Какой из следующих параметров в регуляризации Ridge отвечает за степень штрафа?
- Приведение данных к определенному диапазону – это …….
- Почему масштабирование данных полезно при использовании алгоритмов машинного обучения?
- Метод …………. применяется для масштабирования данных
- Упорядочите методы кодирования по их устойчивости к переобучению
- ……. Работает таким образом , что преобразует категорию в порядковое число и затем в его бинарное представление.
- Упорядочите этапы процесса рекурсивного устранения функций:
- Метод ………. позволяет оценить важность признаков без их использования в предварительной модели
- Упорядочите этапы процесса прямого выбора признаков:
- Какой способ наиболее верный для выбора модели на основе её способности к обобщению?
- Какое из следующих утверждений верно относительно интерпретации коэффициента в множественной регрессии?
- Какой из нижеперечисленных методов является линейным классификатором?
- Что такое случайный лес?
- Функцию активации ……. чаще всего используют на выходном слое нейронной сети в задаче бинарной классификации
- Как можно бороться с проблемой несбалансированности классов в k-NN?
- ……………. сложность вычислений присуща методу k-NN на больших наборах данных
- Как изменится F1-мера, если точность высокая, а полнота низкая?
- Почему важно оценивать модель на тестовом наборе данных?
- Какой из следующих подходов подходит для уменьшения переобучения?
- Что произойдет с гиперплоскостью, если добавить к классификатору регуляризацию?
- Упорядочите шаги для оценки производительности линейного классификатора.
- Зачем нужно стандартизировать признаки перед использованием логистической регрессии?
- Как можно оценить качество модели логистической регрессии?
- Почему логистическая регрессия является линейным классификатором?
- Какой из следующих методов чувствителен к правильной настройке порогов?
- Метод ……. легче дооптимизировать при наличии новых данных
- Соответствие между типами задач линейных классификаторов и их свойствами:
- Установите соответствие между проблемами линейных классификаторов и методами их решения:
- Упорядочьте действия для работы с нелинейно разделёнными данными:
- Какой из следующих показателей является графическим представлением качества бинарной классификации?
- Какой из следующих показателей описывает долю правильно классифицированных положительных примеров?
- Какой из следующих методов классификации является метрическим методом?
- В методе k-ближайших соседей выбор соседей производится на основании меры ………
- Какой из следующих методов является примером алгоритма, основанного на использовании ядер?
- Установите соответствие между методом кластеризации и его характеристикой:
- Алгоритм, который использует плотность для формирования кластеров, называется ………
- Как называется техника, которая использует расстояния для агрегирования данных в кластеры в методе иерархической кластеризации?
- При помощи метода ближайших соседей можно легко классифицировать ………
- Установите соответствие между методом кластеризации и его характеристикой:
- Какой из следующих методов можно комбинировать со случайными проекциями для улучшения качества модели?
- Наличие «шума» при использовании метода случайных проекций …………. надежность метода
- Могут ли случайные проекции изменить внутренние корреляции в данных?
- Какой метод используется для оценки важности каждой главной компоненты?
- Чем является каждая главная компонента в методе PCA?
- Как PCA поможет справиться с мультиколлинеарностью признаков?
- Что происходит с размерностью данных после применения PCA?
- Установите соответствие между методом и его характеристикой:
- Процесс оптимизации в t-SNE включает в себя минимизацию …………… функции.
- Для какого типа данных наиболее полезно использовать визуализацию?
- Какой из следующих методов позволяет использовать различные виды ядер в SVM?
- Одна из причин, по которой используются нелинейные ядра, заключается в …… размерности пространства признаков.
- Сглаживание функций ядра помогает уменьшить …………… в данных.
- Какой алгоритм классификации часто используется в задачах на MNIST?
- Как поступают с пикселями изображений MNIST для подачи в нейронные сети?
- Линейная функция активации чаще всего используется для такого типа задач
как ….. - Что из нижеописанного иллюстрирует работу линейного слоя?
- Чем характеризуется Leaky ReLU по сравнению с обычным ReLU?
- Что такое функция ошибки в контексте машинного обучения?
- Как называется метод, который используется для минимизации функции ошибки в нейросетях?
- Упорядочите этапы работы с гиперпараметрами в Keras Tuner:
- Упорядочите шаги использования Dropout в модели:
- Упорядочите этапы использования Batch Normalization:
- Связь между наблюдениями в одном временном ряду это — ….
- Определение конкретных вопросов для анализа временных данных, в контексте анализа временных рядов это — …..
- Какова основная причина, по которой мы используем логарифмическое преобразование временного ряда?
- Какой из следующих методов подходит для проверки наличия гетероскедастичности?
- Если временной ряд показывает явный тренд, что необходимо сделать перед его анализом?
- Установите соответствие между подходами и их применением в рекомендательных системах:
- Установите соответствие между типами данных и методами их обработки в рекомендательных системах:
- Установите соответствие между методами и их применением:
- Упорядочите этапы работы с метриками качества в рекомендательных системах:
- Какой метод отбора признаков используется в жадном подходе для постепенного добавления признаков?
- Какой алгоритм можно использовать для оценки важности признаков в ансамблях алгоритмов?
- Что происходит, если отобрать слишком много признаков в модели машинного обучения?
- Отбор признаков с использованием оценки корреляции признаков с целевой переменной называется …
- Упорядочите этапы применения метода Forward selection:
- Параметры, которые фиксируются перед обучением модели в контексте машинного обучения это ……
- Какую роль играют гиперпараметры в модели машинного обучения?
- Какая из следующих проблем не связана с подбором гиперпараметров?
- Какой фреймворк используется для поиска наилучших параметров с помощью случайного выбора в Python?
- Какую цель преследует использование фреймворков GridSearch и RandomSearch?
- Какой из фреймворков используется для оптимизации гиперпараметров с использованием байесовских методов?
- Установите соответствие между методами и их особенностями:
- Упорядочите этапы создания векторных представлений слов с использованием Word2Vec:
- Установите соответствие между методами представления слов и их особенностями:
- Какая из задач NLP является задачей перевода текста с одного языка на другой?
- Какой из методов используется для извлечения именованных сущностей из текста?
- Установите соответствие между задачами и методами их решения:
- Какой из следующих методов помогает бороться с переобучением?
- Какой из следующих факторов характеризует разброс (variance) модели?
- Что такое переобучение в контексте машинного обучения?
- Какой из следующих методов комбинирует L1 и L2-регуляризации?
- Какой из следующих методов является примером L1-регуляризации?
- В регуляризации Ridge добавляется штраф за …………. весов.
- Что такое мультиколлинеарность?
- Какой из следующих методов является примером L2-регуляризации?
- Ошибка обобщения модели определяется на …………. выборке.
- Кросс-валидация используется для оценки …………. модели.
- Регуляризация помогает контролировать …………. модели.
- Упорядочите методы регуляризации по их типам:
- Какой из следующих параметров в регуляризации Ridge отвечает за степень штрафа?
- Какой из следующих методов позволяет избежать коллинеарности признаков в линейной регрессии?
- В регуляризации Lasso добавляется штраф за………. весов.
- Установите соответствие между методами и их свойствами:
- L2-регуляризация также известна как ………….
- Мультиколлинеарность возникает, когда признаки образуют …………. комбинации.
- L1-регуляризация также известна как ………….