Скачать тест — (Введение в анализ больших данных.ои(dor_БАК)_8a092d26.pdf)
- Variety в контексте характеристик Big Data означает …
- Неверно, что Big Data – это …
- Отказоустойчивость Big Data имеет место, когда …
- В числе примеров структурированных данных – … (укажите 2 варианта ответа)
- Название технологии, которая имитирует человеческое поведение, – искусственный …
- Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной задачи без непосредственного участия человека, – это …
- Совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки, – это …
- Целое четырехзначное число, отражающее количество петабайт в зеттабайте, – …
- Установите соответствие целей инфраструктуры Hadoop и их характеристик:
- Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах:
- Аналитическим отделом компании был получен спам по e-mail с приложенным файлом: Что следует предпринять?
- Реляционные базы данных организованы в виде …
- SQL – это …
- Hadoop – это проект …
- В числе систем управления базами данных (СУБД), которые полностью полагаются на оперативную память при хранении информации, – … (укажите 2 варианта ответа)
- Английское название фреймворка для вычисления наборов распределенных задач с использованием большого количества компьютеров, образующих кластер, – …
- Сокращенное английское название языка структурированных запросов – …
- Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение»)
- Сокращенное английское название семейства нереляционных баз данных – …
- Установите соответствие баз данных и их характеристик:
- Установите правильный порядок действий при проектировании баз данных:
- Рассматривается несколько технологий систем управления базами данных (СУБД). Это технологии Hadoop, Cassandra, HDInsight и Redis. Какая из данных технологий не использует принцип MapReduce?
- Неверно, что существует такой вид искусственных нейронных сетей, как …
- Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой
- В изучении нейронных сетей и машинного обучения часто упоминают закон Мура, согласно которому …
- Градиентом в искусственных нейронных сетях называют …
- Минимальное количество слоев, которые должна иметь нейронная сеть, для того чтобы к ней возможно было применить алгоритм обратного распространения, – …
- Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно-коммуникационных технологий – это …
- Область исследования, включающая создание компьютерных алгоритмов для преобразования данных в обоснованные действия, – это … обучение
- Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
- Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:
- Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
- Вам необходимо принять решение о выдаче кредита клиенту. Какой метод машинного обучения вам в этом поможет?
- Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние …
- Процедура снижения признакового пространства …
- Возможность снижения размерности признакового пространства обусловлена … (укажите 3 варианта ответа)
- Элементы матрицы факторных нагрузок меняются в пределах …
- Если в результате расчетов получены значения двух первых главных компонент λ1=1,928 и λ2=0,072, тогда относительный вклад первой главной компоненты в суммарную дисперсию (с точностью до 0,1) равен … %
- Если был проведен компонентный анализ по шести переменным и суммы квадратов факторных нагрузок для трех главных компонент равны 3,5, 1,3 и 0,3 соответственно, тогда относительный вклад первых двух компонент в общую дисперсию составляет … %
- Если выборочные данные о потреблении и накоплении пяти домохозяйств представлены матрицей «объект – свойство» (см. ниже), то, считая, что различия в потреблении в 4 раза важнее различий в накоплении, а сумма весовых коэффициентов равна 1, взвешенное евклидово расстояние между домохозяйствами № 1 и № 2 с точностью до 0,01 будет равно …
- Расстояние Манхэттен между векторами (-6, 3, -2) и (-1, 3, -3) равно …
- Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
- Установите соответствие между метриками расстояния между объектами и формулами расчета:
- Вашей компании необходимо проанализировать продуктовые наборы для их своевременной закупки и совместного размещения в торговом зале. Какой метод Data Mining вы будете использовать?
- Функция … реализует алгоритм классификации в языке программирования R
- Функция … реализует алгоритм кластеризации в языке программирования R
- Библиотека … является базовой для Data Science на языке программирования Python
- В языке программирования R ошибочными являются такие варианты присвоения, как … (укажите 2 варианта ответа)
- Язык программирования, который объединяет объектно-ориентированный и функциональный подходы и используется в Apache Spark, – это язык …
- Способность языка программирования распознавать типы переменных – это …
- Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях
- Язык программирования R является потомком языка …
- Установите соответствие между аргументами функции leaflet() и их содержанием:
- Укажите правильную последовательность этапов анализа данных в языке программирования R:
- Вам необходимо выполнить интерактивную визуализацию данных. Какой из языков программирования содержит больше библиотек и фреймворков для интерактивной визуализации и лучше подойдет для выполнения этой задачи?
- Velocity в контексте характеристик Big Data означает …
- Неверно, что Variety в контексте характеристик Big Data означает … (укажите 3 варианта ответа)
- Данные являются структурированными в … (укажите 2 варианта ответа)
- Первые большие наборы данных начали использовать …
- Минимальная единица измерения информации – это …
- Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …
- … – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий
- Целое четырехзначное число, отражающее количество зеттабайт в йоттабайте, – …
- Установите соответствие между понятием и его содержанием:
- Установите соответствие целей инфраструктуры Hadoop и их характеристик:
- Причина создания баз данных NoSQL – …
- Неверно, что MapReduce …
- В реляционной модели представленные данные для пользователя передаются в виде …
- SQL – это …
- … – это группа файлов стандартной структуры, служащих для хранения данных и организованных таким образом, чтобы обеспечить легкий доступ к ним, эффективное управление и обновление
- Метод, используемый для предотвращения дублирования данных в реляционных базах данных, – …
- Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …
- Сокращенное английское название семейства нереляционных баз данных – …
- Установите соответствие этапов MapReduce и их содержания:
- Установите правильный порядок действий при проектировании баз данных (БД):
- Установите соответствие баз данных и их характеристик:
- Краудсорсинг – это …
- Консолидация – это …
- Интеграция – это …
- Машинное обучение – это …
- Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …
- Простейший вид нейронной сети, который представляет собой алгоритм для выполнения двоичной классификации, – это …
- Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
- Вектор частных производных функции потерь по весам нейронной сети, который указывает на направление наибольшего роста этой функции, – это …
- Установите соответствие видов искусственных нейронных сетей и их характеристик:
- Определите правильную последовательность этапов распределенных вычислений MapReduce:
- Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:
- Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
- Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)
- … является шириной коробки в диаграмме «ящик с усами»
- Data Mining – это процесс обнаружения в сырых данных … (укажите 3 варианта ответа)
- Деревья классификации относятся к стратегии …
- Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …
- Группа элементов, обладающих каким-то общим свойством и находящихся на небольшом расстоянии другу от друга, – это …
- В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …
- Если все значения признака увеличить в 16 раз, дисперсия увеличится в … раз
- Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:
- Установите соответствие между описательными статистиками и их определением:
- Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
- Установите соответствие между метриками расстояния между объектами и формулами расчета:
- Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)
- В языке программирования R используются такие типы данных, как … (укажите 5 вариантов ответа)
- Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)
- Разветвляющийся алгоритм – это …
- Нажатие клавиши «…» предложит возможные варианты продолжения текста кода, включая выбор параметров и переменных в аргументах набираемых команд
- Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания «
- В языке программирования R тип данных «строка» – это …
- Язык программирования R является потомком языка …
- Укажите правильную последовательность этапов анализа данных в языке программирования R:
- Установите соответствие между пакетами языка программирования R и их назначением:
- Установите соответствие между аргументами функции leaflet() и их содержанием:
- В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?
- Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству?
- Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop.
- Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать?
- Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет?
- Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет?
- Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать?
- Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать?
- Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать?
- Выполнены следующие строки кода в программной среде RStudio: vec <- c(3,5,2,1,8,4,9,10,3,15,1,11) vec[2]