• анализ больших объемов данных;
• визуализация результатов;
• умение читать мануал.
- (Ананьев) На основании данных сайта finam.ru построить графики курсов доллара и евро и их производных за 2009—2011 годы.
- (Вернигорова) Визуализация детализации разговоров по мобильному телефону: на основании детальных данных за определённый период (скажем, от 10 до 30 дней — сколько не жалко) построить диаграмму (или несколько), из которых была бы видна структура расходов.
- (Есжанов) Найти всех друзей друзей ВКонтакте, результат представить в виде плоского графа. (Дублирование узлов недопустимо)
- (Кириллова) Вычисление среднего возраста друзей ВКонтакте, результат представить в виде диаграммы по годам.
- (Лисовой) На основании данных Википедии построить диаграмму: население столиц мира в проценте от населения соответствующих стран.
- (Морозова) На основании данных регистра министерства культуры РФ построить диаграмму суммарной длительности зарегистрированных художественных фильмов по годам за 1925—2005 годы.
- (Семукова) Обработать 10 000 случайных запросов в Яндексе и выбрать Top10 (TopN) слов.
- (Стрюк) Используя библиотеку pymorphy, исследовать словарный запас Пушкина/Толстого/Достоевского).
- (Степанович) Проанализировать количество новостных записей, появившихся на ленте.ру в каждый из дней 2010 года и нарисовать соответстующую диаграмму. Выделить самый богатый на события день.
Разумеется, я оставляю за собой право задавать дополнительные вопросы: скорее всего, я попрошу вас немного изменить код где-нибудь и объяснить полученный результат.
Результат должен быть представлен в виде красивого PDF-файла, который в конце семестра нужно будет приложить к отчёту по практике. За выполнение одного задания (из двух) в срок ставится оценка хорошо.
Вопросы можно задать комментарием к этой записи или по электропочте.
Комментариев нет:
Отправить комментарий