Результаты работы на тематической смене «Анализ данных и искусственный интеллект»
Смена была организованна и проведена ГАУДО КО «Региональный центр выявления, поддержки и развития способностей и талантов у детей и молодежи «Сириус. Кузбасс» совместно ООО «Агентство гуманитарных технологий «Политика Развития» (г. Москва), при поддержке департамента образования и науки Кемеровской области.
Смена проходила с 29 октября по 08 ноября 2019 года.
Основные результаты:
✅ 300 участников;
✅ 10 незабываемых дней;
✅ 30 уникальных проектов;
✅ бесценные навыки и компетенции студентов Дата Кампуса.
«Антикаракули». работали над созданием программы распознавания рукописного текста с такой же точностью, как это может делать человек. Участники выполнили сложную работу – использовали несколько разных моделей, выбрав в итоге ту, которая дает наибольшую точность в выполнении их задачи – распознавании рукописных символов русского алфавита. Подробнее на странице
«Сортировка мусора» натренировала нейросеть различать изображения по шести классам, а т.к. изображений не хватало, ребятам пришлось постараться и походить по территории базы с фотоаппаратом, чтобы сделать сэмплы для своего датасета. Что характерно, задача оказалась непростой, потому что «Сибирская сказка» – очень чистое и ухоженное место. Найти мусор на ее территории оказалось не такой уж и простой задачей.
«Экономическая рокировочка» занимались предсказанием размера потребительской корзины россиянина на период до 2025 года. С помощью анализа баз данных участники составили прогноз на размер потребительской корзины россиянина. Решая таким образом проблему, участники сделали попытку заменить аналитиков на программу
«Добывающая промышленность» проанализировала инциденты в горнодобывающей промышленности и нашла зависимости статистики пострадавших от типа производства, возраста и других признаков.
«Пенсионеры России», в которой участники собрали свой датасет со статистикой по пенсионному возрасту для разных стран. Их модель способна предсказать, завышен или занижен возраст выхода на пенсию в той или иной стране с учетом ряда экономических и демографических признаков.
«SolarMoon» занимались анализом эффективности солнечных электростанций и предсказанием, при каких климатических и географических условиях этот вид генерации электроэнергии будет оптимальным.
30 групп получили результаты, демонстрирующие четкое понимание выбранной цели, знания методов анализа данных и машинного обучения.
Примеры исследований:
Группа «Dream team 2.0» выбрала тему - «Борьба с коррупцией». Ребята исследуют годовой доход, возраст, принадлежность к политическим партиям, денежный эквивалент имущества депутатов Государственной Думы РФ. Участники ставят перед собой задачей выбрать один или несколько признаков и кластеризировать по ним депутатов.
Команда «Нефть» занималась прогнозированием стоимости нефти за баррель на будущий год. Изначально планировалось изучение нефтяных пятен, но в процессе участники перешли на расчёт цены. Результатом проекта стала программа, на которой в перспективе, при дальнейших модернизациях, можно будет зарабатывать.
Команда «Безработица» выбрали главной задачей изучение причин безработицы. Участники собрали данные по безработице, кредитам и пенсионерам на ближайшие 30 лет, после чего составили статистику с помощью машинного обучения.
Группа «Криминальное чтиво» на основе анализа данных об уровне жизни и количестве самых распространенных преступлений в регионах за прошедшие 6 лет – с 2013 по 2018 гг. предложила проверить гипотезу о том, что количество преступлений в регионах России зависит от уровня жизни.
Команда «Пенсионеры» работала над вычислением оптимального пенсионного возраста за счет анализа данных других стран. Группа собрала базы данных по отдельным категориям – количество людей, ВВП на душу человека, среднемесячная зарплата, среднее количество детей, средний возраст, продолжительность жизни, процент пенсионеров, размер пенсии и пенсионный возраст. Изначально участники собрали все данные в одну таблицу с помощью pandas, но позже пришли к выводу, что у мужчин и женщин отличаются признаки пенсионного возраста, поэтому в итоге ребята получили две базы данных.
Группа «Антиспам» занималась решением актуальной проблемы современности – спам-рассылка. Команда создала программу, которая может выделять спам-сообщения от остального потока сообщений. Программа обучаема, она почти не ошибается в определении обычных сообщений и ошибается на 25-30% в опознавании спам-сообщений.
Список всех проектов, разрабатываемых на Смене:
1. Dream Team 2.0
2. Jarvis 26
3. Licensy-ja!
4. Solar Moon
5. Антикаракули
6. Антиспам
7. БД законов
8. Бебибумерство
9. Безработица
10. Биомасса-удобрения
11. Быстрый интернет
12. Добывающая промышленность
13. Загрязнение лесов
14. Инновационные мат-лы
15. Лесные пожары
16. Логистика
17. Медик-стат
18. Медик-стат2
19. Музыкальные паттерны
20. Нефть
21. Пенсионеры
22. Перенаселение Земли
23. Позитивная реклама
24. Проблема смертности в РФ
25. Пропажа людей
26. Сортировка мусора
27. Урбанистика
28. Цензура
29. Эконом.рокировочка
30. ЮИПФО