Анализ данных и искусственный интеллект


Результаты работы на тематической смене «Анализ данных и искусственный интеллект»

Смена была организованна и проведена ГАУДО КО «Региональный центр выявления, поддержки и развития способностей и талантов у детей и молодежи «Сириус. Кузбасс» совместно ООО «Агентство гуманитарных технологий «Политика Развития»  (г. Москва), при поддержке департамента образования и науки Кемеровской области. 

Смена проходила с 29 октября по 08 ноября 2019 года.

Основные результаты:

✅ 300 участников;

✅ 10 незабываемых дней;

✅ 30 уникальных проектов;

✅ бесценные навыки и компетенции студентов Дата Кампуса.

«Антикаракули». работали над созданием программы распознавания рукописного текста с такой же точностью, как это может делать человек. Участники выполнили сложную работу – использовали несколько разных моделей, выбрав в итоге ту, которая дает наибольшую точность в выполнении их задачи – распознавании рукописных символов русского алфавита. Подробнее на странице  

«Сортировка мусора» натренировала нейросеть различать изображения по шести классам, а т.к. изображений не хватало, ребятам пришлось постараться и походить по территории базы с фотоаппаратом, чтобы сделать сэмплы для своего датасета. Что характерно, задача оказалась непростой, потому что «Сибирская сказка» – очень чистое и ухоженное место. Найти мусор на ее территории оказалось не такой уж и простой задачей.

«Экономическая рокировочка» занимались предсказанием размера потребительской корзины россиянина на период до 2025 года. С помощью анализа баз данных участники составили прогноз на размер потребительской корзины россиянина. Решая таким образом проблему, участники сделали попытку заменить аналитиков на программу

«Добывающая промышленность» проанализировала инциденты в горнодобывающей промышленности и нашла зависимости статистики пострадавших от типа производства, возраста и других признаков.

«Пенсионеры России», в которой участники собрали свой датасет со статистикой по пенсионному возрасту для разных стран. Их модель способна предсказать, завышен или занижен возраст выхода на пенсию в той или иной стране с учетом ряда экономических и демографических признаков.

«SolarMoon» занимались анализом эффективности солнечных электростанций и предсказанием, при каких климатических и географических условиях этот вид генерации электроэнергии будет оптимальным.

30 групп получили результаты, демонстрирующие четкое понимание выбранной цели, знания методов анализа данных и машинного обучения. 

Примеры исследований:

Группа «Dream team 2.0» выбрала тему - «Борьба с коррупцией». Ребята исследуют годовой доход, возраст, принадлежность к политическим партиям, денежный эквивалент имущества депутатов Государственной Думы РФ. Участники ставят перед собой задачей выбрать один или несколько признаков и кластеризировать по ним депутатов.

Команда «Нефть» занималась прогнозированием стоимости нефти за баррель на будущий год. Изначально планировалось изучение нефтяных пятен, но в процессе участники перешли на расчёт цены. Результатом проекта стала программа, на которой в перспективе, при дальнейших модернизациях, можно будет зарабатывать.

Команда «Безработица» выбрали главной задачей изучение причин безработицы. Участники собрали данные по безработице, кредитам и пенсионерам на ближайшие 30 лет, после чего составили статистику с помощью машинного обучения.

Группа «Криминальное чтиво» на основе анализа данных об уровне жизни и количестве самых распространенных преступлений в регионах за прошедшие 6 лет – с 2013 по 2018 гг. предложила проверить гипотезу о том, что количество преступлений в регионах России зависит от уровня жизни. 

Команда «Пенсионеры» работала над вычислением оптимального пенсионного возраста за счет анализа данных других стран. Группа собрала базы данных по отдельным категориям – количество людей, ВВП на душу человека, среднемесячная зарплата, среднее количество детей, средний возраст, продолжительность жизни, процент пенсионеров, размер пенсии и пенсионный возраст. Изначально участники собрали все данные в одну таблицу с помощью pandas, но позже пришли к выводу, что у мужчин и женщин отличаются признаки пенсионного возраста, поэтому в итоге ребята получили две базы данных.

Группа «Антиспам» занималась решением актуальной проблемы современности – спам-рассылка. Команда создала программу, которая может выделять спам-сообщения от остального потока сообщений. Программа обучаема, она почти не ошибается в определении обычных сообщений и ошибается на 25-30% в опознавании спам-сообщений. 

Список всех проектов, разрабатываемых на Смене:

1.    Dream Team 2.0

2.    Jarvis 26

3.    Licensy-ja!

4.    Solar Moon

5.    Антикаракули

6.    Антиспам

7.    БД законов

8.    Бебибумерство

9.    Безработица

10. Биомасса-удобрения

11. Быстрый интернет

12. Добывающая промышленность

13. Загрязнение лесов

14. Инновационные мат-лы

15. Лесные пожары

16. Логистика

17. Медик-стат

18. Медик-стат2

19. Музыкальные паттерны

20. Нефть

21. Пенсионеры

22. Перенаселение Земли

23. Позитивная реклама

24. Проблема смертности в РФ

25. Пропажа людей

26. Сортировка мусора

27. Урбанистика

28. Цензура

29. Эконом.рокировочка

30. ЮИПФО