Проект «Система распознавания рукописных кириллических символов» – результат тематической смены «Анализ данных и искусственный интеллект». Смена была организована и проведена ГАУДО КО «Региональный центр выявления, поддержки и развития способностей и талантов у детей и молодежи «Сириус.Кузбасс» совместно ООО «Агентство гуманитарных технологий «Политика Развития» (г. Москва), при поддержке департамента образования и науки Кемеровской области.
Работа над проектом продолжается.
Авторы проекта: Печенев Данила, ученик 10 класса МАОУ «СОШ № 14» г. Кемерово; Федоров Степан, ученик 10 класса МАОУ «СОШ № 14» г. Кемерово.
Периодически у людей возникает необходимость перевода, написанного на бумажном носителе текста в оцифрованный вид. В настоящее время не существует эффективных открытых сервисов, способных корректно решить эту задачу.
Проект «Распознавание рукописных кириллических символов» предполагает реализацию первого глобального этапа работы по созданию приложения, идентифицирующего рукописный кириллический текст - создание модели машинного обучения, распознающей рукописные кириллические символы.
Проект посвящен созданию модели (нейронной сети), распознающей рукописные кириллические символы, а также приложения для её удобного и быстрого тестирования. Развитие проекта предполагает разработку сервиса, идентифицирующего слова и текст в целом.
Для обучения нейронной сети авторами создан датасет, включающий в себя более 474 тысяч изображений букв кириллицы.
Оценка качества модели производилась с помощью метрик “точность” и “матрица несоответствия”. На их основе происходил подбор лучших параметров аугментации данных, архитектуры нейросети и её оптимизатора.
Авторами создано приложение для быстрого и удобного тестирования и использования модели (с точностью 94.7 %, позволяющая распознавать буквы русского алфавита: строчные, заглавные, рукописные и печатные). Были добавлены функции автокоррекции и считывания букв, слов и выражений с отсканированного клеточного листа бумаги.
Цель создания: создать модель машинного обучения, распознающую рукописные кириллические буквы с точностью более 90%.
Результаты проекта:
Перспективы.
В настоящее время ведется работа над вторым глобальным этапом - создание системы, способной идентифицировать целые слова.
Проект – результат тематической смены:
«Анализ данных и искусственный интеллект», с 29 октября по 08 ноября 2019 года.
Необходимые компетенции для создания данного продукта можно получить, обучившись по программам:
Записаться на дистанционный курсы
Еще больше видеолекций, видеоуроков и других видеоматериалов на нашем канале YouTube
ГАЛЕРЕЯ проектных работ участников смен Центра