Антикаракули


Антикаракули.jpg

Проект «Система распознавания рукописных кириллических символов» – результат тематической смены «Анализ данных и искусственный интеллект». Смена была организована и проведена ГАУДО КО «Региональный центр выявления, поддержки и развития способностей и талантов у детей и молодежи «Сириус.Кузбасс» совместно ООО «Агентство гуманитарных технологий «Политика Развития» (г. Москва), при поддержке департамента образования и науки Кемеровской области. 

Работа над проектом продолжается.

Авторы проектаПеченев Данила, ученик 10 класса МАОУ «СОШ № 14» г. Кемерово; Федоров Степан, ученик 10 класса МАОУ «СОШ № 14» г. Кемерово.

Периодически у людей возникает необходимость перевода, написанного на бумажном носителе текста в оцифрованный вид. В настоящее время не существует эффективных открытых сервисов, способных корректно решить эту задачу. 

Проект «Распознавание рукописных кириллических символов» предполагает реализацию первого глобального этапа работы по созданию приложения, идентифицирующего рукописный кириллический текст - создание модели машинного обучения, распознающей рукописные кириллические символы. 

Проект посвящен созданию модели (нейронной сети), распознающей рукописные кириллические символы, а также приложения для её удобного и быстрого тестирования. Развитие проекта предполагает разработку сервиса, идентифицирующего слова и текст в целом. 

Для обучения нейронной сети авторами создан датасет, включающий в себя более 474 тысяч изображений букв кириллицы.

Оценка качества модели производилась с помощью метрик “точность” и “матрица несоответствия”. На их основе происходил подбор лучших параметров аугментации данных, архитектуры нейросети и её оптимизатора.

Авторами создано приложение для быстрого и удобного тестирования и использования модели (с точностью 94.7 %, позволяющая распознавать буквы русского алфавита: строчные, заглавные, рукописные и печатные). Были добавлены функции автокоррекции и считывания букв, слов и выражений с отсканированного клеточного листа бумаги.

Цель создания: создать модель машинного обучения, распознающую рукописные кириллические буквы с точностью более 90%.

                                            

Результаты проекта:

  • Датасет, содержащий 474536 изображений кириллических букв;
  • Нейросеть, распознающую рукописные буквы кириллицы с точностью 94.74 %;
  • Приложение для удобного тестирования модели с функцией написания букв и слов по буквам, считывания букв и слов с изображения, а также автокоррекцией для повышения точности.

Перспективы.

В настоящее время ведется работа над вторым глобальным этапом - создание системы, способной идентифицировать целые слова.

Проект – результат тематической смены:

 «Анализ данных и искусственный интеллект», с 29 октября по 08 ноября 2019 года.

Необходимые компетенции для создания данного продукта можно получить, обучившись по программам:

Записаться на дистанционный курсы

Записаться на очные курсы 

                       

Еще больше видеолекций, видеоуроков и других видеоматериалов на нашем канале YouTube  

ГАЛЕРЕЯ проектных работ участников смен Центра