Система кластеризации изображений
Описание
Система автоматической обработки и кластеризации изображений с использованием заранее подготовленных эмбеддингов. Система позволяет вручную корректировать кластеры, генерировать контактные отпечатки (коллажи) для визуализации, а также удалять кластеры с их последующей рекластеризацией.
Цели
Реализация алгоритмов для быстрой и точной кластеризации большого объёма эмбеддингов.
Задачи
- Автоматическая кластеризация: разработать и оптимизировать алгоритмы для быстрой и
точной кластеризации большого объёма эмбеддингов; - Ручная корректировка: обеспечить удобный интерфейс для экспертной ручной
корректировки и переопределения кластеров, если автоматическая кластеризация требует
доработки; - Контактные отпечатки: помимо графиков и стандартной визуализации кластеров, система
должна генерировать контактные отпечатки — наборы изображений, собранных на одной
картинке, представляющих изображения, наиболее близкие к центру каждого кластера; - Удаление контактного отпечатка: предусмотреть возможность удаления сгенерированного
контактного отпечатка через интерфейс, что будет сопровождаться удалением соответствующего
центроида кластера. После этого система должна выполнить рекластеризацию, исключающую
удалённый кластер; - Оценка стоимости решения: описать предполагаемые затраты на разработку, внедрение,
эксплуатацию, поддержку и масштабирование системы, включая оценку затрат на
инфраструктуру, лицензии, облачные сервисы и трудовые ресурсы; - Оптимизация и масштабируемость: гарантировать, что решение справляется с объёмом до
1 000 000 изображений без значительных задержек, а также интегрируется в существующую
экосистему.
Результат
- Разработан пользовательский интерфейс и система аутентификации;
- Автоматическая кластеризация: реализовано два алгоритма кластеризации для разбиения изображений на кластеры на основе их эмбеддингов;
- Генерация контактных отпечатков: формирование визуальных коллажей из изображений, близких к центру кластера;
- Ручная корректировка кластеров: возможность объединения, разделения и переименования кластеров через интерфейс;
- Удаление кластеров и рекластеризация: удаление кластера с соответствующим центроидом и выполнение перерасчета кластеров;
- API для интеграции: предоставление RESTful API для взаимодействия с другими системами и извлечения данных.
Этапы проекта
- 1.Исследовательский этап
- 2.Разработка прототипа
- 3.Разработка UI
- 4.Интеграция и оптимизация
- 5.Тестирование и отладка
- 6.Документация и презентация
Команда проекта
Дмитрий Анохин
Роль: Тех-лид
Никита Мухин
Роль: Backend-разработчик
Кирилл Щеглов
Роль: Backend-разработчик
Роман Акимов
Роль: Backend-разработчик
Данил Морозов
Роль: Frontend-разработчик
Алия Джалдасова
Роль: Системный аналитик
Анна Ионина
Роль: Дизайнер
Ян Дашевский
Роль: Специалист по ML
Раиль Сабиров
Роль: Специалист по ML
Илья Крошко
Роль: Тестировщик
Другие проекты направления
Информационный ресурс "Память поколений: ТУСУР"
«Память поколений: ТУСУР» - это интерактивный сайт, посвящённый ветеранам Великой Отечественной войны — сотрудникам и студентам ТУСУРа. Его цель - сохранить и передать память об их подвигах через личные истории, архивные материалы и мультимедийные элементы.
Проект портала «Клуб по интересам»
Сервис, который позволяет пользователям формировать и вступать в клубы по интересам.
Генератор HTML страниц
Разработка «редактора», позволяющего пользователю создавать кастомизированную страницу в большинстве популярных веб-браузеров.