Система кластеризации изображений
Описание
Система автоматической обработки и кластеризации изображений с использованием заранее подготовленных эмбеддингов. Система позволяет вручную корректировать кластеры, генерировать контактные отпечатки (коллажи) для визуализации, а также удалять кластеры с их последующей рекластеризацией.
Цели
Реализация алгоритмов для быстрой и точной кластеризации большого объёма эмбеддингов.
Задачи
- Автоматическая кластеризация: разработать и оптимизировать алгоритмы для быстрой и
точной кластеризации большого объёма эмбеддингов; - Ручная корректировка: обеспечить удобный интерфейс для экспертной ручной
корректировки и переопределения кластеров, если автоматическая кластеризация требует
доработки; - Контактные отпечатки: помимо графиков и стандартной визуализации кластеров, система
должна генерировать контактные отпечатки — наборы изображений, собранных на одной
картинке, представляющих изображения, наиболее близкие к центру каждого кластера; - Удаление контактного отпечатка: предусмотреть возможность удаления сгенерированного
контактного отпечатка через интерфейс, что будет сопровождаться удалением соответствующего
центроида кластера. После этого система должна выполнить рекластеризацию, исключающую
удалённый кластер; - Оценка стоимости решения: описать предполагаемые затраты на разработку, внедрение,
эксплуатацию, поддержку и масштабирование системы, включая оценку затрат на
инфраструктуру, лицензии, облачные сервисы и трудовые ресурсы; - Оптимизация и масштабируемость: гарантировать, что решение справляется с объёмом до
1 000 000 изображений без значительных задержек, а также интегрируется в существующую
экосистему.
Результат
- Разработан пользовательский интерфейс и система аутентификации;
- Автоматическая кластеризация: реализовано два алгоритма кластеризации для разбиения изображений на кластеры на основе их эмбеддингов;
- Генерация контактных отпечатков: формирование визуальных коллажей из изображений, близких к центру кластера;
- Ручная корректировка кластеров: возможность объединения, разделения и переименования кластеров через интерфейс;
- Удаление кластеров и рекластеризация: удаление кластера с соответствующим центроидом и выполнение перерасчета кластеров;
- API для интеграции: предоставление RESTful API для взаимодействия с другими системами и извлечения данных.
Этапы проекта
- 1.Исследовательский этап
- 2.Разработка прототипа
- 3.Разработка UI
- 4.Интеграция и оптимизация
- 5.Тестирование и отладка
- 6.Документация и презентация
Команда проекта
Дмитрий Анохин
Роль: Тех-лид
Никита Мухин
Роль: Backend-разработчик
Кирилл Щеглов
Роль: Backend-разработчик
Роман Акимов
Роль: Backend-разработчик
Данил Морозов
Роль: Frontend-разработчик
Алия Джалдасова
Роль: Системный аналитик
Анна Ионина
Роль: Дизайнер
Ян Дашевский
Роль: Специалист по ML
Раиль Сабиров
Роль: Специалист по ML
Илья Крошко
Роль: Тестировщик
Роли на проекте
Другие проекты направления
Тестовый (2 #nope)
hi Lorem ipsum dolor sit amet consectetur adipisicing elit. Vitae dolore assumenda et veritatis architecto, adipisci perspiciatis maiores excepturi ea impedit rerum expedita atque quos? Esse tenetur libero quisquam ut adipisci.
Информационный ресурс "Память поколений: ТУСУР"
«Память поколений: ТУСУР» - это интерактивный сайт, посвящённый ветеранам Великой Отечественной войны — сотрудникам и студентам ТУСУРа. Его цель - сохранить и передать память об их подвигах через личные истории, архивные материалы и мультимедийные элементы.
Проект портала «Клуб по интересам»
Сервис, который позволяет пользователям формировать и вступать в клубы по интересам.