Назад
Проект завершён

Система кластеризации изображений

Направление: ИТ-Академия

Описание

Система автоматической обработки и кластеризации изображений с использованием заранее подготовленных эмбеддингов. Система позволяет вручную корректировать кластеры, генерировать контактные отпечатки (коллажи) для визуализации, а также удалять кластеры с их последующей рекластеризацией.

Цели

Реализация алгоритмов для быстрой и точной кластеризации большого объёма эмбеддингов.

Задачи

  • Автоматическая кластеризация: разработать и оптимизировать алгоритмы для быстрой и
    точной кластеризации большого объёма эмбеддингов;
  • Ручная корректировка: обеспечить удобный интерфейс для экспертной ручной
    корректировки и переопределения кластеров, если автоматическая кластеризация требует
    доработки;
  • Контактные отпечатки: помимо графиков и стандартной визуализации кластеров, система
    должна генерировать контактные отпечатки — наборы изображений, собранных на одной
    картинке, представляющих изображения, наиболее близкие к центру каждого кластера;
  • Удаление контактного отпечатка: предусмотреть возможность удаления сгенерированного
    контактного отпечатка через интерфейс, что будет сопровождаться удалением соответствующего
    центроида кластера. После этого система должна выполнить рекластеризацию, исключающую
    удалённый кластер;
  • Оценка стоимости решения: описать предполагаемые затраты на разработку, внедрение,
    эксплуатацию, поддержку и масштабирование системы, включая оценку затрат на
    инфраструктуру, лицензии, облачные сервисы и трудовые ресурсы;
  • Оптимизация и масштабируемость: гарантировать, что решение справляется с объёмом до
    1 000 000 изображений без значительных задержек, а также интегрируется в существующую
    экосистему.

Результат

  • Разработан пользовательский интерфейс и система аутентификации;
  • Автоматическая кластеризация: реализовано два алгоритма кластеризации для разбиения изображений на кластеры на основе их эмбеддингов;
  • Генерация контактных отпечатков: формирование визуальных коллажей из изображений, близких к центру кластера;
  • Ручная корректировка кластеров: возможность объединения, разделения и переименования кластеров через интерфейс;
  • Удаление кластеров и рекластеризация: удаление кластера с соответствующим центроидом и выполнение перерасчета кластеров;
  • API для интеграции: предоставление RESTful API для взаимодействия с другими системами и извлечения данных. 

Этапы проекта

  • 1.
    Исследовательский этап
  • 2.
    Разработка прототипа
  • 3.
    Разработка UI
  • 4.
    Интеграция и оптимизация
  • 5.
    Тестирование и отладка
  • 6.
    Документация и презентация

Команда проекта

Дмитрий Анохин
Роль: Тех-лид

Никита Мухин
Роль: Backend-разработчик

Кирилл Щеглов
Роль: Backend-разработчик

Роман Акимов
Роль: Backend-разработчик

Данил Морозов
Роль: Frontend-разработчик

Алия Джалдасова
Роль: Системный аналитик

Анна Ионина
Роль: Дизайнер

Ян Дашевский
Роль: Специалист по ML

Раиль Сабиров
Роль: Специалист по ML

Илья Крошко
Роль: Тестировщик

Другие проекты направления

ИТ-Академия
Проект завершён

Информационный ресурс "Память поколений: ТУСУР"

«Память поколений: ТУСУР» - это интерактивный сайт, посвящённый ветеранам Великой Отечественной войны — сотрудникам и студентам ТУСУРа. Его цель - сохранить и передать память об их подвигах через личные истории, архивные материалы и мультимедийные элементы.

Направление:
Цифровая академия
Тип проекта:
Учебный
ООО «Газпром трансгаз Томск»
Проект завершён

Генератор HTML страниц

Разработка «редактора», позволяющего пользователю создавать кастомизированную страницу в большинстве популярных веб-браузеров.

EdTech
Веб-разработка
Направление:
Цифровая академия
Тип проекта:
Стажировка