Ключевые навыки и достижения Разработка систем классификации и обработки изображений - Разработала end-to-end решение для детекции объектов и распознавания текста на изображениях с использованием YOLO (v8/ 11) и современных OCR-технологий (Tesseract, EasyOCR). - Построила модель Random Forest для мультиклассовой классификации с категориями: финансовые организации, кредитные продукты, рекламные объявления, спортивные события и промоакции. - Провела оптимизацию модели (fine-tuning), включая очистку датасета от избыточных классов и улучшение feature engineering для повышения точности. - Разработала ETL-процессы для обработки структурированных данных (CSV), включая нормализацию, фильтрацию шумов и обогащение данных ключевыми словами для более точной классификации.
Обработка и анализ видеоданных - Создала автоматизированный пайплайн для обработки видео с использованием OpenCV и FFmpeg: - Сегментация видео на кадры с интеллектуальным выбором ключевых фреймов (на основе резкости, композиции и содержания). - Анализ метаданных: проверка кодеков, разрешения, глубины цвета, наличия звука и других технических параметров. - Контроль качества: валидация размеров, битрейта и длительности для совместимости с downstream-обработкой.
Работа с облачными хранилищами и серверной инфраструктурой - Интеграция с **S3** для хранения и управления большими объемами медиаданных. - Настройка автоматизированной загрузки и обработки файлов в ML-воркфлоу.