Skip to content

b1t0nese/MacLearn

Repository files navigation

MacLearn

PythonPyQt6License DownloadsДокументация

Программа, которая за считанные минуты соберёт для вас качественный датасет из тысяч изображений, скачанных из интернета.

⭐ Если MacLearn оказался для вас полезным — поставьте звезду на GitHub.


🖼️ Скриншоты

Настройка проекта

Настройка проекта

Работа с датасетом

Работа с датасетом

Автоматический сбор

Автодатасет

Интерфейс программы в действии — всё нужное под рукой


❓ Почему MacLearn?

Проблема Решение MacLearn
Сбор изображений вручную занимает недели Автоматический парсинг за пару часов
Разметка тысяч файлов — это боль Автоаннотация по примерам
Аугментацию нужно делать отдельно Встроенная генерация +4 вариаций
Форматы постоянно меняются Экспорт в один клик (YOLO, CSV и др.)

🚀 О проекте

MacLearn — это программа для автоматического сбора и подготовки качественных датасетов из изображений, скачанных из интернета. Система создана для разработчиков ML-моделей, исследователей и всех, кто работает с компьютерным зрением.

Скачать программу | Скачать Chrome (нужен для работы программы)

Важно! Используйте последнюю версию Chrome! (если браузер не появился в программе, возможно дело в старой версии браузера или в его отсутствии). Временное решение: запустить программу с атрибутом --chrome-version 1xx

📋 Полная документация

🧑‍💻 Разработчик: b1t0ne (Минибаев Артём)

⚡ Быстрый старт за 1 минуту

  1. Скачайте программу со страницы релизов
  2. Запустите MacLearn.exe
  3. Выберите папку для нового проекта
  4. Добавьте классы (например: "кошка", "собака")
  5. В классах добавьте поисковые запросы (можно добавить изображения примеры)
  6. Перейдите во вкладку "Автодатасет" и нажмите "Запуск"

Готово! Через 1-2 часа у вас будет датасет на 5000+ изображений


Сравнение с аналогами

Критерий MacLearn Ручные инструменты (LabelImg, CVAT, Roboflow) Выигрыш
Сбор изображений 🚀 Автоматический
• По текстовым запросам
• По фото-примерам
• Параллельная загрузка
🔧 Ручной
• Поиск вручную
• Скачивание по одному
• Копирование файлов
10-100× быстрее
Разметка (аннотация) 🤖 Автоматическая/полуавтоматическая
• Автоматические bounding boxes
• Трансфер разметки с примеров
✍️ Полностью ручная
• Рисование рамок мышкой
• Ввод координат вручную
• Каждое изображение отдельно
5-50× быстрее
Экспорт форматов 📦 One-click экспорт
• YOLO, COCO, Pascal VOC, CSV
• Кастом форматы
🧩 Конвертация скриптами
• Отдельные утилиты
• Потеря данных при конвертации
• Ручное редактирование JSON
Без потерь, мгновенно
Настройка под задачу 🎛️ Гибкий конструктор
• UI с параметрами
• Сохранение пресетов
• Предпросмотр изменений
📝 Редактирование конфигов
• Правка JSON/YAML файлов
• Требует знаний формата
• Ошибки синтаксиса
Визуально и безопасно
Качество данных 🔍 Автоматический контроль
• Поиск дубликатов
• Проверка на артефакты
• Балансировка классов
👁️ Визуальная проверка
• Прокрутка папок глазами
• Пропуск ошибок
• Несбалансированные классы
Системный подход
Интерфейс 🖥️ Единая среда
• Все этапы в одном окне
• Вкладки и рабочие области
• Drag & Drop
🧩 Разрозненные инструменты
• Браузер → редактор → конвертер
• Потеря контекста
• Копирование путей
Целостный рабочая среда

Возможности программы

🚀 Быстрый сбор данных

  • Сбор тысяч изображений за считанные часы
  • Создание полного датасета на 5000+ изображений в течение 1 дня
  • Автоматическая загрузка и обработка изображений

🎯 Качественная разметка

  • Чёткая структуризация данных по классам
  • Создание аннотации изображений
  • Поддержка сложных запросов с множеством вариаций
  • Гибкая система категоризации

🤖 Автоматическая аугментация

  • Генерация +4 вариаций для каждого исходного изображения
  • Разнообразие данных для улучшения обучения моделей

⚙️ Гибкие настройки обработки

  • Возможность получения исходных изображений без обработки
  • Контроль качества и разрешения

🖥️ Удобный интерфейс для управления датасетом

  • Подготовка данных для датасета
  • Создание и обработка данных с визуализацией
  • Возможность ручной доработки датасетов

📜 Лицензия

Проект защищён лицензией GPL-3.0 license — вы можете свободно использовать, модифицировать и распространять программу с сохранением авторских прав.

About

Программа, которая за считанные минуты соберёт для вас качественный датасет из тысяч изображений автоматически.

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors