Меню

Проект

Локално Windows приложение за AI музикална продукция

Описание на проекта

Изграждам локално Windows desktop приложение за вътрешна употреба, което автоматизира производството на AI-генерирана фонова музика за търговски пространства (кафенета, ресторанти, хотели, спа, уелнес).

❌ НЕ е consumer app
❌ НЕ е SaaS
❌ НЕ е стрийминг платформа

✅ Това е producer tool – инструмент за производство на готови аудио тракове за комерсиална употреба.

Цел (MVP)

Целта е проста, но професионална:

Избирам preset / конфигурация → натискам “Generate” → получавам напълно готови тракове (WAV + MP3)
с коректна дължина, loudness, структура и пълна проследимост (логове).

Приложението трябва да ми дава пълен контрол чрез конфигурационни файлове (preset „скриптове“)
без нужда от промяна на кода.

Таргет среда (важно)
  • ОС: Windows 11 Pro

  • CPU: AMD Ryzen 7 7700

  • RAM: 32 GB

  • GPU: AMD integrated (AI генерацията е CPU-only)

  • Режим на генерация (MVP): PyTorch CPU build

Интернет:

  • допустим при първоначална инсталация / първо пускане (напр. за model weights)

  • след това: пълна офлайн работа

(Налична е AMD Radeon RX 6700 XT, но се използва само за дисплей, не за AI)

✅ Основни функционални изисквания (MVP)0️⃣ Phase 2 – архитектурно предвидено (НЕ част от MVP deliverables)

Приложението трябва да бъде проектирано така, че да позволява future “curated workflow” без пренаписване на core pipeline-а, а именно:

  • Candidate generation: генериране на къси кандидат-тракове (2–3 мин, configurable) за прослушване

  • Human gate: PASS / REJECT – само PASS участва във финално сглобяване

  • Parallelism: докато потребителят слуша/одобрява, генерацията може да продължава във фонов режим
    (non-blocking UI + queues)

     Реализацията може да е извън MVP, но архитектурата трябва да го позволява без major refactor.

- Continuous / unattended operation:

  Приложението трябва да поддържа продължителна работа (24/7),

  при която AI генерацията може да работи непрекъснато във фонов режим,

  докато потребителят паралелно:

  - слуша вече генерирани тракове

  - одобрява/отхвърля сегменти

  - извършва рязане и сглобяване на финални тракове,

  без тези действия да блокират или спират генерацията.


1️⃣ Desktop UI (Windows приложение)

Прост, стабилен, non-blocking интерфейс

Inputs:

  • Избор на Preset / Канал (напр. Cafe / Restaurant / Hotel / Spa)

  • Крайна дължина: 10 / 20 / 30 минути

  • Брой тракове: 1–50

  • Ниво на вариация: Low / Medium / High

  • Избор на output папка

UX изисквания:

  • UI остава responsive по време на генерация

  • Job queue

  • Progress bar

  • ETA (ориентировъчно)

  • Статуси: Waiting / Running / Paused / Done / Failed

2️⃣ Preset система = “Скриптове” чрез конфиг (ЗАДЪЛЖИТЕЛНО)

Приложението ТРЯБВА да използва presets.yaml или presets.json, които действат като
скриптове/шаблони за музикална продукция.

Изисквания:

  • четим и редактируем файл

  • без промяна на кода

  • приложението просто чете и изпълнява конфигурацията

Всеки preset съдържа минимум:

  • preset_name

  • preset_version (v1, v1.1 и т.н.)

  • prompt_template

  • negative_prompt (optional)

  • default generation parameters (temperature, top-k/top-p, cfg и др.)

  • default segment length (30–60s)

  • seed strategy: fixed / random / predefined list (optional)

  • допълнителни тагове (mood, tempo, energy – като метаданни)

UI функции:

  • бутон “Reload presets”
    или

  • “Open presets file” + Reload

➡️ Това ми позволява да добавям профили, версии и да експериментирам без developer намеса.

3️⃣ AI генериране на музика
  • MusicGen (Audiocraft) или еквивалентен open-source модел

  • Генериране на 30–60 сек сегменти

  • CPU-only execution

Детерминизъм и traceability:

  • seed се запазва

  • всички параметри се логват

  • при същия preset + seed → сравним резултат

Model weights:

  • автоматично изтегляне при първо пускане
    или

  • bundle-ване (ако е възможно)

  • след това: пълна офлайн работа

4️⃣ Автоматичен аудио pipeline

За всеки финален трак:

  • Генериране на N сегмента

  • Stitch в дълъг трак:

    • crossfade: 5–8 сек

  • Loudness нормализация:

    • ~-17 LUFS Integrated (EBU R128)

    • true peak ≤ -1.0 dBTP (или -1.5 dBTP)

    • prefer 2-pass loudnorm

  • Export:

    • WAV (master)

    • MP3 (delivery)

ffmpeg:

  • използва се за processing

  • bundle-нат с инсталатора

  • без ръчни инсталации

5️⃣ Queue / Job Manager
  • Множество jobs

  • Последователно изпълнение

  • Start / Pause / Resume / Stop

  • При грешка:

    • job → Failed

    • error се записва в лог

    • по възможност се продължава със следващ job

6️⃣ Logging & Traceability (задължително)

За всеки финален трак се записва log.json с пълни метаданни:

Минимум:

  • preset_name + version

  • prompt_template (+ negative_prompt)

  • seed

  • model_name + version

  • generation parameters

  • segment duration + count

  • crossfade duration

  • final duration

  • target LUFS + measured LUFS

  • target true peak + measured true peak

  • export settings

  • timestamp

  • app_version

 Output структура (пример)

/output
 └─ /cafe_chill
  ├─ cafe_chill__v1__20min__seed123.wav
  ├─ cafe_chill__v1__20min__seed123.mp3
  └─ log.json

✅ Acceptance Criteria

Проектът се счита за завършен, когато всички условия по-долу са изпълнени:

1️⃣ Инсталация и базова работа
  • Мога да инсталирам приложението на Windows 11 чрез 1-click installer. (или се инсталира с отдалечен достъп) 

  • Мога да генерирам поне 1 пълен финален трак (10–30 мин) без използване на command line.

2️⃣ Генериране и audition workflow (ЗАДЪЛЖИТЕЛНО)
  • Приложението може да генерира кратки кандидат-тракове с дължина ~2–3 минути.

  • За всеки кандидат-трак има възможност за прослушване директно в UI.

  • За всеки кандидат-трак мога да избера:

    • PASS (става) → тракът се запазва в Approved pool

    • REJECT (не става) → тракът автоматично отпада (изтрива се или се архивира)

  • Само одобрените (PASS) тракове се използват за:

    • автоматично слепване (stitching) в по-дълги финални тракове (напр. 30–60 мин).

3️⃣ Паралелна и непрекъсната работа (ключово)
  • Докато:

    • слушам кандидат-тракове,

    • одобрявам / отхвърлям,

    • инициирам слепване на финални тракове,

  • приложението продължава да генерира нова музика във фонов режим, без:

    • блокиране на UI,

    • спиране на текущата генерация,

    • ръчно рестартиране на процеси.

  • Приложението поддържа продължителна (24/7) работа в unattended режим.

4️⃣ Финален аудио резултат

Всеки финален трак съдържа:

  • WAV (master) + MP3 (delivery)

  • коректна зададена дължина

  • loudness: ~ -17 LUFS Integrated

  • true peak: ≤ -1.0 dBTP / -1.5 dBTP

  • правилна folder структура

  • валиден log.json с всички метаданни

5️⃣ Preset и конфигурационен контрол
  • Мога самостоятелно да редактирам presets.yaml/json.

  • Мога да добавям нови музикални профили и версии.

  • Новите/редактираните presets могат да се използват чрез UI без промяна на кода.

6️⃣ Архитектура и бъдещо надграждане

  • Архитектурата на приложението (jobs, queues, pipeline, logging) позволява:

    • разширяване към curated workflow (Phase 2),

    • без major refactor на core логиката.

Какво очаквам от кандидата

  • Кратко техническо описание как ще реализира проекта

  • Опит с:

    • Python + Windows packaging

    • PyTorch CPU

    • ffmpeg pipeline

  • Предложение за milestones

  • Затворен
  • Бюджет

Кандидати // 4

Свиване
  • Кандидат
  • Веселин Василев     Здравейте, господин Панайотов ! Изпратих Ви лично съобщение.
    Благодаря Ви предварително за отделеното внимание !!!!
    Поздрави: Веселин Василев. :}
    1. Aктивност:
    2. 30%
    30%
  • 10 дни

  • Кандидат
  • Angel Stankov     Здравейте,

    Проявявам интерес към проекта за разработка на локално Windows приложение за AI музикална продукция. Мога да предложа решение, базирано на Python и интегриране на AI библиотеки (като PyTorch или Magenta) за генериране на звук, опаковани в самостоятелен .exe файл с графичен интерфейс.
    1. Aктивност:
    2. 30%
    30%
  • 25 дни
  • 2000

  • Кандидат
  • ✪ Кристофър Чуклев     Здравейте, г-н Панайотов,

    Кандидатствам за проекта за AI аудио генерация с audition workflow, паралелна работа и production-grade output. Разполагам с над 10 години опит в софтуерна архитектура, Python екосистеми и медийни pipeline-и, с реализирани решения за клиенти и компании от цял свят.

    Как ще реализирам проекта (накратко):
    • Python + PyTorch (CPU) генерационен слой
    • Job/Queue архитектура (non-blocking UI, background workers, 24/7 unattended)
    • ffmpeg pipeline за loudness (~-17 LUFS), true peak (≤ -1.0 / -1.5 dBTP) и коректен export
    • UI audition: PASS/REJECT → Approved pool → автоматично stitching (30–60 мин)
    • Строга output структура + валиден log.json (timestamps, app_version, peaks)

    Контрол и разширяемост:
    • Presets.yaml/json — редакция и нови профили без промяна на код
    • Архитектура, готова за Phase 2 (curated workflow) без major refactor

    Milestones (пример):
    • M1: Installer (Windows 11, 1-click) + базова генерация
    • M2: Audition UI + PASS/REJECT + background generation
    • M3: Stitching, loudness/TP контрол, logs, стабилизация 24/7

    Допълнително: до няколко дни публикувам революционно мобилно AI приложение, базирано на модел, който лично създадох — независим от Gemini, ChatGPT, Grok и др., с значително по-естествено поведение и бизнес-ориентирана прецизност. Ако има човек, който може да изгради и надгради подобна система стратегически и технологично, това съм аз.

    Изпращам ви контакти за връзка с мен в Лично Съобщение тук в платформата!

    ✓ Готов съм да започнем веднага и да доставя стабилно, мащабируемо решение.

    С уважение,
    ✪ Кристофър Чуклев
    Уеб & Мобилна Разработка | Видео | Дизайн | Реклама ✓
    1. Aктивност:
    2. 40%
    40%
  • 12 дни

Преди да напишете предложението си, влезте с email и парола!