Проект

Локално Windows приложение за AI музикална продукция

Описание на проекта

Изграждам локално Windows desktop приложение за вътрешна употреба, което автоматизира производството на AI-генерирана фонова музика за търговски пространства (кафенета, ресторанти, хотели, спа, уелнес).

❌ НЕ е consumer app
❌ НЕ е SaaS
❌ НЕ е стрийминг платформа

✅ Това е producer tool – инструмент за производство на готови аудио тракове за комерсиална употреба.

Цел (MVP)

Целта е проста, но професионална:

Избирам preset / конфигурация → натискам “Generate” → получавам напълно готови тракове (WAV + MP3)
с коректна дължина, loudness, структура и пълна проследимост (логове).

Приложението трябва да ми дава пълен контрол чрез конфигурационни файлове (preset „скриптове“)
без нужда от промяна на кода.

Таргет среда (важно)

ОС: Windows 11 Pro
CPU: AMD Ryzen 7 7700
RAM: 32 GB
GPU: AMD integrated (AI генерацията е CPU-only)
Режим на генерация (MVP): PyTorch CPU build

Интернет:

допустим при първоначална инсталация / първо пускане (напр. за model weights)
след това: пълна офлайн работа

(Налична е AMD Radeon RX 6700 XT, но се използва само за дисплей, не за AI)

✅ Основни функционални изисквания (MVP)0️⃣ Phase 2 – архитектурно предвидено (НЕ част от MVP deliverables)

Приложението трябва да бъде проектирано така, че да позволява future “curated workflow” без пренаписване на core pipeline-а, а именно:

Candidate generation: генериране на къси кандидат-тракове (2–3 мин, configurable) за прослушване
Human gate: PASS / REJECT – само PASS участва във финално сглобяване
Parallelism: докато потребителят слуша/одобрява, генерацията може да продължава във фонов режим
(non-blocking UI + queues)
Реализацията може да е извън MVP, но архитектурата трябва да го позволява без major refactor.

- Continuous / unattended operation:

Приложението трябва да поддържа продължителна работа (24/7),

при която AI генерацията може да работи непрекъснато във фонов режим,

докато потребителят паралелно:

- слуша вече генерирани тракове

- одобрява/отхвърля сегменти

- извършва рязане и сглобяване на финални тракове,

без тези действия да блокират или спират генерацията.

1️⃣ Desktop UI (Windows приложение)

Прост, стабилен, non-blocking интерфейс

Inputs:

Избор на Preset / Канал (напр. Cafe / Restaurant / Hotel / Spa)
Крайна дължина: 10 / 20 / 30 минути
Брой тракове: 1–50
Ниво на вариация: Low / Medium / High
Избор на output папка

UX изисквания:

UI остава responsive по време на генерация
Job queue
Progress bar
ETA (ориентировъчно)
Статуси: Waiting / Running / Paused / Done / Failed

2️⃣ Preset система = “Скриптове” чрез конфиг (ЗАДЪЛЖИТЕЛНО)

Приложението ТРЯБВА да използва presets.yaml или presets.json, които действат като
скриптове/шаблони за музикална продукция.

Изисквания:

четим и редактируем файл
без промяна на кода
приложението просто чете и изпълнява конфигурацията

Всеки preset съдържа минимум:

preset_name
preset_version (v1, v1.1 и т.н.)
prompt_template
negative_prompt (optional)
default generation parameters (temperature, top-k/top-p, cfg и др.)
default segment length (30–60s)
seed strategy: fixed / random / predefined list (optional)
допълнителни тагове (mood, tempo, energy – като метаданни)

UI функции:

бутон “Reload presets”
или
“Open presets file” + Reload

➡️ Това ми позволява да добавям профили, версии и да експериментирам без developer намеса.

3️⃣ AI генериране на музика

MusicGen (Audiocraft) или еквивалентен open-source модел
Генериране на 30–60 сек сегменти
CPU-only execution

Детерминизъм и traceability:

seed се запазва
всички параметри се логват
при същия preset + seed → сравним резултат

Model weights:

автоматично изтегляне при първо пускане
или
bundle-ване (ако е възможно)
след това: пълна офлайн работа

4️⃣ Автоматичен аудио pipeline

За всеки финален трак:

Генериране на N сегмента
Stitch в дълъг трак:
- crossfade: 5–8 сек
Loudness нормализация:
- ~-17 LUFS Integrated (EBU R128)
- true peak ≤ -1.0 dBTP (или -1.5 dBTP)
- prefer 2-pass loudnorm
Export:
- WAV (master)
- MP3 (delivery)

ffmpeg:

използва се за processing
bundle-нат с инсталатора
без ръчни инсталации

5️⃣ Queue / Job Manager

Множество jobs
Последователно изпълнение
Start / Pause / Resume / Stop
При грешка:
- job → Failed
- error се записва в лог
- по възможност се продължава със следващ job

6️⃣ Logging & Traceability (задължително)

За всеки финален трак се записва log.json с пълни метаданни:

Минимум:

preset_name + version
prompt_template (+ negative_prompt)
seed
model_name + version
generation parameters
segment duration + count
crossfade duration
final duration
target LUFS + measured LUFS
target true peak + measured true peak
export settings
timestamp
app_version

Output структура (пример)

/output
└─ /cafe_chill
├─ cafe_chill__v1__20min__seed123.wav
├─ cafe_chill__v1__20min__seed123.mp3
└─ log.json

✅ Acceptance Criteria

Проектът се счита за завършен, когато всички условия по-долу са изпълнени:

1️⃣ Инсталация и базова работа

Мога да инсталирам приложението на Windows 11 чрез 1-click installer. (или се инсталира с отдалечен достъп)
Мога да генерирам поне 1 пълен финален трак (10–30 мин) без използване на command line.

2️⃣ Генериране и audition workflow (ЗАДЪЛЖИТЕЛНО)

Приложението може да генерира кратки кандидат-тракове с дължина ~2–3 минути.
За всеки кандидат-трак има възможност за прослушване директно в UI.
За всеки кандидат-трак мога да избера:
- PASS (става) → тракът се запазва в Approved pool
- REJECT (не става) → тракът автоматично отпада (изтрива се или се архивира)
Само одобрените (PASS) тракове се използват за:
- автоматично слепване (stitching) в по-дълги финални тракове (напр. 30–60 мин).

3️⃣ Паралелна и непрекъсната работа (ключово)

Докато:
- слушам кандидат-тракове,
- одобрявам / отхвърлям,
- инициирам слепване на финални тракове,
приложението продължава да генерира нова музика във фонов режим, без:
- блокиране на UI,
- спиране на текущата генерация,
- ръчно рестартиране на процеси.
Приложението поддържа продължителна (24/7) работа в unattended режим.

4️⃣ Финален аудио резултат

Всеки финален трак съдържа:

WAV (master) + MP3 (delivery)
коректна зададена дължина
loudness: ~ -17 LUFS Integrated
true peak: ≤ -1.0 dBTP / -1.5 dBTP
правилна folder структура
валиден log.json с всички метаданни

5️⃣ Preset и конфигурационен контрол

Мога самостоятелно да редактирам presets.yaml/json.
Мога да добавям нови музикални профили и версии.
Новите/редактираните presets могат да се използват чрез UI без промяна на кода.

6️⃣ Архитектура и бъдещо надграждане

Архитектурата на приложението (jobs, queues, pipeline, logging) позволява:
- разширяване към curated workflow (Phase 2),
- без major refactor на core логиката.

Какво очаквам от кандидата

Кратко техническо описание как ще реализира проекта
Опит с:
- Python + Windows packaging
- PyTorch CPU
- ffmpeg pipeline
Предложение за milestones

21.01.2026
Panayot Panayotov

Затворен
Бюджет

Python

Кандидати // 4

Свиване

Веселин Василев Здравейте, господин Панайотов ! Изпратих Ви лично съобщение.
Благодаря Ви предварително за отделеното внимание !!!!
Поздрави: Веселин Василев. :}
1. Aктивност:
2. 30%
30%
10 дни

Angel Stankov Здравейте,

Проявявам интерес към проекта за разработка на локално Windows приложение за AI музикална продукция. Мога да предложа решение, базирано на Python и интегриране на AI библиотеки (като PyTorch или Magenta) за генериране на звук, опаковани в самостоятелен .exe файл с графичен интерфейс.
1. Aктивност:
2. 30%
30%
25 дни
2000 €

✪ Кристофър Чуклев Здравейте, г-н Панайотов,

Кандидатствам за проекта за AI аудио генерация с audition workflow, паралелна работа и production-grade output. Разполагам с над 10 години опит в софтуерна архитектура, Python екосистеми и медийни pipeline-и, с реализирани решения за клиенти и компании от цял свят.

Как ще реализирам проекта (накратко):
• Python + PyTorch (CPU) генерационен слой
• Job/Queue архитектура (non-blocking UI, background workers, 24/7 unattended)
• ffmpeg pipeline за loudness (~-17 LUFS), true peak (≤ -1.0 / -1.5 dBTP) и коректен export
• UI audition: PASS/REJECT → Approved pool → автоматично stitching (30–60 мин)
• Строга output структура + валиден log.json (timestamps, app_version, peaks)

Контрол и разширяемост:
• Presets.yaml/json — редакция и нови профили без промяна на код
• Архитектура, готова за Phase 2 (curated workflow) без major refactor

Milestones (пример):
• M1: Installer (Windows 11, 1-click) + базова генерация
• M2: Audition UI + PASS/REJECT + background generation
• M3: Stitching, loudness/TP контрол, logs, стабилизация 24/7

Допълнително: до няколко дни публикувам революционно мобилно AI приложение, базирано на модел, който лично създадох — независим от Gemini, ChatGPT, Grok и др., с значително по-естествено поведение и бизнес-ориентирана прецизност. Ако има човек, който може да изгради и надгради подобна система стратегически и технологично, това съм аз.

Изпращам ви контакти за връзка с мен в Лично Съобщение тук в платформата!

✓ Готов съм да започнем веднага и да доставя стабилно, мащабируемо решение.

С уважение,
✪ Кристофър Чуклев
Уеб & Мобилна Разработка | Видео | Дизайн | Реклама ✓
1. Aктивност:
2. 70%
70%
12 дни

Емилия Ваклинова Moga da opitam, da go naprav[. Cena pri uspeh i vreme to iskane.
1. Aктивност:
2. 20%
20%
1 дни

Преди да напишете предложението си, влезте с email и парола!