78 lines
2.5 KiB
YAML
78 lines
2.5 KiB
YAML
# Конфигурация пайплайна транскрибации совещаний
|
||
|
||
# Профили оборудования
|
||
profiles:
|
||
# Текущий: MacBook Air M4, 16GB RAM
|
||
mac_m4:
|
||
device: cpu # MPS на Mac может быть медленнее/багован; CPU + int8 стабильнее
|
||
compute_type: int8
|
||
batch_size: 2 # Оптимум для CPU (1.2-1.3x быстрее, RAM ~4.5 GB)
|
||
model: large-v3
|
||
language: ru
|
||
diarize: true
|
||
|
||
# Будущий: GPU с 8GB VRAM
|
||
gpu_8gb:
|
||
device: cuda
|
||
compute_type: float16 # или int8 если не хватает памяти
|
||
batch_size: 1 # large-v3 + alignment + diarization в ~8GB
|
||
model: large-v3
|
||
language: ru
|
||
diarize: true
|
||
|
||
# Универсальный CPU (без GPU)
|
||
cpu_best:
|
||
device: cpu
|
||
compute_type: int8
|
||
batch_size: 1
|
||
model: large-v3
|
||
language: ru
|
||
diarize: true
|
||
|
||
# Активный профиль (можно переопределить через CLI: --profile gpu_8gb)
|
||
active_profile: mac_m4
|
||
|
||
# Настройки диаризации
|
||
hf_token: null # HuggingFace токен для pyannote. Установите через env: HF_TOKEN
|
||
|
||
# Настройки выходного документа
|
||
output:
|
||
formats: [docx, md] # Список форматов: docx, md, txt. Можно указать один или несколько.
|
||
include_timestamps: true
|
||
speaker_label_style: name # name | id | none
|
||
paragraph_pause_sec: 2.0 # новый абзац, если пауза > N секунд
|
||
|
||
# Настройки RAG (LightRAG для протоколов совещаний)
|
||
rag:
|
||
enabled: true
|
||
auto_index: true
|
||
sections:
|
||
- Планировка
|
||
- Конструкции
|
||
- MEP
|
||
- Отделка
|
||
- Общие вопросы
|
||
- Согласование
|
||
- Контроль качества
|
||
index_backend: opencode
|
||
index_model: mimo-v2.5-free
|
||
chat_backend: opencode
|
||
chat_model: deepseek-v4-flash-free
|
||
summary_auto: true
|
||
summary_model: deepseek-v4-flash-free
|
||
summary_chunk_size: 10000
|
||
classify_chunk_size: 7000
|
||
opencode_api_key: "sk-4jJBUMS7WJyBOtZZAexsSy6aT4NKOYp2gA19WLlaux8jHMw0HvyCl1V45Jf8SONz" # Или через env: OPENCODE_API_KEY
|
||
opencode_url: "https://opencode.ai/zen/v1"
|
||
project_index_dir: ./processed/lightrag_caches
|
||
|
||
# Очередь обработки
|
||
queue:
|
||
transcribe_workers: 2
|
||
postprocess_workers: 1
|
||
|
||
# Пути
|
||
paths:
|
||
output_dir: ./output
|
||
temp_dir: ./tmp
|