transcription/config.yaml
keboss-m fee9b9acb1 Add RAG, summary pipeline, and split transcribe/postprocess queue.
Separate ASR (2 workers) from summary/RAG post-processing, add LightRAG chat API, batch upload fixes, and local model mounts for Docker deployment.

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-06-01 17:40:58 +03:00

78 lines
2.4 KiB
YAML
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Конфигурация пайплайна транскрибации совещаний
# Профили оборудования
profiles:
# Текущий: MacBook Air M4, 16GB RAM
mac_m4:
device: cpu # MPS на Mac может быть медленнее/багован; CPU + int8 стабильнее
compute_type: int8
batch_size: 2 # Оптимум для CPU (1.2-1.3x быстрее, RAM ~4.5 GB)
model: large-v3
language: ru
diarize: true
# Будущий: GPU с 8GB VRAM
gpu_8gb:
device: cuda
compute_type: float16 # или int8 если не хватает памяти
batch_size: 1 # large-v3 + alignment + diarization в ~8GB
model: large-v3
language: ru
diarize: true
# Универсальный CPU (без GPU)
cpu_best:
device: cpu
compute_type: int8
batch_size: 1
model: large-v3
language: ru
diarize: true
# Активный профиль (можно переопределить через CLI: --profile gpu_8gb)
active_profile: mac_m4
# Настройки диаризации
hf_token: null # HuggingFace токен для pyannote. Установите через env: HF_TOKEN
# Настройки выходного документа
output:
formats: [docx, md] # Список форматов: docx, md, txt. Можно указать один или несколько.
include_timestamps: true
speaker_label_style: name # name | id | none
paragraph_pause_sec: 2.0 # новый абзац, если пауза > N секунд
# Настройки RAG (LightRAG для протоколов совещаний)
rag:
enabled: true
auto_index: true
sections:
- Планировка
- Конструкции
- MEP
- Отделка
- Общие вопросы
- Согласование
- Контроль качества
index_backend: opencode
index_model: mimo-v2.5-free
chat_backend: opencode
chat_model: deepseek-v4-flash-free
summary_auto: true
summary_model: deepseek-v4-flash-free
summary_chunk_size: 10000
classify_chunk_size: 7000
opencode_api_key: null # Или через env: OPENCODE_API_KEY
opencode_url: "https://opencode.ai/zen/v1"
project_index_dir: ./processed/lightrag_caches
# Очередь обработки
queue:
transcribe_workers: 2
postprocess_workers: 1
# Пути
paths:
output_dir: ./output
temp_dir: ./tmp