From de212f5f007bc2d4e18fd9dfe9e17c5ef185bf5e Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=D0=9A=D0=B8=D1=80=D0=B8=D0=BB=D0=BB=20=D0=91=D0=BB=D0=B8?= =?UTF-8?q?=D0=BD=D0=BE=D0=B2?= Date: Fri, 29 May 2026 10:29:51 +0300 Subject: [PATCH] Add local/offline processing explanation to README --- README.md | 22 ++++++++++++++++++++++ 1 file changed, 22 insertions(+) diff --git a/README.md b/README.md index de1bbe3..e0d0a55 100644 --- a/README.md +++ b/README.md @@ -81,6 +81,28 @@ HF_TOKEN=hf_xxxxxxxxxxxxxxxxxxxxxxxx python -c "import os; print('Token установлен:', bool(os.environ.get('HF_TOKEN')))" ``` +## Работа офлайн — всё локально! + +**Да, все модели работают полностью локально.** + +Токен HuggingFace нужен **только один раз** — чтобы скачать модели при первом запуске. После этого: + +- ✅ **Интернет не нужен** — можно отключить Wi-Fi +- ✅ **Аудио не уходит никуда** — обработка только на вашем устройстве +- ✅ **Текст не уходит в облако** — результат только у вас +- ✅ **Подходит для конфиденциальных совещаний** + +### Что скачивается при первом запуске + +| Компонент | Размер | Зачем | +|-----------|--------|-------| +| Whisper `large-v3` | ~3 GB | Распознавание речи | +| Pyannote диаризация | ~400 MB | Разделение спикеров | +| Wav2Vec2 (русский) | ~1 GB | Точные таймкоды слов | +| **Итого** | **~4–5 GB** | **Скачиваются один раз** | + +Модели сохраняются в системный кэш (`~/.cache/` на Linux/Mac, `%USERPROFILE%\.cache\` на Windows) и переиспользуются при каждом запуске. + ## Использование ```bash