Датасет переговорных поединков для обучения персонального ассистента
Раскройте потенциал разговорного искусственного интеллекта с помощью чистых, структурированных и тематически богатых данных.
Что входит в датасет?

Точная расшифровка


Высококачественная транскрипция речи с помощью современных ASR-систем (Automatic Speech Recognition) с последующей ручной проверкой и коррекцией ключевых моментов для максимальной точности.

Структурирование по говорящим


Данные разбиты по отдельным спикерам. Вы точно знаете, кто, что и когда сказал.

Тематическая разметка


Каждый диалог обогащен метаданными для простоты навигации и обучения:
  • Тема поединков (внутрифирменные конфликты,дебиторская / кредиторская задолженность,конфликт партнёров по бизнесу)
  • Участники (их роли: модератор, эксперт, оппонент, директор, парнер, руководитель проекта и д.р)
  • Хронометраж (классика, экспресс)
  • Ключевые аргументы и тезисы (опционально)
Формат данных: Удобные и популярные для ML-задач форматы: JSONL, CSV с четкой структурой, готовые к загрузке в ваши pipelines.
Наши преимущества
  • Высокое качество данных

    Мы совместили мощность AI-транскрибации и человеческий контроль, чтобы минимизировать количество ошибок.
  • Готовность к использованию
    Вам не нужно тратить месяцы на сбор, очистку и разметку данных. Просто скачайте и приступайте к работе.
  • Уникальный контент
    Дебаты — это сложный пласт языка, который редко встречается в чистом виде в открытых датасетах. Это дает вашим моделям конкурентное преимущество.
  • Структура и ясность
    Данные организованы логично и понятно, что ускоряет процесс разработки.

Технические детали

  • Объем датасета: 20+ поединков
  • Язык: русский
  • Источники: переговорные поединки
  • Цена: Зависит от объема и детализации разметки. От 3 000 руб. за базовый пакет. Запросите индивидуальное предложение.
Предзаказ на дата-сет
переговорных приемов
уведомить меня при появлении дата-сета