Date: 2025-09-09
Topic: От идеи к дизайну исследования
Спикеры: Аглая Черемных, Сергей Хабаров

PDF
Miro

Общее саммари встречи

Первая встреча цикла задала базу для Research+AI Lab: обсудили, как стартовать исследование (бриф, цели, DoD, гипотезы, данные, команда) и провели групповую активность по картированию методов в Miro.
Разобрали «Six T’s» как рамку для делегирования и автоматизации рутины.
Отдельный блок посвятили ограничениям LLM: типы галлюцинаций, подходы к «заземлению» (RAG, агентный режим, проекты, коннекторы), и ориентирование в бенчмарках.
Касались этики и обезличивания данных: что можно/нельзя грузить в проприетарные модели и критерии выбора вендора для деперсонализации.

Саммари (по ключевым блокам)

Как стартовать исследование

  • Бриф: контекст (где «живёт» фича, этап CJ), чёткая цель, Definition of Done.
  • Гипотезы: бизнес-гипотеза + проверяемые исследовательские; инвентаризация имеющихся данных; роли/команда.

Six T’s (рамка делегирования/автоматизации)

  • Tiny, Tedious, Time-consuming, Teachable, Terrible at, Time-sensitive — категории задач с рекомендациями, когда делегировать человеку/ИИ и как подключаться.
  • Рефлексия: «что люблю», «мой уникальный вклад», «что тянет время», и др. (линк на шаблоны/таблицы).

Ограничения LLM и «заземление»

  • Типы галлюцинаций (внутренние/внешние); методы снижения: RAG, явные ограничения в промптах, кросс-проверка моделями.
  • Инструменты заземления: агентный режим, «глубокое исследование» (web-поиск + сопоставление источников), коннекторы (Google Drive/Notion и др.), проекты с шаблонами/инструкциями.
  • Подход: идти от цели и метрик, учитывать текущий техландшафт (лимиты, контекстные окна, спецбенчмарки), использовать Tier-1 источники.

Бенчмарки

  • LLM Arena — полезно, но с ограничениями для узких ресёрч-задач; следить за сегментами/метриками.
  • Отчёт по Deep Research: сравнение моделей по поиску/качеству ответов на сложных задачах; нет «вечного» лидера, модели и данные обновляются; рекомендация сравнивать несколько.

Кейсы автоматизации

Участники разошлись по комнатам и поделились, какие кейсы они хотели бы автоматизировать.

КейсКто упоминалТип задачи (Six T’s)Что хотят автоматизироватьИдея/подход
Настройка бенчмарков и подготовка пакета артефактовЕвгенийTime-consuming / Time-sensitive; частично TeachableОпределение осей бенчмарка; подбор источников; подготовка «файликов», наименование, приведение отчетов к общей структуреШаблоны осей/критериев; полуавтомат для именования и нормализации отчетов (скрипт/агент)
Пост-сессионные отчеты из разговоров (ментальное здоровье)Рэй пересказал кейс АнастасииTedious / Time-consumingТранскрибация сессий и первичный аналитический отчетСвязка «транскрибатор + анализатор текста» для автосаммари и структуры отчета
Постоянный конкурентный анализ и апдейтыРэй пересказал кейс НатальиTime-sensitive / TediousРегулярное обновление базы по конкурентам и передача результатовПоисковые запросы/соцмониторинг + автоапдейты короткими дайджестами в Slack/мессенджер
Анализ множества глубинных интервью и контента (социсследования/политпроекты)Рэй и ВладимирTime-consumingКлассификация, поиск паттернов и инсайтов по 10–20+ интервью; контент-анализ программ и исследованийСобственный бот/программа (FreeGPT/скрипт) для пакетной обработки интервью, выделения тем/цитат/инсайтов; полуавтомат для контент-анализа с кросс-проверкой источников
Быстрый триаж нефтегазовых инвестпроектов с «датарумами»Андрей КалуцковTime-consuming / Time-sensitiveОтбор релевантных проектов из большого потока и подготовка «one-pager» для инвестораАвтопарсинг документов/датарума → извлечение ключевых метрик/рисков → генерация стандартизованной страницы проекта; (отдельно — рекомендации по коммуникации со стейкхолдерами)

Этические вызовы и обезличивание

  • Нельзя загружать: персональные, NDA, конфиденциальные, мед/фин данные; можно — публичные, обезличенные, агрегаты.
  • Критерии выбора решений: степень обезличивания vs полезность; тип данных; сложность метода; демаскируемость; консистентность маскирования.
  • Для старта допустима ручная замена (респондент 1/2/…), для корпораций — выбор вендора.

Домашнее задание

  1. Откройте таблицу Automation Delegation. Сделайте свою копию (файл → копия). Заполните таблицу сами и проанализируйте с помощью LLM — промпт на отдельном листе. Напишите в чат свои наблюдения:
    — оправдывается ли ваша идея и ожидания, изменилась ли она, например, по объему
    — нашлась ли идея, если ее не было, почему вы ее выбрали
    — есть ли процесс, который вы намеренно решили не автоматизировать, почему?
  2. Попробуйте создать свой собственный бриф исследования в проекте Claude/ChatGPT. Напишите в чат свои наблюдения:
    — изменилось ли ваше видение исследования после составления брифа?
    — c какими сложностями в создании брифа столкнулись?
    — что показалось легким?
  3. Ознакомиться с присланными в среду лумами: рекомендации по промптингу, настройка «Проектов», туториалы по Make и n8n; зарегистрироваться в сервисах — подготовка к парсерам YouTube/Telegram на следующей неделе.