PRO+ MANUAL Як кодувати + як використовувати AI ← Card Workbench

Як кодувати у newsomo Pro+

Покрокова інструкція для аналітика: від першого логіну до експорту звіту клієнту. Як працювати з AI-помічником, коли йому довіряти, а коли перевіряти.

📚 Зміст

  1. Перший день: онбординг
  2. 3 режими роботи: який обрати
  3. AI confidence levels
  4. Workflow однієї статті
  5. Кодування fixed-полів
  6. Робота з 91 тезою
  7. Спікери: NER + ваша база
  8. Edge cases: коли AI помиляється
  9. Speedrun: 200 статей за 4 години
  10. Як AI вчиться на вас
  11. Експорт клієнту
  12. FAQ + troubleshooting
1

Перший день: онбординг

Від реєстрації до першого закодованого проєкту

🌅 Ранок (30 хв)

  • Зайти на analyst.newsomo.comSign in with Google вашим робочим gmail
  • Чекати підтвердження статусу аналітика від адміна (зазвичай до 24 годин)
  • Отримати welcome email з посиланням на цей мануал

📋 Перший проєкт (45 хв)

  • Кнопка "+ Створити проєкт" → відкривається Wizard (6 кроків)
  • Для першого разу — рекомендую взяти шаблон "Мінфін" у кроці 4, щоб не вигадувати таксономію з нуля
  • На кроці 2 виберіть лише "Базові RSS newsomo → Економіка + Загальнополітичні" — без custom-джерел та CSV
  • Натисніть "Запустити проєкт" → newsomo дає 30 хв на збір та AI-прев'ю

🎯 Перші 10 статей (1 година)

  • Відкрити Workbench у Card-режимі — кожна стаття одна за раз з повним текстом
  • НЕ натискайте "Accept all AI" у перший день — пройдіть вручну, щоб зрозуміти як AI пропонує
  • Для кожної статті: прочитайте → перевірте AI-suggestions → правте/підтверджуйте → "✓ Зберегти і далі"
  • Після 10 статей переключіться на Grid view — побачите всі рядки одночасно
Тактичний рада: перший проєкт — навчальний. Не очікуйте 90% AI agreement з ходу — це досягається через 100-150 статей. Перший тиждень — це навчання AI на ваших паттернах.
2

3 режими роботи · який обрати

Card · Grid · Excel-mode — однакові дані, різна швидкість
Card viewGrid viewExcel-mode
Один екран1 стаття15-50 рядків113 колонок × 749 рядків
Глибина читанняПовний текст з highlightsНазва + сніпетНазва (truncated)
Швидкість/стаття~2 хв~45 сек~30 сек
AI suggestionsДеталізована панельInline pills✨ підсвічені колонки
Найкраще для50-150 ст. з гл. читанням200-500 ст. швидко500+ ст. з фоновими знаннями
РекомендаціяПерший день⭐ DefaultДосвідчені аналітики

Перемикання — кнопки у шапці

У шапці Workbench є три кнопки: 📰 Card / 📊 Grid / 🔬 Excel-mode. Дані синхронізовані — переключайтеся коли стиль чи кількість потребує іншого підходу.

💡
Реальний робочий день: більшість аналітиків працює в Grid view. Card відкривають для складних/довгих статей (натиснути на назву → відкривається Card). Excel-mode використовують для фінального проходу перед експортом — побачити всі 113 колонок одразу.
3

AI confidence levels

Як зрозуміти наскільки можна довіряти пропозиції

Кожна AI-пропозиція має confidence score (0-100%) — це не магічне число, а обчислена ймовірність що пропозиція правильна. У трьох інтерфейсах це показано по-різному:

✨ HIGH
≥ 85%

→ AI знайшов чіткі маркери. Найімовірніше правильно. У Card — повний opacity, у Grid — суцільна синя рамка, в Excel — solid blue dashed checkbox.

✨ MEDIUM
60-85%

→ AI невпевнений. Маркери є, але контекст неоднозначний. Обов'язково перевіряйте.

👤 LOW
< 60%

→ AI пропонує лише як candidate. Може бути правильно — а може ні. Розглядайте як підказку, не відповідь.

⚠️
Правило великого пальця: якщо ви сумніваєтеся — натисніть ✕ Reject. Краще пусто, ніж неправильно. Краще проробити вручну → AI вивчиться на наступних статтях.

Як зрозуміти ЧОМУ AI запропонував те що запропонував

У Card view, під кожною AI-пропозицією є секція ai-trace: AI явно каже які маркери він знайшов у тексті. Наприклад:

why: "заявив"/"розпочав"/"виділив" → активна
vs: "критикують"/"закликали" → пасивна (не знайдено достатньо)
4

Workflow однієї статті

Що відбувається з моменту відкриття до "✓ Зберегти"
📥
1. Stream
newsomo підгружає статтю, 14 з 18 полів auto-filled
🤖
2. AI preview
Тип ком, спікери, top-5 тез з confidence
📖
3. Read
Аналітик читає текст з highlights
4. Decide
Accept / Reject / Edit / Add нову
💾
5. Save
→ DB, AI learns, next article

Деталі кожного кроку

Крок 3: Як читати ефективно

У Card view текст статті має підсвічені сутності:

  • 🔵 Сині — організації (Мінфін, МОН, ЄБА...)
  • 🟣 Фіолетові — персони (Марченко, Свириденко...)
  • 🟡 Жовті — цифри і суми (4.5 млрд, 18%...)
  • 🟢 Зелений пунктир — активні дієслова (заявив, розробив)
  • 🟡 Жовтий пунктир — пасивні дієслова (критикують, закликали)

Час читання: 30-45 секунд для статті середнього розміру (1500 знаків). Не читайте кожне слово — скануйте на підсвічені.

Крок 4: Прийняття рішення

На правій панелі для кожного fixed-поля є 3 кнопки: актив / пасив / . AI-пропозиція вже виділена синім. Один клік підтверджує. Якщо хочете інше — клікніть на потрібну.

Для тез: 5 chip-кнопок з ✨. Кліком обираєте — стає зеленою з ✓. Якщо потрібна теза не серед top-5 — натисніть + всі 91 → відкриється модалка з пошуком.

5

Кодування fixed-полів

4 ключові виміри: тип ком, тип персони, +/− спікери

Поле 1: Тип комунікації об'єкта (Мінфін)

Питання яке ви ставите: "Хто був ініціатором повідомлення?"

  • Активна — Мінфін сам щось зробив/сказав. Маркери: "Мінфін заявив", "Мінфін затвердив", "Мінфін розпочав", "Мінфін виділив", "Мінфін оголосив".
  • Пасивна — про Мінфін говорять інші. Маркери: "Критикують Мінфін", "Закликали Мінфін", "Вимагають від Мінфіна", "Запитують у Мінфіна".
  • (немає) — Мінфін згаданий побіжно, ні активної, ні пасивної комунікації немає.
💡
Граничний випадок: "Мінфін відповів на критику ЗМІ". Це активна (Мінфін діє — відповідає), хоча привід — пасивний. AI часто помиляється тут — спочатку перевіряйте.

Поле 2: Тип комунікації персони (Марченко)

Те саме, але для людини. Якщо персона взагалі не згадується у статті — залиште . AI спочатку перевіряє факт згадки через NER.

Поле 3: Спікери позитиву

Список людей які висловились ПОЗИТИВНО про об'єкт моніторингу (Мінфін). Формат: "Ім'я Прізвище, посада".

Якщо одна людина процитована з нейтральним коментарем — її не додаємо. Тільки явно прихильні.

Поле 4: Спікери негативу

Аналогічно, але хто критикує/звинувачує об'єкт. Можна додавати скільки завгодно осіб (через UI — поодинці).

AI допомога: коли стаття відкривається, AI вже знайшов імена через NER + перевірив контекст цитат. Маленькі ✨ chips з ім'ями — це AI candidates. Один клік → додається у відповідну категорію.
6

Робота з 91 тезою

Multi-label coding · стаття може належати 0-5 тезам

Тези — це повторювані теми/сюжети, які моніторинг переслідує. У Мінфін-таксономії 91 теза: "Мінфін зриває реформу митниці", "С.Марченко зустрівся з послом Японії", "Мінфін лобіює інтереси ОП" тощо.

Як вибирає AI top-5

AI обчислює cosine similarity між embedding статті та embedding кожної з 91 тези → сортує → пропонує 5 найвищих якщо similarity ≥ 0.45.

Якщо для статті жодна теза не вище 0.45 — AI не пропонує нічого, ви додаєте вручну через "+ всі 91".

Правила вибору тез

  1. Multi-label: стаття може мати 0, 1, 3, 5 тез. Не обмежуйте себе одною.
  2. Точність важливіша за повнота: краще 2 точні тези, ніж 5 з-під палиці.
  3. Семантична відповідність, не лексична: стаття "Уряд виділив на ярмарки в Європі" → теза "Мінфін виділив на міжнародні ярмарки", навіть якщо слова "Мінфін" немає (бо контекст).
  4. Якщо стаття розкриває нову тему, якої немає в таксономії — це сигнал що треба додати нову тезу. Записуйте у заметки.

Якщо AI не знайшов потрібну тезу

Натисніть + всі 91 у Grid/Excel або + Переглянути всі тези з бази в Card. Відкриється модалка з:

  • Усі 91 теза, сортовані: AI-suggested спочатку, потім вже обрані, потім решта
  • Пошук по тезах — введіть ключове слово, фільтрується миттєво
  • Чекбокси — обирайте відповідні
⚠️
Часта помилка: вибрати найперший варіант з AI top-5, не подивившись на інші. AI сортує за similarity, але іноді 4-та теза правильніша за 1-шу. Завжди читайте всі 5 пропозицій.
7

Спікери: NER + ваша база

База росте автоматично з вашими додаваннями

Спікер у newsomo — це не просто ім'я, а повний запис: "Юлія Свириденко, прем'єр-міністерка". Посада витягається з контексту і додається при першому згадуванні.

Як AI знаходить спікерів

  1. spaCy NER: проходить по тексту, шукає named entities типу PER (person)
  2. Fuzzy match: порівнює знайдені імена з базою вже відомих 30+12 спікерів. Якщо схожість >80% — пропонує цього спікера.
  3. Контекстна класифікація: якщо цитата позитивна про Мінфін → спікер пропонується як "позитив". Якщо критика → "негатив".

Коли AI помиляється

  • Нова персона: спікер вперше у вашій базі. AI не запропонує — додайте вручну. Після додавання — наступного разу AI вже знатиме.
  • Помилка в посаді: AI вписав застарілу посаду (Свириденко як "віце-прем'єр" замість "прем'єр-міністерка"). Видаліть і додайте з нової бази.
  • Невірна полярність: AI поклав спікера в "позитив", але насправді його цитата сарказм. Видаліть звідти і додайте в "негатив".

Додавання спікерів

3 способи:

  1. Click на AI-chip (синій пунктирний) — додає в "позитив" за замовч.
  2. "+" кнопка → popover з усіма 30/12 спікерами в базі → клік → додає в потрібну категорію
  3. Inline через клавіатуру: у dropdown введіть кілька букв → autocomplete
💡
Як росте база: якщо ви додаєте нового спікера (його ще немає в базі) — введіть повне ім'я + посаду. Цей запис автоматично потрапляє в базу проєкту, і в наступних статтях AI його вже впізнає.
8

Edge cases: коли AI помиляється

Каталог типових помилок + правильна реакція
ТипЩо бачитеЯк AI помиливсяЩо робити
🎭 Сарказм у тезі AI зчитав позитивні маркери ("чудовий", "молодець") але це іронія Відкиньте AI suggestion, поставте правильне
📝 Цитата у цитаті AI приписав Мінфіну те що сказав інший спікер у цитаті Переключіть на "—" або правильного спікера
🔀 Стаття про іншу подію AI знайшов "Мінфін" у побіжній згадці, але стаття про КМУ Поставте прапорець "побіжна згадка"
Стара подія знов на повестці AI запропонував тезу про подію 2024, але стаття 2026 про неї згадує побіжно Зніміть цю тезу, додайте релевантнішу для 2026
🌐 Однойменна організація "Мінфін РФ" сплутаний з "Мінфін UA" Зніміть все, поставте "побіжна згадка" або проігноруйте
📊 Стаття-аналітика AI ставить багато тез бо стаття охоплює всі Залишити 2-3 найвідповідніші — не пхати все
🔇 Інтерв'ю без позиції AI додав спікера, але той сказав щось нейтральне Видаліть зі спікерів — додаємо лише з чіткою позицією
9

Speedrun: 200 статей за 4 години

Тактика досвідченого аналітика

Це підхід для коли AI у вашому проєкті вже навчений (через ~150 пройдених статей) і agreement > 80%.

Phase 1: Bulk accept (30 хв на 200 статей)

  1. Відкрити Grid view
  2. Фільтр: "High AI confidence" — залишаються лише статті де AI впевнений у всьому
  3. Натиснути "✨ Прийняти AI на всіх" → AI заповнює всі поля
  4. Швидкий проскролл по таблиці — якщо все виглядає OK, натиснути "✓ Завершити вибрані" з checkbox Select all

→ Зазвичай 50-70% статей пройде через bulk-accept за 30 хв.

Phase 2: Medium confidence (2-2.5 години на ~80 статей)

  1. Фільтр: "Pending" + Grid view залишається
  2. Йдете по рядках, на кожному:
    • Перевіряєте AI-pills (актив/пасив) — клікаєте Accept (якщо OK) або переключаєте
    • Дивитесь на ✨ chips тез — клікаєте на правильні з top-5
    • Дивитесь на ✨ speakers — клікаєте на тих хто реально спікер
    • Якщо потрібна повніша картина — клікаєте на назву → відкривається Card → читаєте → повертаєтесь у Grid
  3. На кожній статті середнім часом ~1.5 хв

Phase 3: Тонкі випадки (1 година на ~30 статей)

  1. Фільтр: "Pending" — лишилися лише складні
  2. Для кожної: відкриваєте Card view, читаєте повний текст з highlights, ретельно кодуєте
  3. На цих статтях AI confidence низький → треба експертна оцінка
  4. ~2-3 хв на статтю
Виходить: 30 хв (phase 1) + 150 хв (phase 2) + 60 хв (phase 3) = 4 години на 200 статей. Це 1.2 хв/стаття у середньому. Без AI таке кодування зайняло б 17-20 годин.

Quick shortcuts

⌘ + A
Виділити всі видимі рядки (Grid)
Esc
Закрити модалку / popover
Filter pills
High AI / Pending / Coded — швидке переключення
10

Як AI вчиться на вас

Чому agreement росте: реальний механізм

Кожне ваше рішення — це training signal. AI логує:

  • Accept — ви прийняли AI пропозицію → AI запам'ятовує: "так, embedding цієї статті ↔ ця теза = pattern працює"
  • Reject — ви відкинули → AI знижує confidence для цього патерну
  • Override — ви замінили AI пропозицію на іншу → AI вчиться що для подібного embedding потрібна інша відповідь
  • Add new — ви додали те що AI не запропонував → AI підіймає цю тезу для майбутніх схожих статей

Cron-цикл навчання (кожну годину)

Backend перераховує thesis centroids: для кожної з 91 тез бере всі embedding'и статей, на яких ви її підтвердили, обчислює середній (centroid). Наступного разу схожість обчислюється не з embedding'ом тези, а з centroid'ом успішних застосувань.

Результат: через 100 статей AI бачить вашу персональну логіку застосування тези, не просто словесну схожість.

Метрики які бачите у шапці

  • AI вивчив N патернів — скільки унікальних field → value комбінацій ви підтвердили
  • AI agreement — % ваших accept'ів / (accept'и + reject'и)
  • Зекономлено N хв — оцінка vs ручне кодування
📈
Очікувана крива росту agreement:
Стаття 1-10: 50-65% (AI ще не знає вашу логіку)
Стаття 50: 70-78%
Стаття 150: 82-88%
Стаття 500: 88-93% (плато)
Чим послідовніше ви кодуєте — тим швидше росте.

Що НЕ робити (зруйнує навчання)

  • Не натискайте "Accept all AI" не дивлячись у перші 50 статей — AI вирішить що його сировинна логіка правильна і не вдосконалюватиметься
  • Не кодуйте у поспіху неточно — AI запам'ятовує ВСЕ що ви натискаєте. Якщо ставите неправильні тези — навчиться неправильно
  • Не змінюйте семантику тезів у середині проєкту — це руйнує centroids
11

Експорт клієнту

Excel 113 cols · PDF brief · CSV для аналізу

Формати

  • 📊 Excel (113 cols) — точно як ваш ТЗ-шаблон. Клієнт відкриває і одразу читає звичним способом.
  • 📋 Excel summary — стиснений: лише агрегати (% по тезах, спікери у списку, тональність-розподіл)
  • 📄 PDF executive brief — AI генерує текстовий звіт на 2-3 сторінки з висновками, на основі ваших закодованих даних
  • 🗂️ CSV — для подальшого аналізу в Python/R
  • 🔌 JSON — для інтеграції з CRM клієнта

Pre-export checklist

  1. Переключіться в Excel-mode — побачите всі 113 cols як буде у файлі
  2. Перевірте footer: "Прокодовано N/N" — має бути 100%
  3. Перевірте що нема "—" у fixed-полях (де реально має бути значення)
  4. Перевірте чи у "побіжна згадка" не забагато прапорців (якщо >30% — щось не так)
  5. Натисніть "Експорт .xlsx" → файл завантажується автоматично

Що в експорті

  • Колонки 1-18: метадані з newsomo (auto)
  • Колонки 19-22: fixed-coding (ваше)
  • Колонки 23-113: 91 тезова колонка з 1/пусто
  • Колонка 114: побіжна згадка
  • Footer: дата експорту, аналітик-email, fingerprint проєкту, AI agreement, версія newsomo

Автоматичні розклади

У Project Setup → step 5 ви могли налаштувати auto-reports: щодня / щотижня / щомісяця. Тоді ваш звіт автоматично надсилається на email клієнта + кладеться в Google Drive у папку /newsomo/{project-fingerprint}/reports/.

📧
Critical alert mode: якщо у проєкті раптом за день з'явилося >5 негативних статей про об'єкт моніторингу — newsomo автоматично надсилає вам та клієнту email "🚨 Кризова медіа-активність". Ви можете швидко зайти, скодувати їх і надіслати hot-summary за 1 годину.
12

FAQ + troubleshooting

Часті питання за першим тижнем роботи
Чому стаття у Grid показує "—" для AI confidence?
AI обчислював, але не знайшов жодної тези з similarity > 0.45. Це означає що стаття семантично віддалена від вашої таксономії. Або: відкрийте Card, прочитайте — можливо вона побіжно згадує об'єкт (тоді чекбокс "побіжна"). Або: додайте нову тезу у таксономію якщо це нова тема.
Чи можна редагувати таксономію посеред проєкту?
Так, але обережно. Setup → Step 4 → Edit. Видалення тези не вплине на вже закодовані статті. Зміна формулювання руйнує AI-centroid для цієї тези — agreement тимчасово впаде. Додавання нової тези безпечно — AI просто розпочне її пропонувати з новими статтями.
Що робити коли newsomo не зібрала жодної статті за день?
1. Перевірте у Setup чи ваші ключові слова не занадто вузькі ("Сергій Марченко" замість "Марченко"). 2. Подивіться у admin dashboard статус ваших обраних джерел — можливо деякі тимчасово недоступні. 3. Якщо проблема через 48 годин — напишіть adminу (marikovski@gmail.com).
Як перенести проєкт на іншого аналітика в команді?
Team Pack ($99/міс) дозволяє додавати до 3 співробітників на проєкт. Project Settings → Members → Add by gmail. У free Pro+ — один аналітик на проєкт.
AI пропонує неправильно у 50% випадків — що робити?
Це нормально для перших 30-50 статей у новому проєкті. AI вчиться. Якщо й після 100 статей agreement < 65% — можливо ваша таксономія занадто специфічна (тези <30 знаків) або занадто схожі між собою. Перегляньте формулювання — кожна теза має бути унікально семантично визначена.
Чи можна закодувати статтю частково і завершити пізніше?
Так. Всі ваші зміни зберігаються автоматично. Лише натискання "✓ Зберегти і далі" / "✓ Завершити" фіналізує статтю. До того моменту — стаття в стані "in progress" і ви можете повернутись завтра.
Експорт виходить порожній — чому?
Експорт включає лише completed статті. Якщо ви тільки відкривали без завершення — файл буде з заголовками але без даних. Перевірте footer Workbench: "X/Y completed". X має бути > 0.
Що якщо я хочу побачити статті з конкретного джерела окремо?
У Grid view → toolbar → фільтр "Усі портали" → виберіть конкретний (напр. "pravda.com.ua"). Видно лише статті з цього порталу. Для звітності по групах (Офіційні vs Незалежні vs Telegram) — це робиться автоматично в експортуваному summary.
Як швидко переключатися між статтями клавіатурою?
У поточній v42.0 — клік мишею. У v42.3 додаємо / навігація по рядках Grid + Tab/Enter для accept AI. Roadmap.
AI неправильно класифікує сарказм — як це виправити?
Сарказм — це HUMAN-ONLY область за дизайном. AI вчиться, але навіть з 1000 прикладів його точність на сарказмі ~60%. Це фундаментальне обмеження embedding-моделей. Завжди перевіряйте підтекст у статтях де AI впевнено пропонує позитивну/негативну характеристику.
Який ноутбук потрібен для роботи з Excel-mode?
Будь-який сучасний (від 2020). 749 статей × 113 cols = 84 тис ячейок — обробляється в браузері без проблем. Якщо у проєкті > 5000 статей — рекомендуємо Pro+ Agency Pack з backend-pagination.
Чи можна синхронізувати з Google Sheets?
Зараз — через експорт CSV і manual import. У v42.4 додаємо live sync через Google Drive API — будь-яка зміна у Sheets автоматично оновлює newsomo (і навпаки).
Що робити при 500 error?
1. Перезавантажте сторінку — більшість errors решаються. 2. Ваші unsaved зміни в localStorage зберігаються — не втратяться. 3. Якщо повторюється — напишіть adminу з URL і часом помилки. Telegram alert вже надішле сповіщення команді.

Готові почати?

Створіть свій перший проєкт у wizard — і протестуйте все що описано тут на реальних даних.

🧙 Project Wizard 📰 Card view 📊 Grid view 🔬 Excel-mode 📊 AI Capabilities