newsomo Pro+ · Мануал кодування + AI

📚 Зміст

Перший день: онбординг
3 режими роботи: який обрати
AI confidence levels
Workflow однієї статті
Кодування fixed-полів
Робота з 91 тезою
Спікери: NER + ваша база
Edge cases: коли AI помиляється
Speedrun: 200 статей за 4 години
Як AI вчиться на вас
Експорт клієнту
FAQ + troubleshooting

Перший день: онбординг

Від реєстрації до першого закодованого проєкту

🌅 Ранок (30 хв)

Зайти на analyst.newsomo.com → Sign in with Google вашим робочим gmail
Чекати підтвердження статусу аналітика від адміна (зазвичай до 24 годин)
Отримати welcome email з посиланням на цей мануал

📋 Перший проєкт (45 хв)

Кнопка "+ Створити проєкт" → відкривається Wizard (6 кроків)
Для першого разу — рекомендую взяти шаблон "Мінфін" у кроці 4, щоб не вигадувати таксономію з нуля
На кроці 2 виберіть лише "Базові RSS newsomo → Економіка + Загальнополітичні" — без custom-джерел та CSV
Натисніть "Запустити проєкт" → newsomo дає 30 хв на збір та AI-прев'ю

🎯 Перші 10 статей (1 година)

Відкрити Workbench у Card-режимі — кожна стаття одна за раз з повним текстом
НЕ натискайте "Accept all AI" у перший день — пройдіть вручну, щоб зрозуміти як AI пропонує
Для кожної статті: прочитайте → перевірте AI-suggestions → правте/підтверджуйте → "✓ Зберегти і далі"
Після 10 статей переключіться на Grid view — побачите всі рядки одночасно

✨

Тактичний рада: перший проєкт — навчальний. Не очікуйте 90% AI agreement з ходу — це досягається через 100-150 статей. Перший тиждень — це навчання AI на ваших паттернах.

3 режими роботи · який обрати

Card · Grid · Excel-mode — однакові дані, різна швидкість

	Card view	Grid view	Excel-mode
Один екран	1 стаття	15-50 рядків	113 колонок × 749 рядків
Глибина читання	Повний текст з highlights	Назва + сніпет	Назва (truncated)
Швидкість/стаття	~2 хв	~45 сек	~30 сек
AI suggestions	Деталізована панель	Inline pills	✨ підсвічені колонки
Найкраще для	50-150 ст. з гл. читанням	200-500 ст. швидко	500+ ст. з фоновими знаннями
Рекомендація	Перший день	⭐ Default	Досвідчені аналітики

Перемикання — кнопки у шапці

У шапці Workbench є три кнопки: 📰 Card / 📊 Grid / 🔬 Excel-mode. Дані синхронізовані — переключайтеся коли стиль чи кількість потребує іншого підходу.

💡

Реальний робочий день: більшість аналітиків працює в Grid view. Card відкривають для складних/довгих статей (натиснути на назву → відкривається Card). Excel-mode використовують для фінального проходу перед експортом — побачити всі 113 колонок одразу.

AI confidence levels

Як зрозуміти наскільки можна довіряти пропозиції

Кожна AI-пропозиція має confidence score (0-100%) — це не магічне число, а обчислена ймовірність що пропозиція правильна. У трьох інтерфейсах це показано по-різному:

✨ HIGH

≥ 85%

→ AI знайшов чіткі маркери. Найімовірніше правильно. У Card — повний opacity, у Grid — суцільна синя рамка, в Excel — solid blue dashed checkbox.

✨ MEDIUM

60-85%

→ AI невпевнений. Маркери є, але контекст неоднозначний. Обов'язково перевіряйте.

👤 LOW

< 60%

→ AI пропонує лише як candidate. Може бути правильно — а може ні. Розглядайте як підказку, не відповідь.

⚠️

Правило великого пальця: якщо ви сумніваєтеся — натисніть ✕ Reject. Краще пусто, ніж неправильно. Краще проробити вручну → AI вивчиться на наступних статтях.

Як зрозуміти ЧОМУ AI запропонував те що запропонував

У Card view, під кожною AI-пропозицією є секція ai-trace: AI явно каже які маркери він знайшов у тексті. Наприклад:

why: "заявив"/"розпочав"/"виділив" → активна
vs: "критикують"/"закликали" → пасивна (не знайдено достатньо)

Workflow однієї статті

Що відбувається з моменту відкриття до "✓ Зберегти"

📥

1. Stream

newsomo підгружає статтю, 14 з 18 полів auto-filled

🤖

2. AI preview

Тип ком, спікери, top-5 тез з confidence

📖

3. Read

Аналітик читає текст з highlights

✅

4. Decide

Accept / Reject / Edit / Add нову

💾

5. Save

→ DB, AI learns, next article

Деталі кожного кроку

Крок 3: Як читати ефективно

У Card view текст статті має підсвічені сутності:

🔵 Сині — організації (Мінфін, МОН, ЄБА...)
🟣 Фіолетові — персони (Марченко, Свириденко...)
🟡 Жовті — цифри і суми (4.5 млрд, 18%...)
🟢 Зелений пунктир — активні дієслова (заявив, розробив)
🟡 Жовтий пунктир — пасивні дієслова (критикують, закликали)

Час читання: 30-45 секунд для статті середнього розміру (1500 знаків). Не читайте кожне слово — скануйте на підсвічені.

Крок 4: Прийняття рішення

На правій панелі для кожного fixed-поля є 3 кнопки: актив / пасив / —. AI-пропозиція вже виділена синім. Один клік підтверджує. Якщо хочете інше — клікніть на потрібну.

Для тез: 5 chip-кнопок з ✨. Кліком обираєте — стає зеленою з ✓. Якщо потрібна теза не серед top-5 — натисніть + всі 91 → відкриється модалка з пошуком.

Кодування fixed-полів

4 ключові виміри: тип ком, тип персони, +/− спікери

Поле 1: Тип комунікації об'єкта (Мінфін)

Питання яке ви ставите: "Хто був ініціатором повідомлення?"

Активна — Мінфін сам щось зробив/сказав. Маркери: "Мінфін заявив", "Мінфін затвердив", "Мінфін розпочав", "Мінфін виділив", "Мінфін оголосив".
Пасивна — про Мінфін говорять інші. Маркери: "Критикують Мінфін", "Закликали Мінфін", "Вимагають від Мінфіна", "Запитують у Мінфіна".
— (немає) — Мінфін згаданий побіжно, ні активної, ні пасивної комунікації немає.

💡

Граничний випадок: "Мінфін відповів на критику ЗМІ". Це активна (Мінфін діє — відповідає), хоча привід — пасивний. AI часто помиляється тут — спочатку перевіряйте.

Поле 2: Тип комунікації персони (Марченко)

Те саме, але для людини. Якщо персона взагалі не згадується у статті — залиште —. AI спочатку перевіряє факт згадки через NER.

Поле 3: Спікери позитиву

Список людей які висловились ПОЗИТИВНО про об'єкт моніторингу (Мінфін). Формат: "Ім'я Прізвище, посада".

Якщо одна людина процитована з нейтральним коментарем — її не додаємо. Тільки явно прихильні.

Поле 4: Спікери негативу

Аналогічно, але хто критикує/звинувачує об'єкт. Можна додавати скільки завгодно осіб (через UI — поодинці).

✨

AI допомога: коли стаття відкривається, AI вже знайшов імена через NER + перевірив контекст цитат. Маленькі ✨ chips з ім'ями — це AI candidates. Один клік → додається у відповідну категорію.

Робота з 91 тезою

Multi-label coding · стаття може належати 0-5 тезам

Тези — це повторювані теми/сюжети, які моніторинг переслідує. У Мінфін-таксономії 91 теза: "Мінфін зриває реформу митниці", "С.Марченко зустрівся з послом Японії", "Мінфін лобіює інтереси ОП" тощо.

Як вибирає AI top-5

AI обчислює cosine similarity між embedding статті та embedding кожної з 91 тези → сортує → пропонує 5 найвищих якщо similarity ≥ 0.45.

Якщо для статті жодна теза не вище 0.45 — AI не пропонує нічого, ви додаєте вручну через "+ всі 91".

Правила вибору тез

Multi-label: стаття може мати 0, 1, 3, 5 тез. Не обмежуйте себе одною.
Точність важливіша за повнота: краще 2 точні тези, ніж 5 з-під палиці.
Семантична відповідність, не лексична: стаття "Уряд виділив на ярмарки в Європі" → теза "Мінфін виділив на міжнародні ярмарки", навіть якщо слова "Мінфін" немає (бо контекст).
Якщо стаття розкриває нову тему, якої немає в таксономії — це сигнал що треба додати нову тезу. Записуйте у заметки.

Якщо AI не знайшов потрібну тезу

Натисніть + всі 91 у Grid/Excel або + Переглянути всі тези з бази в Card. Відкриється модалка з:

Усі 91 теза, сортовані: AI-suggested спочатку, потім вже обрані, потім решта
Пошук по тезах — введіть ключове слово, фільтрується миттєво
Чекбокси — обирайте відповідні

⚠️

Часта помилка: вибрати найперший варіант з AI top-5, не подивившись на інші. AI сортує за similarity, але іноді 4-та теза правильніша за 1-шу. Завжди читайте всі 5 пропозицій.

Спікери: NER + ваша база

База росте автоматично з вашими додаваннями

Спікер у newsomo — це не просто ім'я, а повний запис: "Юлія Свириденко, прем'єр-міністерка". Посада витягається з контексту і додається при першому згадуванні.

Як AI знаходить спікерів

spaCy NER: проходить по тексту, шукає named entities типу PER (person)
Fuzzy match: порівнює знайдені імена з базою вже відомих 30+12 спікерів. Якщо схожість >80% — пропонує цього спікера.
Контекстна класифікація: якщо цитата позитивна про Мінфін → спікер пропонується як "позитив". Якщо критика → "негатив".

Коли AI помиляється

Нова персона: спікер вперше у вашій базі. AI не запропонує — додайте вручну. Після додавання — наступного разу AI вже знатиме.
Помилка в посаді: AI вписав застарілу посаду (Свириденко як "віце-прем'єр" замість "прем'єр-міністерка"). Видаліть і додайте з нової бази.
Невірна полярність: AI поклав спікера в "позитив", але насправді його цитата сарказм. Видаліть звідти і додайте в "негатив".

Додавання спікерів

3 способи:

Click на AI-chip (синій пунктирний) — додає в "позитив" за замовч.
"+" кнопка → popover з усіма 30/12 спікерами в базі → клік → додає в потрібну категорію
Inline через клавіатуру: у dropdown введіть кілька букв → autocomplete

💡

Як росте база: якщо ви додаєте нового спікера (його ще немає в базі) — введіть повне ім'я + посаду. Цей запис автоматично потрапляє в базу проєкту, і в наступних статтях AI його вже впізнає.

Edge cases: коли AI помиляється

Каталог типових помилок + правильна реакція

Тип	Що бачите	Як AI помилився	Що робити
🎭	Сарказм у тезі	AI зчитав позитивні маркери ("чудовий", "молодець") але це іронія	Відкиньте AI suggestion, поставте правильне
📝	Цитата у цитаті	AI приписав Мінфіну те що сказав інший спікер у цитаті	Переключіть на "—" або правильного спікера
🔀	Стаття про іншу подію	AI знайшов "Мінфін" у побіжній згадці, але стаття про КМУ	Поставте прапорець "побіжна згадка"
⏳	Стара подія знов на повестці	AI запропонував тезу про подію 2024, але стаття 2026 про неї згадує побіжно	Зніміть цю тезу, додайте релевантнішу для 2026
🌐	Однойменна організація	"Мінфін РФ" сплутаний з "Мінфін UA"	Зніміть все, поставте "побіжна згадка" або проігноруйте
📊	Стаття-аналітика	AI ставить багато тез бо стаття охоплює всі	Залишити 2-3 найвідповідніші — не пхати все
🔇	Інтерв'ю без позиції	AI додав спікера, але той сказав щось нейтральне	Видаліть зі спікерів — додаємо лише з чіткою позицією

Speedrun: 200 статей за 4 години

Тактика досвідченого аналітика

Це підхід для коли AI у вашому проєкті вже навчений (через ~150 пройдених статей) і agreement > 80%.

Phase 1: Bulk accept (30 хв на 200 статей)

Відкрити Grid view
Фільтр: "High AI confidence" — залишаються лише статті де AI впевнений у всьому
Натиснути "✨ Прийняти AI на всіх" → AI заповнює всі поля
Швидкий проскролл по таблиці — якщо все виглядає OK, натиснути "✓ Завершити вибрані" з checkbox Select all

→ Зазвичай 50-70% статей пройде через bulk-accept за 30 хв.

Phase 2: Medium confidence (2-2.5 години на ~80 статей)

Фільтр: "Pending" + Grid view залишається
Йдете по рядках, на кожному:
- Перевіряєте AI-pills (актив/пасив) — клікаєте Accept (якщо OK) або переключаєте
- Дивитесь на ✨ chips тез — клікаєте на правильні з top-5
- Дивитесь на ✨ speakers — клікаєте на тих хто реально спікер
- Якщо потрібна повніша картина — клікаєте на назву → відкривається Card → читаєте → повертаєтесь у Grid
На кожній статті середнім часом ~1.5 хв

Phase 3: Тонкі випадки (1 година на ~30 статей)

Фільтр: "Pending" — лишилися лише складні
Для кожної: відкриваєте Card view, читаєте повний текст з highlights, ретельно кодуєте
На цих статтях AI confidence низький → треба експертна оцінка
~2-3 хв на статтю

⚡

Виходить: 30 хв (phase 1) + 150 хв (phase 2) + 60 хв (phase 3) = 4 години на 200 статей. Це 1.2 хв/стаття у середньому. Без AI таке кодування зайняло б 17-20 годин.

Quick shortcuts

⌘ + A

Виділити всі видимі рядки (Grid)

Esc

Закрити модалку / popover

Filter pills

High AI / Pending / Coded — швидке переключення

Як AI вчиться на вас

Чому agreement росте: реальний механізм

Кожне ваше рішення — це training signal. AI логує:

Accept — ви прийняли AI пропозицію → AI запам'ятовує: "так, embedding цієї статті ↔ ця теза = pattern працює"
Reject — ви відкинули → AI знижує confidence для цього патерну
Override — ви замінили AI пропозицію на іншу → AI вчиться що для подібного embedding потрібна інша відповідь
Add new — ви додали те що AI не запропонував → AI підіймає цю тезу для майбутніх схожих статей

Cron-цикл навчання (кожну годину)

Backend перераховує thesis centroids: для кожної з 91 тез бере всі embedding'и статей, на яких ви її підтвердили, обчислює середній (centroid). Наступного разу схожість обчислюється не з embedding'ом тези, а з centroid'ом успішних застосувань.

Результат: через 100 статей AI бачить вашу персональну логіку застосування тези, не просто словесну схожість.

Метрики які бачите у шапці

AI вивчив N патернів — скільки унікальних field → value комбінацій ви підтвердили
AI agreement — % ваших accept'ів / (accept'и + reject'и)
Зекономлено N хв — оцінка vs ручне кодування

📈

Очікувана крива росту agreement:
Стаття 1-10: 50-65% (AI ще не знає вашу логіку)
Стаття 50: 70-78%
Стаття 150: 82-88%
Стаття 500: 88-93% (плато)
Чим послідовніше ви кодуєте — тим швидше росте.

Що НЕ робити (зруйнує навчання)

Не натискайте "Accept all AI" не дивлячись у перші 50 статей — AI вирішить що його сировинна логіка правильна і не вдосконалюватиметься
Не кодуйте у поспіху неточно — AI запам'ятовує ВСЕ що ви натискаєте. Якщо ставите неправильні тези — навчиться неправильно
Не змінюйте семантику тезів у середині проєкту — це руйнує centroids

Експорт клієнту

Excel 113 cols · PDF brief · CSV для аналізу

Формати

📊 Excel (113 cols) — точно як ваш ТЗ-шаблон. Клієнт відкриває і одразу читає звичним способом.
📋 Excel summary — стиснений: лише агрегати (% по тезах, спікери у списку, тональність-розподіл)
📄 PDF executive brief — AI генерує текстовий звіт на 2-3 сторінки з висновками, на основі ваших закодованих даних
🗂️ CSV — для подальшого аналізу в Python/R
🔌 JSON — для інтеграції з CRM клієнта

Pre-export checklist

Переключіться в Excel-mode — побачите всі 113 cols як буде у файлі
Перевірте footer: "Прокодовано N/N" — має бути 100%
Перевірте що нема "—" у fixed-полях (де реально має бути значення)
Перевірте чи у "побіжна згадка" не забагато прапорців (якщо >30% — щось не так)
Натисніть "Експорт .xlsx" → файл завантажується автоматично

Що в експорті

Колонки 1-18: метадані з newsomo (auto)
Колонки 19-22: fixed-coding (ваше)
Колонки 23-113: 91 тезова колонка з 1/пусто
Колонка 114: побіжна згадка
Footer: дата експорту, аналітик-email, fingerprint проєкту, AI agreement, версія newsomo

Автоматичні розклади

У Project Setup → step 5 ви могли налаштувати auto-reports: щодня / щотижня / щомісяця. Тоді ваш звіт автоматично надсилається на email клієнта + кладеться в Google Drive у папку /newsomo/{project-fingerprint}/reports/.

📧

Critical alert mode: якщо у проєкті раптом за день з'явилося >5 негативних статей про об'єкт моніторингу — newsomo автоматично надсилає вам та клієнту email "🚨 Кризова медіа-активність". Ви можете швидко зайти, скодувати їх і надіслати hot-summary за 1 годину.

FAQ + troubleshooting

Часті питання за першим тижнем роботи

Чому стаття у Grid показує "—" для AI confidence?

AI обчислював, але не знайшов жодної тези з similarity > 0.45. Це означає що стаття семантично віддалена від вашої таксономії. Або: відкрийте Card, прочитайте — можливо вона побіжно згадує об'єкт (тоді чекбокс "побіжна"). Або: додайте нову тезу у таксономію якщо це нова тема.

Чи можна редагувати таксономію посеред проєкту?

Так, але обережно. Setup → Step 4 → Edit. Видалення тези не вплине на вже закодовані статті. Зміна формулювання руйнує AI-centroid для цієї тези — agreement тимчасово впаде. Додавання нової тези безпечно — AI просто розпочне її пропонувати з новими статтями.

Що робити коли newsomo не зібрала жодної статті за день?

1. Перевірте у Setup чи ваші ключові слова не занадто вузькі ("Сергій Марченко" замість "Марченко"). 2. Подивіться у admin dashboard статус ваших обраних джерел — можливо деякі тимчасово недоступні. 3. Якщо проблема через 48 годин — напишіть adminу (marikovski@gmail.com).

Як перенести проєкт на іншого аналітика в команді?

Team Pack ($99/міс) дозволяє додавати до 3 співробітників на проєкт. Project Settings → Members → Add by gmail. У free Pro+ — один аналітик на проєкт.

AI пропонує неправильно у 50% випадків — що робити?

Це нормально для перших 30-50 статей у новому проєкті. AI вчиться. Якщо й після 100 статей agreement < 65% — можливо ваша таксономія занадто специфічна (тези <30 знаків) або занадто схожі між собою. Перегляньте формулювання — кожна теза має бути унікально семантично визначена.

Чи можна закодувати статтю частково і завершити пізніше?

Так. Всі ваші зміни зберігаються автоматично. Лише натискання "✓ Зберегти і далі" / "✓ Завершити" фіналізує статтю. До того моменту — стаття в стані "in progress" і ви можете повернутись завтра.

Експорт виходить порожній — чому?

Експорт включає лише completed статті. Якщо ви тільки відкривали без завершення — файл буде з заголовками але без даних. Перевірте footer Workbench: "X/Y completed". X має бути > 0.

Що якщо я хочу побачити статті з конкретного джерела окремо?

У Grid view → toolbar → фільтр "Усі портали" → виберіть конкретний (напр. "pravda.com.ua"). Видно лише статті з цього порталу. Для звітності по групах (Офіційні vs Незалежні vs Telegram) — це робиться автоматично в експортуваному summary.

Як швидко переключатися між статтями клавіатурою?

У поточній v42.0 — клік мишею. У v42.3 додаємо ↑/↓ навігація по рядках Grid + Tab/Enter для accept AI. Roadmap.

AI неправильно класифікує сарказм — як це виправити?

Сарказм — це HUMAN-ONLY область за дизайном. AI вчиться, але навіть з 1000 прикладів його точність на сарказмі ~60%. Це фундаментальне обмеження embedding-моделей. Завжди перевіряйте підтекст у статтях де AI впевнено пропонує позитивну/негативну характеристику.

Який ноутбук потрібен для роботи з Excel-mode?

Будь-який сучасний (від 2020). 749 статей × 113 cols = 84 тис ячейок — обробляється в браузері без проблем. Якщо у проєкті > 5000 статей — рекомендуємо Pro+ Agency Pack з backend-pagination.

Чи можна синхронізувати з Google Sheets?

Зараз — через експорт CSV і manual import. У v42.4 додаємо live sync через Google Drive API — будь-яка зміна у Sheets автоматично оновлює newsomo (і навпаки).

Що робити при 500 error?

1. Перезавантажте сторінку — більшість errors решаються. 2. Ваші unsaved зміни в localStorage зберігаються — не втратяться. 3. Якщо повторюється — напишіть adminу з URL і часом помилки. Telegram alert вже надішле сповіщення команді.

Готові почати?

Створіть свій перший проєкт у wizard — і протестуйте все що описано тут на реальних даних.

🧙 Project Wizard 📰 Card view 📊 Grid view 🔬 Excel-mode 📊 AI Capabilities