Фильтрация контента в N8N: как исключить shorts и обрабатывать только релевантные видео

Вы настроили автоматический мониторинг каналов конкурентов, подключили API, запустили сценарий — и через день обнаружили, что система собрала 80% мусора. Shorts длиной 30 секунд, запланированные трансляции, которые ещё не начались, анонсы без содержания. Вместо аналитики контента — хаос данных, который невозможно использовать.
Проблема не в инструментах. Проблема в том, что автоматизация без фильтрации работает как пылесос: засасывает всё подряд. А ваша задача — получать только релевантный материал, который можно транскрибировать, анализировать и использовать для стратегии.
Настройка фильтров для исключения shorts и нерелевантного материала в автоматических системах — это не технический изыск. Это базовая гигиена автоматизации, без которой вы потратите больше времени на очистку данных, чем сэкономите на сборе.
Разберём, как строить логику фильтрации, создавать условные развилки и обрабатывать разные типы контента так, чтобы в вашу базу попадало только то, что действительно нужно.
Почему фильтрация контента критична для автоматизации
Когда вы подключаете автоматический сбор данных из источников вроде каналов или RSS-лент, система не различает ценность контента. Для неё все элементы равны: полноценное видео на 40 минут и 15-секундный ролик — одинаковые объекты с метаданными.
Без фильтрации вы получаете:
- Переполненную базу данных с низкой плотностью полезной информации
- Лишние запросы к API транскрибации (а это деньги и лимиты)
- Невозможность быстро найти нужный материал среди шума
- Ложные срабатывания триггеров для дальнейшей обработки
Фильтрация контента — это первый узел после получения данных. Именно здесь вы решаете, что движется дальше по сценарию, а что отсекается сразу.
Логика условных операторов в автоматизации
Условные операторы — это развилки в вашем сценарии. Они проверяют данные по заданным критериям и направляют поток в одну из веток: «да» или «нет», «подходит» или «не подходит».
В инструментах автоматизации вроде N8N условия строятся через узлы типа IF или Switch. Принцип простой: вы задаёте правило, система проверяет каждый элемент и принимает решение.
Как использовать условные операторы в N8N?
Представьте: вы мониторите канал конкурента и хотите исключить shorts. Shorts обычно имеют длительность до 60 секунд. Значит, ваше условие будет проверять параметр duration.
Логика:
- Если duration > 60 секунд — направить на транскрибацию
- Если duration ≤ 60 секунд — отсечь
В N8N это настраивается через узел IF с условием: {{ $json.duration }} > 60. Все элементы, которые не прошли проверку, просто не передаются дальше.
Но длительность — не единственный критерий. Запланированные трансляции могут иметь любую длительность, но контента в них ещё нет. Для них проверяется статус или наличие параметра liveBroadcastContent.
Как создать условие для исключения запланированных трансляций?
API возвращает поле liveBroadcastContent со значениями: none, upcoming, live. Вам нужны только записи со значением none — это завершённый контент, который можно обработать.
Условие: {{ $json.liveBroadcastContent }} === ‘none’.
Если значение upcoming или live — материал не готов, его нужно пропустить.
Как настроить фильтр для исключения shorts в N8N?
Пошаговая логика настройки фильтра для исключения коротких роликов:
Шаг 1. Получение данных через API
Вы используете узел HTTP Request или специализированный модуль для подключения к источнику. Данные приходят в формате JSON с метаданными каждого видео: title, duration, liveBroadcastContent, publishedAt и так далее.
Шаг 2. Добавление узла IF
После получения данных добавляете узел IF. Он будет первым фильтром.
Шаг 3. Настройка условия по длительности
В узле IF задаёте условие: duration больше 60 (или другого порога, который вы определили как границу для shorts).
Шаг 4. Настройка условия по статусу трансляции
Добавляете второе условие в том же узле (режим AND): liveBroadcastContent равно none.
Теперь дальше по сценарию пройдут только те элементы, которые одновременно:
- Длиннее 60 секунд
- Являются завершённым контентом
Всё остальное автоматически отсекается.
Обработка успешных и неуспешных запросов
Автоматизация — это не линейный процесс. API может вернуть ошибку, данные могут быть неполными, запрос может не выполниться из-за лимитов. Если вы не обрабатываете эти сценарии, весь процесс останавливается или ломается.
Как обрабатывать успешные и неуспешные запросы в автоматизации?
В N8N есть встроенная логика обработки ошибок. Вы можете настроить отдельную ветку для случаев, когда запрос не выполнился.
Успешный запрос:
Данные получены, фильтры пройдены — элемент движется дальше: на транскрибацию, суммирование, запись в базу.
Неуспешный запрос:
Ошибка API, пустой ответ, таймаут. Вместо остановки сценария вы направляете ошибку в отдельный узел: логирование, уведомление, повторная попытка через время.
Для этого используется параметр Continue On Fail в узлах HTTP Request. Если запрос упал, данные передаются в ветку ошибок, а не останавливают весь сценарий.
Пример структуры:
- Узел HTTP Request с Continue On Fail = true
- Узел IF проверяет наличие данных
- Если данные есть → фильтрация и обработка
- Если данных нет → запись ошибки в таблицу или отправка уведомления
Это создаёт устойчивую систему, которая не ломается от единичных сбоев.
Как создать развилки в сценариях для обработки разных типов контента?
Не весь контент обрабатывается одинаково. Длинное видео требует транскрибации и суммирования. Средний формат может нуждаться только в извлечении ключевых моментов. Короткие ролики — исключаются.
Развилки позволяют направлять каждый тип контента по своему пути.
Пример структуры развилок:
- Длительность > 20 минут → полная транскрибация + AI-суммирование + запись в AirTable
- Длительность от 5 до 20 минут → транскрибация + краткое резюме
- Длительность от 1 до 5 минут → только метаданные (название, дата, ссылка)
- Длительность < 1 минуты → исключение
Каждая ветка — это отдельный узел IF или Switch, который проверяет параметр duration и направляет данные в нужный блок обработки.
Настройка транскрибации и суммирования для отфильтрованного контента
После того как фильтры отсекли shorts и нерелевантный материал, остаётся контент, который действительно стоит обрабатывать. Следующий этап — превратить видео в текст и структурированные данные.
Как настроить транскрибацию видео в автоматических системах?
Транскрибация — это преобразование аудиодорожки видео в текст. Для этого используются API-сервисы распознавания речи.
Логика подключения:
- Из отфильтрованных данных извлекается ссылка на видео
- Видео передаётся в сервис транскрибации (например, через API)
- Сервис возвращает текстовую расшифровку
- Текст передаётся дальше — на суммирование или сразу в базу
В N8N это реализуется через узел HTTP Request с POST-запросом к API транскрибации. Вы передаёте URL видео, получаете текст.
Как настроить транскрибацию с помощью SupaDupa?
SupaDupa — один из инструментов, который можно интегрировать для обработки аудио. Принцип тот же: вы отправляете запрос с параметрами (ссылка на файл, язык, формат вывода), получаете транскрипцию.
Важный момент: не все видео нужно транскрибировать полностью. Если ваша цель — мониторинг тем, достаточно извлечь ключевые фрагменты или создать краткое резюме.
Как автоматизировать суммирование видео с помощью AI?
После транскрибации текст можно передать в AI-модель для суммирования. Это сокращает объём данных и выделяет суть.
Логика:
- Транскрипция передаётся в узел с AI-моделью (например, через API OpenAI или аналог)
- В промпте вы задаёте задачу: «Создай краткое резюме на 3–5 предложений»
- Модель возвращает сжатый текст
- Резюме записывается в базу вместе с метаданными
Это особенно полезно, если вы мониторите десятки каналов: вместо часовых расшифровок вы получаете концентрированные инсайты.
Запись обработанных данных в AirTable
Финальный этап автоматизации — сохранение данных в структурированном виде. AirTable удобен тем, что сочетает гибкость таблиц и возможности базы данных.
Как подключить AirTable для записи данных из источников контента?
В N8N есть готовый узел AirTable. Вы подключаете его через API-ключ, выбираете базу и таблицу, настраиваете поля для записи.
Какие данные стоит сохранять:
- Название видео
- Ссылка
- Дата публикации
- Длительность
- Транскрипция (если нужна)
- Резюме от AI
- Теги или категории (если вы их определяете автоматически)
Каждый элемент, прошедший через фильтры и обработку, становится строкой в таблице. Вы получаете актуальную базу контента конкурентов, структурированную и готовую к анализу.
Типичные ошибки при настройке фильтрации
Ошибка 1. Слишком жёсткие фильтры
Вы исключаете всё, что короче 10 минут, и теряете полезные форматы. Фильтры должны соответствовать вашим целям, а не абстрактным правилам.
Ошибка 2. Отсутствие обработки ошибок
Один сбой API — и весь сценарий встаёт. Всегда настраивайте ветку для неуспешных запросов.
Ошибка 3. Игнорирование статуса контента
Вы фильтруете по длительности, но не проверяете, завершён ли контент. В базу попадают анонсы трансляций без содержания.
Ошибка 4. Отсутствие логирования
Вы не знаете, сколько элементов отсеялось и почему. Добавьте узел записи статистики: сколько пришло, сколько прошло фильтры, сколько обработано.
Структурирование данных в автоматических системах
Фильтрация — это только начало. Данные, которые прошли проверку, нужно структурировать так, чтобы с ними можно было работать.
Принципы структурирования:
- Единый формат: все даты в одном формате, все длительности в секундах или минутах
- Категоризация: автоматическое присвоение тегов или категорий на основе ключевых слов
- Приоритизация: пометка наиболее релевантных элементов (например, видео с высокой длительностью и свежей датой)
- Связи: если вы мониторите несколько каналов, связывайте данные с источником
Это превращает поток данных в систему знаний.
Мониторинг контента конкурентов: от сбора к инсайтам
Автоматизация сбора и фильтрации — это не самоцель. Это инфраструктура для получения конкурентных преимуществ.
Что вы можете делать с отфильтрованными и структурированными данными:
- Отслеживать темы, которые разбирают конкуренты
- Видеть частоту публикаций и форматы
- Анализировать, какие видео получают больше внимания (если подключаете метрики)
- Извлекать идеи для собственного контента
- Формировать гипотезы о трендах в нише
Всё это становится возможным, когда в вашей базе нет шума. Когда каждая запись — это релевантный материал, а не случайный shorts или анонс.
Итоговая архитектура сценария фильтрации
Соберём всё в единую картину. Ваш сценарий автоматизации с фильтрацией выглядит так:
1. Получение данных
Узел HTTP Request или RSS → API возвращает список элементов с метаданными.
2. Первичная фильтрация
Узел IF → проверка длительности и статуса контента. Отсечение shorts и незавершённого материала.
3. Развилки по типу контента
Узел Switch → распределение по веткам в зависимости от длительности или других параметров.
4. Обработка
Для каждой ветки — свой набор действий: транскрибация, суммирование, извлечение метаданных.
5. Обработка ошибок
Отдельная ветка для неуспешных запросов: логирование, уведомления, повторные попытки.
6. Запись в базу
Узел AirTable → сохранение обработанных данных в структурированном виде.
7. Логирование и статистика
Узел записи метрик: сколько элементов получено, отфильтровано, обработано, записано.
Эта архитектура масштабируется. Вы можете добавлять новые источники, новые фильтры, новые типы обработки — логика остаётся той же.
Когда фильтрация становится стратегией
Настройка фильтров — это не просто техническая задача. Это решение о том, какую информацию вы считаете ценной, а какую — шумом.
Каждый критерий фильтрации отражает ваше понимание ниши и целей. Если вы исключаете видео короче 5 минут — значит, вы ищете глубину. Если фильтруете по ключевым словам в названии — значит, вам важна тематическая точность.
Автоматизация без фильтрации — это иллюзия эффективности. Вы тратите ресурсы на сбор данных, которые всё равно придётся чистить вручную.
Фильтрация с первого узла — это осознанная автоматизация. Вы получаете только то, что можете использовать. И это меняет всё: от скорости принятия решений до качества стратегии.