Фильтрация контента в N8N: как исключить shorts и обрабатывать только релевантные видео

Резкий 3D-робот с мягкими, округлыми формами, светлым телом и светящимися голубыми глазами, демонстрирующий настройку фильтров для исключения shorts.

Вы настроили автоматический мониторинг каналов конкурентов, подключили API, запустили сценарий — и через день обнаружили, что система собрала 80% мусора. Shorts длиной 30 секунд, запланированные трансляции, которые ещё не начались, анонсы без содержания. Вместо аналитики контента — хаос данных, который невозможно использовать.

Проблема не в инструментах. Проблема в том, что автоматизация без фильтрации работает как пылесос: засасывает всё подряд. А ваша задача — получать только релевантный материал, который можно транскрибировать, анализировать и использовать для стратегии.

Настройка фильтров для исключения shorts и нерелевантного материала в автоматических системах — это не технический изыск. Это базовая гигиена автоматизации, без которой вы потратите больше времени на очистку данных, чем сэкономите на сборе.

Разберём, как строить логику фильтрации, создавать условные развилки и обрабатывать разные типы контента так, чтобы в вашу базу попадало только то, что действительно нужно.

Почему фильтрация контента критична для автоматизации

Когда вы подключаете автоматический сбор данных из источников вроде каналов или RSS-лент, система не различает ценность контента. Для неё все элементы равны: полноценное видео на 40 минут и 15-секундный ролик — одинаковые объекты с метаданными.

Без фильтрации вы получаете:

Переполненную базу данных с низкой плотностью полезной информации
Лишние запросы к API транскрибации (а это деньги и лимиты)
Невозможность быстро найти нужный материал среди шума
Ложные срабатывания триггеров для дальнейшей обработки

Фильтрация контента — это первый узел после получения данных. Именно здесь вы решаете, что движется дальше по сценарию, а что отсекается сразу.

Логика условных операторов в автоматизации

Условные операторы — это развилки в вашем сценарии. Они проверяют данные по заданным критериям и направляют поток в одну из веток: «да» или «нет», «подходит» или «не подходит».

В инструментах автоматизации вроде N8N условия строятся через узлы типа IF или Switch. Принцип простой: вы задаёте правило, система проверяет каждый элемент и принимает решение.

Как использовать условные операторы в N8N?

Представьте: вы мониторите канал конкурента и хотите исключить shorts. Shorts обычно имеют длительность до 60 секунд. Значит, ваше условие будет проверять параметр duration.

Логика:

Если duration > 60 секунд — направить на транскрибацию
Если duration ≤ 60 секунд — отсечь

В N8N это настраивается через узел IF с условием: {{ $json.duration }} > 60. Все элементы, которые не прошли проверку, просто не передаются дальше.

Но длительность — не единственный критерий. Запланированные трансляции могут иметь любую длительность, но контента в них ещё нет. Для них проверяется статус или наличие параметра liveBroadcastContent.

Как создать условие для исключения запланированных трансляций?

API возвращает поле liveBroadcastContent со значениями: none, upcoming, live. Вам нужны только записи со значением none — это завершённый контент, который можно обработать.

Условие: {{ $json.liveBroadcastContent }} === ‘none’.

Если значение upcoming или live — материал не готов, его нужно пропустить.

Как настроить фильтр для исключения shorts в N8N?

Пошаговая логика настройки фильтра для исключения коротких роликов:

Шаг 1. Получение данных через API
Вы используете узел HTTP Request или специализированный модуль для подключения к источнику. Данные приходят в формате JSON с метаданными каждого видео: title, duration, liveBroadcastContent, publishedAt и так далее.

Шаг 2. Добавление узла IF
После получения данных добавляете узел IF. Он будет первым фильтром.

Шаг 3. Настройка условия по длительности
В узле IF задаёте условие: duration больше 60 (или другого порога, который вы определили как границу для shorts).

Шаг 4. Настройка условия по статусу трансляции
Добавляете второе условие в том же узле (режим AND): liveBroadcastContent равно none.

Теперь дальше по сценарию пройдут только те элементы, которые одновременно:

Длиннее 60 секунд
Являются завершённым контентом

Всё остальное автоматически отсекается.

Обработка успешных и неуспешных запросов

Автоматизация — это не линейный процесс. API может вернуть ошибку, данные могут быть неполными, запрос может не выполниться из-за лимитов. Если вы не обрабатываете эти сценарии, весь процесс останавливается или ломается.

Как обрабатывать успешные и неуспешные запросы в автоматизации?

В N8N есть встроенная логика обработки ошибок. Вы можете настроить отдельную ветку для случаев, когда запрос не выполнился.

Успешный запрос:
Данные получены, фильтры пройдены — элемент движется дальше: на транскрибацию, суммирование, запись в базу.

Неуспешный запрос:
Ошибка API, пустой ответ, таймаут. Вместо остановки сценария вы направляете ошибку в отдельный узел: логирование, уведомление, повторная попытка через время.

Для этого используется параметр Continue On Fail в узлах HTTP Request. Если запрос упал, данные передаются в ветку ошибок, а не останавливают весь сценарий.

Пример структуры:

Узел HTTP Request с Continue On Fail = true
Узел IF проверяет наличие данных
Если данные есть → фильтрация и обработка
Если данных нет → запись ошибки в таблицу или отправка уведомления

Это создаёт устойчивую систему, которая не ломается от единичных сбоев.

Как создать развилки в сценариях для обработки разных типов контента?

Не весь контент обрабатывается одинаково. Длинное видео требует транскрибации и суммирования. Средний формат может нуждаться только в извлечении ключевых моментов. Короткие ролики — исключаются.

Развилки позволяют направлять каждый тип контента по своему пути.

Пример структуры развилок:

Длительность > 20 минут → полная транскрибация + AI-суммирование + запись в AirTable
Длительность от 5 до 20 минут → транскрибация + краткое резюме
Длительность от 1 до 5 минут → только метаданные (название, дата, ссылка)
Длительность < 1 минуты → исключение

Каждая ветка — это отдельный узел IF или Switch, который проверяет параметр duration и направляет данные в нужный блок обработки.

Настройка транскрибации и суммирования для отфильтрованного контента

После того как фильтры отсекли shorts и нерелевантный материал, остаётся контент, который действительно стоит обрабатывать. Следующий этап — превратить видео в текст и структурированные данные.

Как настроить транскрибацию видео в автоматических системах?

Транскрибация — это преобразование аудиодорожки видео в текст. Для этого используются API-сервисы распознавания речи.

Логика подключения:

Из отфильтрованных данных извлекается ссылка на видео
Видео передаётся в сервис транскрибации (например, через API)
Сервис возвращает текстовую расшифровку
Текст передаётся дальше — на суммирование или сразу в базу

В N8N это реализуется через узел HTTP Request с POST-запросом к API транскрибации. Вы передаёте URL видео, получаете текст.

Как настроить транскрибацию с помощью SupaDupa?

SupaDupa — один из инструментов, который можно интегрировать для обработки аудио. Принцип тот же: вы отправляете запрос с параметрами (ссылка на файл, язык, формат вывода), получаете транскрипцию.

Важный момент: не все видео нужно транскрибировать полностью. Если ваша цель — мониторинг тем, достаточно извлечь ключевые фрагменты или создать краткое резюме.

Как автоматизировать суммирование видео с помощью AI?

После транскрибации текст можно передать в AI-модель для суммирования. Это сокращает объём данных и выделяет суть.

Логика:

Транскрипция передаётся в узел с AI-моделью (например, через API OpenAI или аналог)
В промпте вы задаёте задачу: «Создай краткое резюме на 3–5 предложений»
Модель возвращает сжатый текст
Резюме записывается в базу вместе с метаданными

Это особенно полезно, если вы мониторите десятки каналов: вместо часовых расшифровок вы получаете концентрированные инсайты.

Запись обработанных данных в AirTable

Финальный этап автоматизации — сохранение данных в структурированном виде. AirTable удобен тем, что сочетает гибкость таблиц и возможности базы данных.

Как подключить AirTable для записи данных из источников контента?

В N8N есть готовый узел AirTable. Вы подключаете его через API-ключ, выбираете базу и таблицу, настраиваете поля для записи.

Какие данные стоит сохранять:

Название видео
Ссылка
Дата публикации
Длительность
Транскрипция (если нужна)
Резюме от AI
Теги или категории (если вы их определяете автоматически)

Каждый элемент, прошедший через фильтры и обработку, становится строкой в таблице. Вы получаете актуальную базу контента конкурентов, структурированную и готовую к анализу.

Типичные ошибки при настройке фильтрации

Ошибка 1. Слишком жёсткие фильтры
Вы исключаете всё, что короче 10 минут, и теряете полезные форматы. Фильтры должны соответствовать вашим целям, а не абстрактным правилам.

Ошибка 2. Отсутствие обработки ошибок
Один сбой API — и весь сценарий встаёт. Всегда настраивайте ветку для неуспешных запросов.

Ошибка 3. Игнорирование статуса контента
Вы фильтруете по длительности, но не проверяете, завершён ли контент. В базу попадают анонсы трансляций без содержания.

Ошибка 4. Отсутствие логирования
Вы не знаете, сколько элементов отсеялось и почему. Добавьте узел записи статистики: сколько пришло, сколько прошло фильтры, сколько обработано.

Структурирование данных в автоматических системах

Фильтрация — это только начало. Данные, которые прошли проверку, нужно структурировать так, чтобы с ними можно было работать.

Принципы структурирования:

Единый формат: все даты в одном формате, все длительности в секундах или минутах
Категоризация: автоматическое присвоение тегов или категорий на основе ключевых слов
Приоритизация: пометка наиболее релевантных элементов (например, видео с высокой длительностью и свежей датой)
Связи: если вы мониторите несколько каналов, связывайте данные с источником

Это превращает поток данных в систему знаний.

Мониторинг контента конкурентов: от сбора к инсайтам

Автоматизация сбора и фильтрации — это не самоцель. Это инфраструктура для получения конкурентных преимуществ.

Что вы можете делать с отфильтрованными и структурированными данными:

Отслеживать темы, которые разбирают конкуренты
Видеть частоту публикаций и форматы
Анализировать, какие видео получают больше внимания (если подключаете метрики)
Извлекать идеи для собственного контента
Формировать гипотезы о трендах в нише

Всё это становится возможным, когда в вашей базе нет шума. Когда каждая запись — это релевантный материал, а не случайный shorts или анонс.

Итоговая архитектура сценария фильтрации

Соберём всё в единую картину. Ваш сценарий автоматизации с фильтрацией выглядит так:

1. Получение данных
Узел HTTP Request или RSS → API возвращает список элементов с метаданными.

2. Первичная фильтрация
Узел IF → проверка длительности и статуса контента. Отсечение shorts и незавершённого материала.

3. Развилки по типу контента
Узел Switch → распределение по веткам в зависимости от длительности или других параметров.

4. Обработка
Для каждой ветки — свой набор действий: транскрибация, суммирование, извлечение метаданных.

5. Обработка ошибок
Отдельная ветка для неуспешных запросов: логирование, уведомления, повторные попытки.

6. Запись в базу
Узел AirTable → сохранение обработанных данных в структурированном виде.

7. Логирование и статистика
Узел записи метрик: сколько элементов получено, отфильтровано, обработано, записано.

Эта архитектура масштабируется. Вы можете добавлять новые источники, новые фильтры, новые типы обработки — логика остаётся той же.

Когда фильтрация становится стратегией

Настройка фильтров — это не просто техническая задача. Это решение о том, какую информацию вы считаете ценной, а какую — шумом.

Каждый критерий фильтрации отражает ваше понимание ниши и целей. Если вы исключаете видео короче 5 минут — значит, вы ищете глубину. Если фильтруете по ключевым словам в названии — значит, вам важна тематическая точность.

Автоматизация без фильтрации — это иллюзия эффективности. Вы тратите ресурсы на сбор данных, которые всё равно придётся чистить вручную.

Фильтрация с первого узла — это осознанная автоматизация. Вы получаете только то, что можете использовать. И это меняет всё: от скорости принятия решений до качества стратегии.