Продается специализированный датасет Telegram-каналов и групп категории "Бизнес и стартапы" за июнь 2026 года. Это глубоко очищенная, отфильтрованная и обогащенная с помощью искусственного интеллекта база данных. Все 51 736 ресурсов (41 708 каналов и 10 028 групп) классифицированы и имеют строго присвоенную категорию. Часть записей содержит географическую привязку к странам и городам. Идеальное решение для разработчиков бизнес-сервисов, Data Scientist´ов, арбитражных команд (CPA/Media Buying) и профессиональных маркетологов, работающих с B2B-аудиторией.
База прошла полную валидацию в июне 2026 года и полностью очищена от неактивных и удаленных ссылок. Обратите внимание: из-за динамики самой платформы Telegram минимальная часть ресурсов со временем может быть заблокирована или удалена администраторами.
МАСШТАБЫ ДАТАСЕТА
* Всего валидных записей (строк): 51 736
* Telegram-каналы (Channels): 41 708
* Telegram-группы/чаты (Groups): 10 028
ГЕО-СТАТИСТИКА БАЗЫ
В датасете присутствует сегмент данных с географической привязкой. Для части ресурсов точно определены и указаны страны и города. Локации верифицированы с максимальной точностью.
СВЕРХЦЕННОСТЬ И ИИ-РАЗМЕТКА (15 СТРУКТУРИРОВАННЫХ ПОЛЕЙ)
Вы получаете полностью готовый датасет. Больше не нужно тратить бюджеты на API нейросетей для анализа контента. В выгрузке заполнены следующие поля:
1. name — Юзернейм
2. link — Прямая ссылка (включая приватные и инвайт-ссылки формата joinchat и t.me/+abcd1234efg)
3. title — Название объекта
4. type — Тип (channel / group)
5. category — Категория на английском (более 45 направлений, присвоена каждому объекту)
6. category_ru — Тематика на русском (более 45 направлений, присвоена каждому объекту)
7. subs — Точное число подписчиков
8. language — Язык контента
9. country — Страна (для записей, где удалось точно определить)
10. city — Город (для записей, где удалось точно определить)
11. ai_description — Сгенерированное ИИ краткое описание сути контента
12. tags — Сгенерированные ИИ тематические теги для узкой фильтрации
13. description — Исходное био канала
14. unsafe — Флаг безопасности (true/false) для моментального отсева скама, шок-контента и эротики и взрослого контента
15. parsed_at — Точная метка времени парсинга/обновления
ФОРМАТЫ ВЫГРУЗКИ
Данные поставляются в удобном zip-архиве и подготовлены как для обычных пользователей, так и для программистов.
1. Для маркетологов и аналитиков (Форматы CSV и XLSX):
* CSV: База разделена на файлы (разделитель ;, кодировка UTF-8). Легко открывается в Excel, доступны фильтры и поиск по ключам, тегам или подписчикам.
* XLSX (Excel): Файлы оптимизированы под Excel, разбиты на логические вкладки, содержат готовое форматирование и закрепленные шапки для работы «из коробки».
2. Для разработчиков (Форматы JSONL):
* JSON Lines (.jsonl): Построчный формат для быстрого импорта в скрипты, Elasticsearch, MongoDB или PostgreSQL без нагрузки на оперативную память.
⠀
Ссылка на демо-файл (семпл на 50 строк):
https://vk.cc/cYS7Pi
⠀
Ссылка на список всех категорий:
https://vk.cc/cYQpZn