Продается фундаментальный структурированный датасет Telegram-каналов и групп за июнь 2026 года. Это глубоко очищенная, отфильтрованная и обогащенная с помощью искусственного интеллекта база данных.
Абсолютно все каналы и группы в датасете классифицированы и имеют строго присвоенную категорию.
Идеальное решение для разработчиков (под запуск аналогов TGStat/Telemetr), Data Scientist´ов, крупных арбитражных команд (CPA/Media Buying) и профессиональных маркетологов.
База прошла полную валидацию в июне 2026 года и полностью очищена от неактивных и удаленных ссылок. Обратите внимание: из-за динамики самой платформы Telegram минимальная часть ресурсов со временем может быть заблокирована или удалена администраторами.
МАСШТАБЫ ДАТАСЕТА
* Всего валидных записей (строк): 1 946 977
* Telegram-каналы (Channels): 1 579 133
* Telegram-группы/чаты (Groups): 367 844
ГЕО-СТАТИСТИКА БАЗЫ (297 868 строк с гарантированным таргетингом ДО ГОРОДА)
В датасет включен уникальный сегмент данных, где для каждого ресурса на 100% точно определен и указан конкретный ГОРОД (а не просто страна). Локации верифицированы с максимальной точностью. Топ среди подтвержденных городов и стран:
* 🇷🇺 Россия (с глубокой разбивкой по городам РФ): 135 448 каналов | 21 235 групп (каждый канал/группа имеет привязку к конкретному городу; остальная часть РФ-сегмента без явных городских маркеров находится в общем глобальном списке)
* 🌍 Иран (Iran, с разбивкой по городам): 39 519 каналов | 3 253 групп
* 🌍 Узбекистан (Uzbekistan, с разбивкой по городам): 13 018 каналов | 8 082 групп
* ... а также десятки других стран, где у каждого из 297 868 каналов и чатов гарантированно прописан конкретный город.
СВЕРХЦЕННОСТЬ И ИИ-РАЗМЕТКА (15 СТРУКТУРИРОВАННЫХ ПОЛЕЙ)
Вы получаете полностью готовый датасет. Больше не нужно тратить бюджеты на API нейросетей для анализа контента. В выгрузке заполнены следующие поля:
1. name — Юзернейм
2. link — Прямая ссылка (включая приватные и инвайт-ссылки формата joinchat и t.me/+abcd1234efg)
3. title — Название объекта
4. type — Тип (channel / group)
5. category — Категория на английском (более 45 направлений, присвоена каждому объекту)
6. category_ru — Тематика на русском (более 45 направлений, присвоена каждому объекту)
7. subs — Точное число подписчиков
8. language — Язык контента
9. country — Страна (только которые удалось точно определить)
10. city — Город (только которые удалось точно определить)
11. ai_description — Сгенерированное ИИ краткое описание сути контента
12. tags — Сгенерированные ИИ тематические теги для узкой фильтрации
13. description — Исходное био канала
14. unsafe — Флаг безопасности (true/false) для моментального отсева скама, шок-контента и эротики и взрослого контента
15. parsed_at — Точная метка времени парсинга/обновления
ФОРМАТЫ ВЫГРУЗКИ
Данные поставляются в удобном zip-архиве и подготовлены как для обычных пользователей, так и для программистов.
1. Для маркетологов и аналитиков (Форматы CSV и XLSX):
* CSV: База разделена на файлы (разделитель ;, кодировка UTF-8). Легко открывается в Excel, доступны фильтры и поиск по ключам, тегам или подписчикам.
* XLSX (Excel): Файлы оптимизированы под Excel, разбиты на логические вкладки, содержат готовое форматирование и закрепленные шапки для работы «из коробки».
2. Для разработчиков (Форматы SQLite и JSONL):
* SQLite (.db): Единый файл на 2 млн строк. Выборки за 1 секунду через SQL-запросы.
* JSON Lines (.jsonl): Построчный формат для быстрого импорта в скрипты, Elasticsearch, MongoDB или PostgreSQL без нагрузки на оперативную память.
⠀
Ссылка на демо-файл (семпл на 50 строк):
https://vk.cc/cYS7Pi
⠀
Ссылка на полную статистику по ГЕО и по категориям:
https://vk.cc/cYQpZn