Scraper Twitter (X) avec Apify : tweets, profils, recherches
Depuis qu'X a verrouillé son API (100$/mois minimum), Apify est la solution la plus abordable pour scraper tweets, profils et recherches à grande échelle. Dans ce guide, je te montre les acteurs Apify à utiliser selon ton objectif, combien ça coûte vraiment à l'usage, les cas d'usage rentables que j'ai testés en production, et comment brancher ça à un pipeline récurrent via Claude Code ou n8n. Tu pourras lancer ton premier scrape Twitter / X dans les 10 minutes qui suivent.
L'outil
Apify : le standard pour scraper Twitter / X
5$ de crédits gratuits par mois. Proxy résidentiel inclus. Acteurs officiels maintenus.
Créer un compte Apify →Pourquoi Apify est la meilleure façon de scraper Twitter / X
Twitter / X investit des millions chaque année pour empêcher le scraping. IPs bannies, rate limits agressifs, CAPTCHAs, rotations de DOM, détections headless. Un script Playwright maison tient en moyenne 2 à 4 semaines avant de casser. Apify gère tout ça pour toi : proxy résidentiel rotaté, sessions persistantes, bypass anti-bot maintenu en continu par une équipe dédiée.
L'autre avantage, c'est la marketplace d'acteurs. Au lieu d'écrire un scraper Twitter / X from scratch, tu réutilises des scrapers maintenus par la communauté ou par Apify eux-mêmes, avec des milliers d'heures de debug déjà derrière. Tu paies au résultat, tu ne maintiens rien.
Pour un aperçu complet de la plateforme, voir mon avis détaillé sur Apify. Pour l'intégration technique dans Claude Code, le guide API + MCP.
Les acteurs Apify à connaître pour Twitter / X
apidojo/tweet-scraper
Lightning-fast search, URL et profil. 30-80 tweets/s. 48K utilisations.
apidojo/twitter-scraper-lite
Version light low-cost pour volumes modérés.
kaitoeasyapi/twitter-x-api-search
Recherche full-text, threads et reposts.
apidojo/twitter-user-scraper
Récupérer les followers/following d'un profil.
Combien ça coûte de scraper Twitter / X avec Apify ?
Environ 0,25$ pour 1 000 tweets sur l'acteur le plus économique, 0,40$ sur apidojo. Avec le plan gratuit Apify (5$ de crédits par mois, sans carte), tu peux lancer tes premiers scrapes de validation. Dès que tu industrialises, le plan Starter à 49$/mois te donne 49$ de crédits mensuels utilisables sur n'importe quel acteur.
Compare ces ordres de grandeur à ce que te coûterait de maintenir ton propre scraper maison : développement initial (2-4 semaines dev), maintenance (1 jour par mois minimum), proxy résidentiel (50-200$/mois), infra cloud. Apify est imbattable sur le ROI pour tout ce qui sort du one-shot trivial.
Cas d'usage rentables pour scraper Twitter / X
- Veille de marque : scraper les mentions de ta marque ou de tes concurrents pour détecter les crises et les signaux positifs.
- Research produit : extraire tous les tweets d'une niche ciblée pour identifier les complaintes récurrentes (opportunités produit).
- Thread mining : scraper les threads les plus likés d'un auteur pour reverse-engineer les formats qui performent.
- Listes de prospects : scraper les followers d'un compte cible qualifié pour sourcer des leads.
Ces cas d'usage sont ceux que j'ai testés moi-même ou vus passer chez des clients LE LABO IA. La clé c'est toujours la même : la donnée brute n'a aucune valeur, c'est ce que tu en fais (enrichissement LLM, alertes automatisées, décisions produit) qui la transforme en revenus.
Pipeline type : de l'acteur Apify à la valeur business
- Prototypage dans Claude Code : brancher le MCP Apify, tester l'acteur Twitter / X en langage naturel, valider le format de sortie.
- Script Node ou Python généré par Claude qui appelle l'API Apify avec les bons paramètres, stocke le JSON dans Supabase ou un CSV.
- Enrichissement LLM : pipe le dataset vers GPT-4.1 ou Claude pour clusteriser, scorer ou résumer chaque item.
- Automatisation n8n : schedule cron, trigger webhook ou événement, envoi Slack / CRM / dashboard.
Cette architecture me permet de tenir plusieurs pipelines Twitter / X en production pour des clients LE LABO IA sans quasi aucune maintenance. C'est ce type de système que j'enseigne dans le programme.
Conformité et bonnes pratiques
Trois règles que je respecte systématiquement quand je scrape Twitter / X en production :
- Rate limit raisonnable : même si Apify gère la rotation de proxy, éviter les runs massifs concentrés sur quelques minutes. Espace tes collectes dans le temps.
- RGPD pour tout ce qui est personnel : base légale claire (intérêt légitime B2B en général), information des personnes dès le premier contact, opt-out simple.
- Pas de revente brute : la donnée scrapée t'appartient en usage interne, mais revendre un dataset brut tombe souvent sous le coup des CGU et du droit d'auteur (base de données sui generis en Europe).
Passe à l'action avec LE LABO IA
Apprends à construire des pipelines de scraping + IA rentables, du proto à la production. +110 entrepreneurs accompagnés.
Découvrir le programme →Questions fréquentes
Cela dépend de ton objectif. apidojo/tweet-scraper : Lightning-fast search, URL et profil. 30-80 tweets/s. 48K utilisations. apidojo/twitter-scraper-lite : Version light low-cost pour volumes modérés. kaitoeasyapi/twitter-x-api-search : Recherche full-text, threads et reposts.
Environ 0,25$ pour 1 000 tweets sur l'acteur le plus économique, 0,40$ sur apidojo. Avec le plan gratuit Apify (5$/mois), tu as déjà de quoi faire tes premiers tests.
Scraper des données publiques reste globalement licite, mais les CGU de Twitter / X interdisent formellement le scraping. Attention au RGPD pour les données personnelles. Apify fournit la technique, la responsabilité juridique te revient.
Oui. Apify supporte les schedules cron et l'intégration avec n8n, Make ou Zapier. Tu peux aussi appeler l'API depuis Claude Code pour industrialiser.