EN PT ID

Arquivamento de Posts do Bluesky 2026: 5 Maneiras de Salvar Posts, Threads e Feeds

14 de Junho, 2026 · 9 min de leitura · por ThreadGrab

O Bluesky cresceu rapidamente ao longo de 2025 e 2026, agora hospedando milhões de usuários ativos e dezenas de milhões de posts públicos todos os meses. Seja você um jornalista acompanhando uma notícia de última hora, um pesquisador construindo um conjunto de dados de mídia social, ou um criador de conteúdo reaproveitando suas próprias threads do Bluesky para artigos longos, você precisa de uma maneira confiável de arquivar conteúdo do Bluesky.

O AT Protocol, que alimenta o Bluesky, é aberto e descentralizado por design. Isso significa que há mais opções de arquivamento do que em qualquer outra grande plataforma social. Este guia cobre cinco métodos comprovados, desde favoritos integrados até scraping firehose em tempo real, para que você possa escolher o que se encaixa no seu nível técnico e fluxo de trabalho.

Resumo. Use os favoritos integrados do Bluesky para salvamentos casuais. Use a API HTTP do AT Protocol para acesso programático sem autenticação. Use o ThreadGrab para arquivamento multiplataforma (Bluesky + X em uma interface). Use o Jetstream para dados firehose em tempo real. Use o SDK atproto Python para scripts de arquivamento totalmente personalizados.

Por Que o Arquivamento do Bluesky é Importante em 2026

Três tendências tornam o arquivamento do Bluesky particularmente relevante este ano. Primeiro, a base de usuários do Bluesky ultrapassou 30 milhões, tornando-se a terceira maior plataforma de conversação pública depois do X e Threads. Segundo, a plataforma se tornou uma fonte primária para debates de tecnologia, jornalismo e academia -- comunidades que deixaram o X em 2024-2025 migraram para o Bluesky em grande número. Terceiro, o design aberto do AT Protocol significa que arquivar não é apenas possível, mas incentivado: cada post público é acessível através de APIs documentadas sem necessidade de autenticação para acesso de leitura.

Ao contrário do X, que restringiu o acesso à API a níveis pagos, o AT Protocol do Bluesky permanece completamente aberto. Você pode buscar a timeline de qualquer usuário, a thread de qualquer post, ou o conteúdo de qualquer feed com simples requisições HTTP -- sem chave de API, sem conta de desenvolvedor, sem assinatura mensal. Isso torna o Bluesky a plataforma social mais arquivável em 2026.

Método 1: Favoritos Integrados do Bluesky -- O Salvamento Sem Esforço

Favoritos Nativos do Bluesky

Disponível no aplicativo Bluesky (web, iOS, Android) desde meados de 2025.

Pros: Zero configuração, privado, pesquisável, funciona em qualquer dispositivo, sem necessidade de habilidades técnicas.

Cons: Sem capacidade de exportação, sem acesso programático, limitado à sua própria conta, sem operações em lote.

O Bluesky introduziu favoritos nativos em 2025, e eles funcionam exatamente como você esperaria. Clique no ícone de favorito em qualquer post, e ele é salvo em uma coleção privada de favoritos visível apenas para você. Os favoritos são pesquisáveis dentro do aplicativo, e você pode organizá-los em pastas ou usar a lista plana padrão.

Favoritos são ótimos para uso casual -- você vê uma thread interessante no seu feed de descoberta, favorita, e volta para ler depois. Mas eles têm um limite importante: você não pode exportar seus favoritos como dados estruturados. Se você quiser compilar um conjunto de dados de pesquisa, migrar para outra plataforma, ou executar análise em conteúdo salvo, precisa de um dos métodos abaixo.

Quando usar favoritos integrados

Método 2: API HTTP do AT Protocol -- A Abordagem Aberta e Sem Autenticação

Endpoints Públicos do AT Protocol

URL base: https://bsky.social/xrpc/ -- sem autenticação necessária para endpoints de leitura.

Pros: Completamente gratuito, sem necessidade de chave de API, bem documentado, funciona com qualquer cliente HTTP.

Cons: Limitado por taxa (aproximadamente 5.000 requisições por hora por IP), requer familiaridade com estruturas de dados do AT Protocol (CIDs, strong references).

O AT Protocol expõe um conjunto completo de APIs públicas para leitura de dados. Você pode buscar a timeline de qualquer usuário, qualquer post individual, threads de conversa inteiras e feeds curados -- tudo com simples requisições HTTP GET.

# Buscar a timeline de um usuário (últimos 30 posts)
curl -s "https://bsky.social/xrpc/app.bsky.feed.getAuthorFeed?actor=bsky.app" \
  | jq '.feed[:3] | .[] | {author: .post.author.handle, text: .post.record.text}'

# Buscar um post específico por AT-URI
curl -s "https://bsky.social/xrpc/app.bsky.feed.getPostThread?uri=at://did:plc:.../app.bsky.feed.post/3lmp6q7q2hs2s" \
  | jq '.thread.post.record.text'

# Pesquisar posts por palavra-chave
curl -s "https://bsky.social/xrpc/app.bsky.feed.searchPosts?q=arquivar+Bluesky+2026&limit=25" \
  | jq '.posts[] | {author: .author.handle, text: .record.text}'

O conceito chave no AT Protocol é a AT-URI -- um identificador descentralizado que aponta para qualquer registro na rede. Cada post, like, follow e feed tem uma AT-URI única. Depois de ter a AT-URI ou DID (Identificador Descentralizado) de um usuário, você pode buscar todo o seu conteúdo público sem qualquer autenticação.

Os limites de taxa são generosos (cerca de 5.000 requisições por hora por IP), o que é suficiente para arquivamento pessoal e pequenos projetos de pesquisa. Para coleta em larga escala, você precisa do Jetstream (Método 4) ou do firehose.

Quando usar a API do AT Protocol

Método 3: ThreadGrab -- Arquivamento Multiplataforma Bluesky + X

ThreadGrab

Website: threadgrab.com -- gratuito, sem necessidade de conta.

Pros: Interface única para arquivamento Bluesky E X, API gratuita, sem autenticação necessária, retorna JSON estruturado ou Markdown.

Cons: Requer conforto com linha de comando, não oferece streaming firehose em tempo real (use Jetstream para isso).

O ThreadGrab foi construído para resolver exatamente este problema: você não deveria precisar de uma ferramenta diferente para cada plataforma social. A API pública do ThreadGrab suporta posts do Bluesky através dos endpoints abertos do AT Protocol, dando a você o mesmo formato de dados estruturados, esteja você arquivando uma thread do X ou um feed do Bluesky.

# Buscar posts recentes de um usuário Bluesky via ThreadGrab
curl -s "https://threadgrab.com/api/bluesky/profile/bsky.app" \
  | jq '.[:3] | .[] | {author: .author, text: .text[0:120]}'

# Salvar posts Bluesky como Markdown para input LLM
curl -s "https://threadgrab.com/api/bluesky/profile/bsky.app" \
  | jq -r '.[] | "## \\(.author)\\n\\n\\(.text)\\n---"' \
  > bluesky-archive-$(date +%Y-%m-%d).md

# Pesquisar posts Bluesky por palavra-chave
curl -s "https://threadgrab.com/api/bluesky/search?q=arquivamento+AT+Protocol&limit=10" \
  | jq '.posts[] | {author: .author.handle, text: .text}'

Ao contrário da API bruta do AT Protocol, o ThreadGrab normaliza o formato de resposta para que os dados do Bluesky pareçam iguais aos dados do X. Isso facilita a construção de um único pipeline de arquivamento que extrai de ambas as plataformas. A saída é JSON limpo que você pode converter para Markdown, CSV, ou qualquer outro formato.

O ThreadGrab também lida com a resolução de AT-URI para você -- você não precisa entender DIDs ou CIDs. Basta fornecer um handle (ex: bsky.app) e o ThreadGrab o resolve para o DID correto e busca os posts.

Quando usar o ThreadGrab

Método 4: Jetstream -- Firehose do Bluesky em Tempo Real

Jetstream

Mantido pela Bluesky Social PBC. Endpoint WebSocket para o firehose completo do AT Protocol.

Pros: Tempo real, cobre TODOS os posts públicos, ideal para conjuntos de dados de pesquisa e análise de tendências, sem limites de taxa.

Cons: Requer cliente WebSocket e armazenamento significativo, exagerado para arquivamento pessoal, configuração complexa para filtragem.

Jetstream é o serviço firehose em tempo real para o AT Protocol. Ele fornece um stream WebSocket de cada evento público na rede Bluesky -- posts, likes, reposts, follows e mais. Se você precisa de um conjunto de dados completo da atividade do Bluesky (para pesquisa, detecção de tendências, ou análise em larga escala), o Jetstream é a ferramenta certa.

# Instalar um cliente WebSocket e conectar ao Jetstream
pip install websocket-client

# Conectar e exibir novos posts no stdout
python3 -c "
import json, websocket
ws = websocket.create_connection('wss://jetstream.atproto.tools/subscribe')
for _ in range(20):
    msg = json.loads(ws.recv())
    if msg.get('kind') == 'commit' and 'post' in str(msg):
        print(json.dumps(msg, indent=2)[:300])
ws.close()
"

O Jetstream é mantido pela Bluesky Social PBC e é a maneira mais confiável de obter dados abrangentes. O stream normalmente entrega 50-200 eventos por segundo durante horários de pico, então você precisa de um backend de armazenamento robusto (banco de dados ou pipeline de streaming) para consumi-lo de forma significativa. Para o usuário médio que quer salvar algumas threads interessantes, o Jetstream é exagerado -- mas para pesquisadores e jornalistas de dados, é inestimável.

O Jetstream também suporta assinaturas filtradas: você pode se inscrever em DIDs ou tipos de registro específicos, reduzindo o volume de dados apenas ao que você se importa.

Quando usar o Jetstream

Método 5: SDK atproto Python -- Scripts de Arquivamento Totalmente Personalizados

SDK atproto

pip install atproto -- SDK Python oficial mantido pela Bluesky Social PBC.

Pros: Cobertura completa da API (autenticação, busca, postagem, exclusão), type-safe, bem documentado, lida com resolução DID e retries automaticamente.

Cons: Requer Python 3.9+, adiciona uma dependência ao seu projeto, fluxo de autenticação pode ser confuso para iniciantes.

O SDK Python oficial para o AT Protocol é a maneira mais completa de interagir com o Bluesky programaticamente. Ele suporta desde operações simples de leitura (buscar timelines, pesquisar posts) até operações de escrita (postar, favoritar, seguir) e tarefas de administração (moderação).

from atproto import Client, models

# Buscar posts sem autenticação (leitura pública apenas)
client = Client()
feed = client.get_author_feed(
    models.AppBskyFeedGetAuthorFeed.Params(
        actor='bsky.app',
        limit=10,
    )
)
for post in feed.feed:
    record = post.post.record
    print(f"@{post.post.author.handle}: {record.text[:100]}")

# Pesquisar posts por palavra-chave
results = client.app.bsky.feed.search_posts(
    models.AppBskyFeedSearchPosts.Params(
        q='arquivamento Bluesky 2026',
        limit=20,
    )
)
for post in results.posts:
    print(f"[{post.author.handle}] {post.record.text[:120]}")

O SDK lida com resolução AT-URI, mapeamento DID-para-handle, paginação e backoff de limite de taxa automaticamente. Se você está construindo um script de arquivamento personalizado que precisa ser confiável por longos períodos (ex: um cron job diário), o SDK atproto é a escolha certa em vez de chamadas HTTP brutas.

Para operações autenticadas (como buscar seus próprios favoritos), você precisa de uma senha de aplicativo da página de configurações do Bluesky.

Quando usar o SDK atproto

Comparação Lado a Lado

Funcionalidade Favoritos Bluesky API AT Protocol ThreadGrab Jetstream SDK atproto
Tempo de setup 0 segundos 2 minutos (curl) 2 minutos (curl) 10 minutos (websocket) 5 minutos (pip install)
Habilidade técnica Nenhuma Baixa Baixa Média Média
Autenticação necessária Sim (logado) Não Não Não Opcional
Exportação de dados Não Sim (JSON) Sim (JSON/MD) Sim (JSON) Sim (qualquer formato)
Dados em tempo real Não Não Não Sim (firehose) Não
Suporta X também Não Não Sim Não Não
Lote / lote Manual apenas Scriptável Scriptável Stream automático Scriptável
Saída Markdown Não Via jq Suporte nativo Via processamento Via código
Melhor para Leitores casuais Entusiastas de script Usuários multiplataforma Pesquisadores Desenvolvedores Python

Construindo um Pipeline de Arquivamento Completo

Aqui está como um jornalista pode combinar esses métodos em um fluxo de trabalho diário de arquivamento do Bluesky:

#!/bin/bash
# Pipeline diário de arquivamento Bluesky (executa às 7 AM via cron)
# Combina API ThreadGrab para arquivamento de perfis + armazenamento em arquivos

SOURCES=("bsky.app" "nytopinion.bsky.social" "techmeme.bsky.social")
OUTPUT_DIR="$HOME/bluesky-archive/$(date +%Y/%m)"
mkdir -p "$OUTPUT_DIR"

for handle in "${SOURCES[@]}"; do
  curl -s "https://threadgrab.com/api/bluesky/profile/$handle" \
    | jq -r '.[] | "### \\(.author)\\n\\(.text)\\n---"' \
    > "$OUTPUT_DIR/$handle.md"
  echo "Salvo $handle: $(wc -l < "$OUTPUT_DIR/$handle.md") linhas"
done

echo "Arquivamento completo para $(date +%Y-%m-%d)"

Este pipeline é executado diariamente via cron, salva arquivos Markdown organizados por ano/mês, e usa o ThreadGrab para as chamadas de API porque ele normaliza dados do Bluesky e X no mesmo formato. O jornalista pode então pesquisar, analisar, ou alimentar o arquivo em um LLM para sumarização.

Dica profissional. Para máxima flexibilidade, combine o ThreadGrab para arquivamento em nível de perfil com o SDK atproto para operações autenticadas (como buscar seus favoritos). O ThreadGrab lida com a normalização multiplataforma; o SDK dá a você controle total quando precisar.

Como o ThreadGrab se Encaixa no Ecossistema Bluesky

O ThreadGrab foi projetado para preencher a lacuna entre plataformas sociais. Embora o AT Protocol do Bluesky seja maravilhosamente aberto, ele também é diferente da API de todas as outras plataformas. O ThreadGrab abstrai essas diferenças: a mesma chamada de API que busca uma thread do X também busca um feed do Bluesky, retornando o mesmo formato estruturado.

Isso é importante porque poucas pessoas consomem conteúdo em apenas uma plataforma. Um jornalista típico hoje lê X para notícias de última hora, Bluesky para debates de tecnologia, e LinkedIn para análise do setor. O ThreadGrab oferece um único ponto de entrada de arquivamento para as duas plataformas de conversação pública mais importantes.

Arquive threads do Bluesky e artigos do X lado a lado -- sem conta, sem chave de API, sem configuração.

Experimente ThreadGrab -- Arquivador Social Gratuito

FAQ

O Bluesky tem favoritos integrados?

Sim. O Bluesky adicionou favoritos nativos em meados de 2025. Você pode favoritar qualquer post clicando no ícone de favorito. Os favoritos são privados e pesquisáveis dentro da sua conta, mas não podem ser exportados como dados estruturados.

Posso usar a API do AT Protocol para salvar posts do Bluesky gratuitamente?

Sim. O AT Protocol tem uma API aberta com limite de taxa que não requer chave de API. Você pode buscar posts, timelines de usuários e feeds usando requisições HTTP GET simples para endpoints públicos.

O ThreadGrab suporta arquivamento do Bluesky?

Sim. O ThreadGrab suporta posts do Bluesky através da API aberta do AT Protocol. Você pode usar a API do ThreadGrab para buscar threads e perfis do Bluesky junto com conteúdo do X através de uma única interface, sem necessidade de conta ou chave de API.

O que é Jetstream no ecossistema Bluesky?

Jetstream é um serviço firehose em tempo real para o AT Protocol. Ele fornece um stream WebSocket de cada evento público em toda a rede Bluesky, sendo ideal para pesquisadores que precisam de conjuntos de dados abrangentes. Ele entrega 50-200 eventos por segundo durante horários de pico.

Existe um SDK Python para o AT Protocol?

Sim. O SDK Python oficial é atproto (pip install atproto). Ele suporta autenticação, busca de timelines, pesquisa de posts, gerenciamento de favoritos e upload de mídia. Ele lida com resolução DID, paginação e backoff de limite de taxa automaticamente.

Qual método de arquivamento do Bluesky é melhor para preparação de dados LLM?

O ThreadGrab é a melhor opção para fluxos de trabalho LLM porque produz Markdown ou JSON limpo diretamente. A API bruta do AT Protocol e o SDK atproto ambos requerem processamento adicional para converter registros em formatos amigáveis para LLM. O Jetstream fornece volume demais para janelas de contexto LLM sem filtragem significativa.

Escolha Seu Método e Comece a Arquivar

A arquitetura aberta do Bluesky o torna a plataforma social mais arquivável em 2026. Seja usando favoritos integrados para leitura casual, a API do AT Protocol para scripts leves, o ThreadGrab para arquivamento multiplataforma, o Jetstream para pesquisa abrangente, ou o SDK atproto para pipelines totalmente personalizados, existe um método que se encaixa no seu fluxo de trabalho.

A principal conclusão é que você não precisa escolher apenas um. Favorite posts interessantes durante o dia, execute o ThreadGrab à noite para arquivos de perfil, e mantenha o Jetstream rodando em segundo plano se precisar de dados em tempo real. As ferramentas são gratuitas, abertas e projetadas para trabalhar juntas. Comece com o ThreadGrab para o caminho mais rápido até um pipeline de arquivamento funcional.