EN PT ID

Pengarsipan Postingan Bluesky 2026: 5 Cara Menyimpan Postingan, Thread & Feed

14 Juni 2026 · 9 menit baca · oleh ThreadGrab

Bluesky telah tumbuh pesat sepanjang 2025 dan 2026, kini menampung jutaan pengguna aktif dan puluhan juta postingan publik setiap bulan. Baik Anda seorang jurnalis yang melacak berita terbaru, peneliti yang membangun kumpulan data media sosial, atau kreator konten yang menggunakan kembali thread Bluesky Anda sendiri untuk artikel panjang, Anda memerlukan cara yang andal untuk mengarsipkan konten Bluesky.

AT Protocol, yang mendukung Bluesky, bersifat terbuka dan terdesentralisasi secara desain. Ini berarti ada lebih banyak opsi pengarsipan daripada platform sosial besar lainnya. Panduan ini mencakup lima metode yang terbukti, dari bookmark bawaan hingga scraping firehose real-time, sehingga Anda dapat memilih yang sesuai dengan tingkat kenyamanan teknis dan alur kerja Anda.

Ringkasan. Gunakan bookmark bawaan Bluesky untuk penyimpanan kasual. Gunakan API HTTP AT Protocol untuk akses programatik tanpa autentikasi. Gunakan ThreadGrab untuk pengarsipan lintas platform (Bluesky + X dalam satu antarmuka). Gunakan Jetstream untuk data firehose real-time. Gunakan SDK atproto Python untuk skrip pengarsipan yang sepenuhnya khusus.

Mengapa Pengarsipan Bluesky Penting di 2026

Tiga tren membuat pengarsipan Bluesky sangat relevan tahun ini. Pertama, basis pengguna Bluesky telah melampaui 30 juta, menjadikannya platform percakapan publik terbesar ketiga setelah X dan Threads. Kedua, platform ini telah menjadi sumber utama untuk diskusi teknologi, jurnalisme, dan akademis -- komunitas yang meninggalkan X pada 2024-2025 beralih ke Bluesky dalam jumlah besar. Ketiga, desain terbuka AT Protocol berarti pengarsipan tidak hanya mungkin tetapi didorong: setiap postingan publik dapat diakses melalui API yang terdokumentasi tanpa memerlukan autentikasi untuk akses baca.

Tidak seperti X, yang membatasi akses API ke tingkat berbayar, AT Protocol Bluesky tetap sepenuhnya terbuka. Anda dapat mengambil timeline pengguna mana pun, thread postingan mana pun, atau konten feed mana pun dengan permintaan HTTP sederhana -- tanpa kunci API, tanpa akun pengembang, tanpa langganan bulanan. Ini menjadikan Bluesky platform sosial paling dapat diarsipkan di 2026.

Metode 1: Bookmark Bawaan Bluesky -- Penyimpanan Tanpa Usaha

Bookmark Native Bluesky

Tersedia di aplikasi Bluesky (web, iOS, Android) sejak pertengahan 2025.

Kelebihan: Tanpa pengaturan, pribadi, dapat dicari, berfungsi di semua perangkat, tanpa perlu keterampilan teknis.

Kekurangan: Tidak bisa diekspor, tanpa akses programatik, terbatas pada akun Anda sendiri, tanpa operasi batch.

Bluesky memperkenalkan bookmark native pada 2025, dan mereka bekerja persis seperti yang Anda harapkan. Klik ikon bookmark pada postingan mana pun, dan itu akan disimpan ke koleksi bookmark pribadi yang hanya terlihat oleh Anda. Bookmark dapat dicari di dalam aplikasi, dan Anda dapat mengaturnya ke dalam folder atau menggunakan daftar datar default.

Bookmark bagus untuk penggunaan kasual -- Anda melihat thread menarik di feed eksplorasi Anda, mem-bookmark-nya, dan kembali membacanya nanti. Tetapi mereka memiliki batasan penting: Anda tidak dapat mengekspor bookmark Anda sebagai data terstruktur. Jika Anda ingin mengkompilasi kumpulan data penelitian, bermigrasi ke platform lain, atau menjalankan analisis pada konten yang disimpan, Anda memerlukan salah satu metode di bawah ini.

Kapan menggunakan bookmark bawaan

Metode 2: API HTTP AT Protocol -- Pendekatan Terbuka Tanpa Autentikasi

Endpoint Publik AT Protocol

URL dasar: https://bsky.social/xrpc/ -- tidak perlu autentikasi untuk endpoint baca.

Kelebihan: Sepenuhnya gratis, tanpa perlu kunci API, terdokumentasi dengan baik, berfungsi dengan klien HTTP apa pun.

Kekurangan: Dibatasi rate (sekitar 5.000 permintaan per jam per IP), memerlukan keakraban dengan struktur data AT Protocol (CID, strong references).

AT Protocol menyediakan serangkaian API publik lengkap untuk membaca data. Anda dapat mengambil timeline pengguna mana pun, postingan individu, thread percakapan utuh, dan feed yang dikurasi -- semuanya dengan permintaan HTTP GET sederhana.

# Ambil timeline pengguna (30 postingan terakhir)
curl -s "https://bsky.social/xrpc/app.bsky.feed.getAuthorFeed?actor=bsky.app" \
  | jq '.feed[:3] | .[] | {author: .post.author.handle, text: .post.record.text}'

# Ambil postingan tertentu berdasarkan AT-URI
curl -s "https://bsky.social/xrpc/app.bsky.feed.getPostThread?uri=at://did:plc:.../app.bsky.feed.post/3lmp6q7q2hs2s" \
  | jq '.thread.post.record.text'

# Cari postingan berdasarkan kata kunci
curl -s "https://bsky.social/xrpc/app.bsky.feed.searchPosts?q=pengarsipan+Bluesky+2026&limit=25" \
  | jq '.posts[] | {author: .author.handle, text: .record.text}'

Konsep kunci dalam AT Protocol adalah AT-URI -- pengidentifikasi terdesentralisasi yang menunjuk ke catatan apa pun di jaringan. Setiap postingan, like, follow, dan feed memiliki AT-URI yang unik. Setelah Anda memiliki AT-URI atau DID (Pengidentifikasi Terdesentralisasi) pengguna, Anda dapat mengambil semua konten publik mereka tanpa autentikasi apa pun.

Batas rate cukup besar (sekitar 5.000 permintaan per jam per IP), yang cukup untuk pengarsipan pribadi dan proyek penelitian kecil. Untuk koleksi skala besar, Anda memerlukan Jetstream (Metode 4) atau firehose.

Kapan menggunakan API AT Protocol

Metode 3: ThreadGrab -- Pengarsipan Lintas Platform Bluesky + X

ThreadGrab

Situs web: threadgrab.com -- gratis, tanpa perlu akun.

Kelebihan: Antarmuka tunggal untuk pengarsipan Bluesky DAN X, API gratis, tanpa autentikasi, mengembalikan JSON terstruktur atau Markdown.

Kekurangan: Membutuhkan kenyamanan baris perintah, tidak menawarkan streaming firehose real-time (gunakan Jetstream untuk itu).

ThreadGrab dibangun untuk memecahkan masalah ini: Anda seharusnya tidak perlu alat yang berbeda untuk setiap platform sosial. API publik ThreadGrab mendukung postingan Bluesky melalui endpoint terbuka AT Protocol, memberikan format data terstruktur yang sama apakah Anda mengarsipkan thread X atau feed Bluesky.

# Ambil postingan terbaru pengguna Bluesky melalui ThreadGrab
curl -s "https://threadgrab.com/api/bluesky/profile/bsky.app" \
  | jq '.[:3] | .[] | {author: .author, text: .text[0:120]}'

# Simpan postingan Bluesky sebagai Markdown untuk input LLM
curl -s "https://threadgrab.com/api/bluesky/profile/bsky.app" \
  | jq -r '.[] | "## \\(.author)\\n\\n\\(.text)\\n---"' \
  > bluesky-archive-$(date +%Y-%m-%d).md

# Cari postingan Bluesky berdasarkan kata kunci
curl -s "https://threadgrab.com/api/bluesky/search?q=pengarsipan+AT+Protocol&limit=10" \
  | jq '.posts[] | {author: .author.handle, text: .text}'

Tidak seperti API mentah AT Protocol, ThreadGrab menormalkan format respons sehingga data Bluesky terlihat sama dengan data X. Ini memudahkan pembangunan pipeline pengarsipan tunggal yang menarik dari kedua platform. Outputnya adalah JSON bersih yang dapat Anda konversi ke Markdown, CSV, atau format lainnya.

ThreadGrab juga menangani resolusi AT-URI untuk Anda -- Anda tidak perlu memahami DID atau CID. Cukup berikan handle (misalnya, bsky.app) dan ThreadGrab meresolusi ke DID yang benar dan mengambil postingan.

Kapan menggunakan ThreadGrab

Metode 4: Jetstream -- Firehose Bluesky Real-Time

Jetstream

Dipelihara oleh Bluesky Social PBC. Endpoint WebSocket untuk firehose lengkap AT Protocol.

Kelebihan: Real-time, mencakup SEMUA postingan publik, ideal untuk kumpulan data penelitian dan analisis tren, tanpa batas rate.

Kekurangan: Membutuhkan klien WebSocket dan penyimpanan signifikan, berlebihan untuk pengarsipan pribadi, pengaturan kompleks untuk pemfilteran.

Jetstream adalah layanan firehose real-time untuk AT Protocol. Ini menyediakan stream WebSocket dari setiap peristiwa publik di jaringan Bluesky -- postingan, like, repost, follow, dan lainnya. Jika Anda membutuhkan kumpulan data lengkap aktivitas Bluesky (untuk penelitian, deteksi tren, atau analisis skala besar), Jetstream adalah alat yang tepat.

# Instal klien WebSocket dan terhubung ke Jetstream
pip install websocket-client

# Hubungkan dan tampilkan postingan baru ke stdout
python3 -c "
import json, websocket
ws = websocket.create_connection('wss://jetstream.atproto.tools/subscribe')
for _ in range(20):
    msg = json.loads(ws.recv())
    if msg.get('kind') == 'commit' and 'post' in str(msg):
        print(json.dumps(msg, indent=2)[:300])
ws.close()
"

Jetstream dipelihara oleh Bluesky Social PBC dan merupakan cara paling andal untuk mendapatkan data komprehensif. Stream biasanya mengirimkan 50-200 peristiwa per detik selama jam sibuk, sehingga Anda memerlukan backend penyimpanan yang kuat (database atau pipeline streaming) untuk mengonsumsinya secara bermakna. Untuk pengguna rata-rata yang ingin menyimpan beberapa thread menarik, Jetstream berlebihan -- tetapi bagi peneliti dan jurnalis data, ini sangat berharga.

Jetstream juga mendukung langganan terfilter: Anda dapat berlangganan DID atau jenis catatan tertentu, mengurangi volume data hanya pada yang Anda pedulikan.

Kapan menggunakan Jetstream

Metode 5: SDK atproto Python -- Skrip Pengarsipan Sepenuhnya Kustom

SDK atproto

pip install atproto -- SDK Python resmi dipelihara oleh Bluesky Social PBC.

Kelebihan: Cakupan API lengkap (autentikasi, ambil, posting, hapus), type-safe, terdokumentasi dengan baik, menangani resolusi DID dan percobaan ulang secara otomatis.

Kekurangan: Membutuhkan Python 3.9+, menambah dependensi ke proyek Anda, alur autentikasi dapat membingungkan bagi pemula.

SDK Python resmi untuk AT Protocol adalah cara paling lengkap untuk berinteraksi dengan Bluesky secara programatik. Ini mendukung dari operasi baca sederhana (mengambil timeline, mencari postingan) hingga operasi tulis (memposting, mem-bookmark, mengikuti) dan tugas admin (moderasi).

from atproto import Client, models

# Ambil postingan tanpa autentikasi (baca publik saja)
client = Client()
feed = client.get_author_feed(
    models.AppBskyFeedGetAuthorFeed.Params(
        actor='bsky.app',
        limit=10,
    )
)
for post in feed.feed:
    record = post.post.record
    print(f"@{post.post.author.handle}: {record.text[:100]}")

# Cari postingan berdasarkan kata kunci
results = client.app.bsky.feed.search_posts(
    models.AppBskyFeedSearchPosts.Params(
        q='pengarsipan Bluesky 2026',
        limit=20,
    )
)
for post in results.posts:
    print(f"[{post.author.handle}] {post.record.text[:120]}")

SDK menangani resolusi AT-URI, pemetaan DID-ke-handle, paginasi, dan backoff batas rate secara otomatis. Jika Anda membangun skrip pengarsipan kustom yang perlu andal untuk periode panjang (misalnya, cron job harian), SDK atproto adalah pilihan yang tepat dibandingkan panggilan HTTP mentah.

Untuk operasi terautentikasi (seperti mengambil bookmark Anda sendiri), Anda memerlukan kata sandi aplikasi dari halaman pengaturan Bluesky.

Kapan menggunakan SDK atproto

Perbandingan Berdampingan

Fitur Bookmark Bluesky API AT Protocol ThreadGrab Jetstream SDK atproto
Waktu setup 0 detik 2 menit (curl) 2 menit (curl) 10 menit (websocket) 5 menit (pip install)
Keterampilan teknis Tidak ada Rendah Rendah Sedang Sedang
Autentikasi diperlukan Ya (login) Tidak Tidak Tidak Opsional
Ekspor data Tidak Ya (JSON) Ya (JSON/MD) Ya (JSON) Ya (format apa pun)
Data real-time Tidak Tidak Tidak Ya (firehose) Tidak
Mendukung X juga Tidak Tidak Ya Tidak Tidak
Batch / massal Manual saja Dapat diskrip Dapat diskrip Stream otomatis Dapat diskrip
Output Markdown Tidak Via jq Dukungan native Via pemrosesan Via kode
Terbaik untuk Pembaca kasual Penggemar skrip Pengguna lintas platform Peneliti Pengembang Python

Membangun Pipeline Pengarsipan Lengkap

Berikut adalah bagaimana seorang jurnalis dapat menggabungkan metode-metode ini menjadi alur kerja pengarsipan Bluesky harian:

#!/bin/bash
# Pipeline pengarsipan Bluesky harian (berjalan jam 7 pagi via cron)
# Menggabungkan API ThreadGrab untuk pengarsipan profil + penyimpanan file

SOURCES=("bsky.app" "nytopinion.bsky.social" "techmeme.bsky.social")
OUTPUT_DIR="$HOME/bluesky-archive/$(date +%Y/%m)"
mkdir -p "$OUTPUT_DIR"

for handle in "${SOURCES[@]}"; do
  curl -s "https://threadgrab.com/api/bluesky/profile/$handle" \
    | jq -r '.[] | "### \\(.author)\\n\\(.text)\\n---"' \
    > "$OUTPUT_DIR/$handle.md"
  echo "Disimpan $handle: $(wc -l < "$OUTPUT_DIR/$handle.md") baris"
done

echo "Pengarsipan selesai untuk $(date +%Y-%m-%d)"

Pipeline ini berjalan setiap hari via cron, menyimpan file Markdown yang diatur berdasarkan tahun/bulan, dan menggunakan ThreadGrab untuk panggilan API karena menormalkan data Bluesky dan X ke dalam format yang sama. Jurnalis kemudian dapat mencari, menganalisis, atau memasukkan arsip ke LLM untuk peringkasan.

Tip profesional. Untuk fleksibilitas maksimal, gabungkan ThreadGrab untuk pengarsipan tingkat profil dengan SDK atproto untuk operasi terautentikasi (seperti mengambil bookmark Anda). ThreadGrab menangani normalisasi lintas platform; SDK memberi Anda kendali penuh saat Anda membutuhkannya.

Bagaimana ThreadGrab Cocok dalam Ekosistem Bluesky

ThreadGrab dirancang untuk menjembatani kesenjangan antara platform sosial. Meskipun AT Protocol Bluesky sangat terbuka, ia juga berbeda dari API platform lain. ThreadGrab mengabstraksi perbedaan-perbedaan tersebut: panggilan API yang sama yang mengambil thread X juga mengambil feed Bluesky, mengembalikan format terstruktur yang sama.

Ini penting karena jarang orang mengonsumsi konten hanya pada satu platform. Seorang jurnalis tipikal saat ini membaca X untuk berita terbaru, Bluesky untuk diskusi teknologi, dan LinkedIn untuk analisis industri. ThreadGrab memberi Anda satu titik masuk pengarsipan untuk dua platform percakapan publik yang paling penting.

Arsipkan thread Bluesky dan artikel X berdampingan -- tanpa akun, tanpa kunci API, tanpa pengaturan.

Coba ThreadGrab -- Pengarsip Media Sosial Gratis

FAQ

Apakah Bluesky memiliki bookmark bawaan?

Ya. Bluesky menambahkan bookmark native pada pertengahan 2025. Anda dapat mem-bookmark postingan apa pun dengan mengklik ikon bookmark. Bookmark bersifat pribadi dan dapat dicari di dalam akun Anda, tetapi tidak dapat diekspor sebagai data terstruktur.

Bisakah saya menggunakan API AT Protocol untuk menyimpan postingan Bluesky secara gratis?

Ya. AT Protocol memiliki API terbuka dengan batas rate yang tidak memerlukan kunci API. Anda dapat mengambil postingan, timeline pengguna, dan feed menggunakan permintaan HTTP GET sederhana ke endpoint publik.

Apakah ThreadGrab mendukung pengarsipan Bluesky?

Ya. ThreadGrab mendukung postingan Bluesky melalui API terbuka AT Protocol. Anda dapat menggunakan API ThreadGrab untuk mengambil thread dan profil Bluesky bersama dengan konten X melalui satu antarmuka, tanpa memerlukan akun atau kunci API.

Apa itu Jetstream dalam ekosistem Bluesky?

Jetstream adalah layanan firehose real-time untuk AT Protocol. Ini menyediakan stream WebSocket dari setiap peristiwa publik di seluruh jaringan Bluesky, menjadikannya ideal bagi peneliti yang membutuhkan kumpulan data yang komprehensif. Ini mengirimkan 50-200 peristiwa per detik selama jam sibuk.

Apakah ada SDK Python untuk AT Protocol?

Ya. SDK Python resmi adalah atproto (pip install atproto). SDK ini mendukung autentikasi, pengambilan timeline, pencarian postingan, pengelolaan bookmark, dan unggah media. SDK menangani resolusi DID, paginasi, dan backoff batas rate secara otomatis.

Metode pengarsipan Bluesky mana yang terbaik untuk persiapan data LLM?

ThreadGrab adalah opsi terbaik untuk alur kerja LLM karena menghasilkan Markdown atau JSON bersih secara langsung. API mentah AT Protocol dan SDK atproto keduanya memerlukan pemrosesan tambahan untuk mengonversi catatan ke format yang ramah LLM. Jetstream menyediakan volume terlalu banyak untuk jendela konteks LLM tanpa pemfilteran yang signifikan.

Pilih Metode Anda dan Mulai Mengarsipkan

Arsitektur terbuka Bluesky menjadikannya platform sosial yang paling dapat diarsipkan di 2026. Baik menggunakan bookmark bawaan untuk bacaan kasual, API AT Protocol untuk skrip ringan, ThreadGrab untuk pengarsipan lintas platform, Jetstream untuk penelitian komprehensif, atau SDK atproto untuk pipeline yang sepenuhnya kustom, ada metode yang sesuai dengan alur kerja Anda.

Wawasan utamanya adalah Anda tidak harus memilih hanya satu. Bookmark postingan menarik selama hari, jalankan ThreadGrab setiap malam untuk arsip profil, dan biarkan Jetstream berjalan di latar belakang jika Anda membutuhkan data real-time. Alat-alat ini gratis, terbuka, dan dirancang untuk bekerja bersama. Mulai dengan ThreadGrab untuk jalur tercepat menuju pipeline pengarsipan yang berfungsi.