Blajar crawling data dari twitter
Crawling adalah semacam pengambilan data dari media sosial kemudian di kumpulkan menjadi satu untuk di evakuasi dan di bentuk agar menjadi sebuah penelitian.
Thank you for reading this post, don't forget to subscribe!Prosesnya cukup mudah tergantung kamu ingin mengambil data dari sosial media mana. Misalkan kamu ingin crawling data dari twitter ada dua cara yaitu dengan menggunakan API dan tanpa API.
Data yang dapat kamu kumpulkan dapat berupa text, audio, video, dan gambar. Kamu dapat memulai dengan melakukan penambangan data pada API yang bersifat open source seperti yang disediakan oleh Twitter.
Mengenal Twint
selanjutnya kita menggunakan twint nah pasti banyak yang belom tahu apa itu twint, Twint adalah alat pengikis Twitter canggih yang ditulis dengan Python yang memungkinkan untuk mengambil data Tweet dari profil Twitter tanpa menggunakan API Twitter.
Twint mampu menarik data Tweet tanpa batas. Semangat pembuatan Twint lahir untuk mengakali terbatas dan mahalnya layanan Twitter API. Keampuhan Twint terletak pada kemampuannya menarik tweet dari berbagai model seperti akun, hastag, periode.
Keunggulan Twint
- Mudah Tak perlu pengaturan ribet seperti Twitter API karena dapat dilakukan sendiri dengan Python.
- Gratis dan Bebas Kuota Lisensi Twitter API termurah membatasi jumlah tweet hanya 3200. Dengan Twint, ambil data sebanyak-banyaknya tanpa biaya.
- Fleksibel Twint mampu mengambil tweet user spesifik, hashtag, hingga tweet yang muncul di periode tertentu.
- Terintegrasi Mudah dikonversi menjadi file yang bisa digunakan dengan infrastruktur analisis data lainnya.
Cara insatall Twint
Twint merupakan library yang berada di ekosistem Python. Ada beberapa cara menginstall Twint. Cara pertama adalah melalui terminal dengan kode:
Cara kedua adalah clone lewat Git dengan kode:
kalau pada saat import twint mengalami error mungkin bisa tambahkan code berikut ini, kemudian running lah.
Setelah menginstal twint tentunya belum bisa di jalankan karena kamu perlu menginportnya terlebih dahulu supaya twint bisa digunakan caranya cukup mudah masukan saja kode di bawah ini:
Tahap berikutnya Install Nest Asyncio dan lakukan Import
Nest Asyncio Secara opsional, loop spesifik yang perlu ditambal dapat diberikan sebagai argumen untuk diterapkan , jika tidak, loop peristiwa saat ini digunakan. Loop peristiwa dapat ditambal apakah sudah berjalan atau belum. Hanya loop acara dari asyncio yang dapat ditambal; Loop dari proyek lain, seperti uvloop atau quamash, umumnya tidak dapat ditambal.
Proses Ambil Data Twitter
Sudah import semuanya ? kini kamu tinggal menentukan data apa yang ingin di ambil. Kita ambil saja salah satu hastag yang sedang viral di twitter yaitu Kemudian running kode tersebut maka akan muncul semua data yang ada di twitter khusunya yang berhastag Kamu bisa juga mengeksport semua data tersebut ke csv. caranya kamu masukan kode di bawah ini untuk membuat tabelnya terlebih dahulu. Kemudian masukan kode di bawah ini untuk mengeksport ke dalam file berekstensi csv.
Jika kode berhasil di jalankan maka akan muncul hasil crowling dari twetter
0 Comments