Data Mining Twitter : Setting Crawling Twitter dengan R

Crawling data twitter pada dasarnya adalah proses pengambilan data tweet, profil, geografi, dan lainya untuk maksud analisis tertentu. Umumnya terdapat beberapa package yang didapat digunakan untuk crawling data Twitter. Namun orang lebih umum menggunakan TwitteR. Tutorial yang paling mudah hingga expert pun banyak bertebaran di internet.

Tahapan yang dilalui untuk menarik data twitter terhitung mudah. Bagian tersulit adalah proses celaning data, dan analisis. Berikut adalah tahapannya :

  1. Install dan Pasang Package TwitteR

    Install dan pasang package R dengan syntax sebagai berikut :

    > install.packages(“TwitteR”)

    > library(“twitteR”, lib.loc=”~/R/win-library/3.3″)

  2. Setup API di R

    Setelah mendapatkan kode dalam app. twitter berupa API, API secret, token, dan token secret, pasangkan kode itu dalam variabel. Setelahya, jalankan keempat kode itu dengan memanggil setup_twitter_oauth.

    > api <- “tulis api kode”

    > apis <- “tulis api secret”

    > token<- “tulis token”

    > tokens<- “tulis token secret”

    setup_twitter_oauth(api,apis,token,tokens)

  3. Crawling Data Twitter

Sekarang kita sudah bisa menarik data twitter. Sebagai contoh, saya akan menarik data dengan hastag #FlatEarth, secara default data akan terambil sebanyak 25.

Dalam proses ini bisa ditambah juga range waktu dan jumlah tweet, namun perlu diingat twiter punya limit dalam pengambilan data. Untuk eksplorasi berbagai macam data di twitter akan saya bahas di artikel selanjutnya.

Leave a Reply

Your email address will not be published. Required fields are marked *