Tag: Statistics
-

Mengganti missing data (NA) menjadi 0 dalam R
—
Data yang kita miliki kadang hilang, dan tertulis NA dalam data.frame. Kelemahannya adalah data tersebut tidak bisa diolah dengan baik. Solusinya adalah dengan mengganti NA menjadi number, contohnya angka 0. Caranya ternyata tidak begitu sulit. Berikut adalah contoh syntaxnya : y<-c(1,NA,3,0,NA) > y [1] 1 NA 3 0 NA y[is.na(y)]<-0 > y [1] 1 6…
-

Vector dalam R
—
Terdapat empat buah mode vektor dalam R, yaitu ‘logical’, ‘numeric’, ‘character’, dan ‘list’. Sederhananya, keempat mode tersebut dapat terjelaskan dari contoh syntax berikut. > c(4,3,4,5,6,4,3,4,5,6,3) #logical [1] 4 3 4 5 6 4 3 4 5 6 3 > c(1:11) #numeric [1] 1 2 3 4 5 6 7 8 9 10 11 > c(F,F,T,T,F,T,F,T,T,F,F)…
-

Membuat data menggunakan ‘data.frame’ dalam R
—
Membuat data dalam R sebenarnya susah-susah gampang. Tidak seperti dalam Excel tinggal ketik, buat fungsi, lalu ada hasilnya. Dalam R perlu membiasakan diri. Terutama mengasah logika dalam interface R yang tidak mampu memvisualisasikan penulisan data. Berikut saya contohkan beberapa pembuatan data menggunakan fungsi data.frame. Penulisan melalui vektor > siswa2x<-data.frame(tinggi=c(2,3,4,5,6,3,4,5),berat=c(4,3,2,3,4,6,7,5)) > siswa2x tinggi berat 1 …
-

Crawling Data Twitter dengan ‘rtweet’
—
Package yang kini populer untuk crawling data twitter adalah twitteR. Tutorialnya berjibun, penggunanya juga sama. Tapi nyatanya tidak hanya twitteR saja yang tersedia package-nya. Ada beberapa aplikasi lain yang kegunaannya sama, salah satunya adalah rtweet. [AdSense-A] Kelebihan menggunakan rtweet adalah craling yang dihasilkan langsung berupa data frame, bukan value. Sehingga kita tidak perlu kelelahan memanipulasi data. Selain itu, itu juga perintah untuk mengekspor ke…
-

Export Hasil Crawling Data TwitteR ke Excel
—
Setelah melakukan crawling data tweet menggunakan twitteR pada R, kadang saya lebih suka melakukan analisa lanjutan di Excel. Alasannya karena analisa lanjutan hanya deskriptif dan tidak perlu perintah-perintah kompleks si R. Tapi masalahnya crawling yang dihasilkan oleh twitteR berbentuk value, bukan data. Setidaknya ada dua tahapan yang bisa kita lakukan untuk mengekspor value tersebut menjadi data tabel di Excel. [AdSense-A] Manipulasi data Jeff…
-

Masalah Ketika Menjalankan Package ‘rJava’
—
Package R acap kali membutuhkan package lain untuk menjalankannya. Itu yang sering dibuat pusing ketika package ‘lain’ itu bermasalah. Salah satu package yang sering dijadikan syarat adalah rJava. Memang sih mengistal rJava bukanlah perkara yang sulit, tapi saya menemukan masalah seperti ini : [AdSense-A] Loading required package: rJava library(rJava) Error : .onLoad failed in loadNamespace() for ‘rJava’, details: call: fun(libname, pkgname) error: JAVA_HOME…
-

Cara Update R lewat Package ‘installr’
—
Kadang R yang kita gunakan terlalu usang untuk digunakan. Konsekuensinya adalah tidak bisa mengoperasikan perintah-perintah tertentu, karena plugin tidak kompatibel dengan versi R di komputer kita. Biasanya biar cepat kita uninstall R lalu unduh dan install ulang R versi terbaru — karena R tidak mempunyai sistem autoupdate. Walaupun cara itu tidak salah, tapi sebenarnya ada cara yang lebih baik dan…
-

Mengapa Kita Harus Menggunakan R untuk Analisa Data?
—
Alat bantu analisa data, saat ini sudah berkembang pesat. Berbagai macam tools sudah banyak tersedia di pasaran, dari yang gratis hingga mahal selangit. Disamping itu, Keilmuan statistika juga sudah semakin berkembang pesat, jumlah statistisi pun semakin banyak. Dalam keilmuan statistik pun, banyak mereka yang ahli dalam hal yang spesifik, seperti forecasting, bio statitics, statistitics economics,…
-

Data Mining Twitter : Setting Crawling Twitter dengan R
—
Crawling data twitter pada dasarnya adalah proses pengambilan data tweet, profil, geografi, dan lainya untuk maksud analisis tertentu. Umumnya terdapat beberapa package yang didapat digunakan untuk crawling data Twitter. Namun orang lebih umum menggunakan TwitteR. Tutorial yang paling mudah hingga expert pun banyak bertebaran di internet. Tahapan yang dilalui untuk menarik data twitter terhitung mudah.…
-

Step-by-Step Data Mining Twitter dengan R
—
Twitter merupakan salah satu microblogging yang sangat populer saat ini. Dengan jumlah tweet yang dapat dipost oleh miliaran penggunanya, terdapat banyak informasi yang sebenarnya dapat kita perolehi lebih dalam. Seperti dalam arti kata ‘mining’ bahwa text dalam tweet itu dapat digali menjadi informasi yang lebih bermanfaat. Berbagai metode sudah berkembang saat ini. Bidang-bidang keilmuan dan profesi, terutama social…
