Maulana Akbar

Browsing Tag:

Statistics

Data Science, Python, Statistics

Data Science dengan Python [Pemula – Bagian I]

Daftar Isi Pendahuluan Tulisan ini dibuat untuk teman-teman yang suka dan berminat untuk mendalami pengolahan data dengan python. Python memang menarik perhatian saya yang sudah terbiasa dengan Excel dan R karena memang sedang trend dan kegunaanya saat itu sedang ramai dibicarakan dan ‘ternyata’ sangat fleksibel digunakan.  Saya akan memulai dan menyicil artikel ini dari hal-hal yang paling dasar sampai dianggap sulit. Tujuanya selain untuk berbagi ilmu dengan teman-teman  ...

Continue Reading

Data Science, R, Statistics

Membuat Grafik Cantik dengan SjPlot

Grafik seperti pie chart, bar chart, atau tabel frekuensi sudah tersedia di perintah base bawaan R. Akan tetapi, tampilan yang kaku kadang membuatpengguna kurang puas. Apalagi grafik yang ditampilkan digunakan untuk hal yangmementingkan estetika seperti untuk presentasi.  Sebenarnyabanyak package yang tersedia untukmembuat grafik. Namun, kali ini saya akan membahas tentang SjPlot. Sebuah package  sederhana yang mudah digunakan dalam pembuatan grafik.Secara  ...

Continue Reading

Data Science, R, Statistics

Membuat tabel frekuensi sederhana dengan sjmisc

Dalam statistika dekriptif,  tabel frekuensi sering digunakan untuk mempermudah dalam membaca sebuah kumpulan data. Dalam artikel ini, secara sederhana dijelaskan cara membuat tabel frekuensi sederhana dengan menggunakan package sjmic. Install package Sjmic library("sjmisc", lib.loc="~/R/win-library/3.5") Import data data<-read.csv("labassigment1.csv") > data id gender age polorient class 1 1 1 66 3 4 2 2 2 72 3 5 3 3 2 59 1 4 4 4 2 20 1 3 5 5 2 68 3 5 6 6 1 76 3 4 7 7 1 61 1 5 8  ...

Continue Reading

Data Science, R, Statistics

Membuat Nama Variabel (Assign Variable) dengan Sjlabelled

Untuk mempermudah dalam mengkodekan data, kadang kita mesti melabelkan untuk setiap unit data dalam R atau bahasa umumnya assgning variable.  Dengan menggunakan package Sjlabelled ternyata bisa mudah dilakukan. Beginilah tahapan sederhana yang saya buat untuk menamai nama variabel dan data dalam satu variabel. Assigning nama variabel : Install dan aktifkan package Sjlabelled >library("sjlabelled", lib.loc="~/R/win-library/3.5")  Import Data, saya menggunkan data contoh di  ...

Continue Reading

Uncategorized

Membuat Boxplot Sederhana dengan R

Salah satu alternatif untuk menggambarkan data adalah dengan boxplot. Tidak seperti grafik bivariat lainnya, boxplot meringkas data dengan menampilkan nilai max,min, median, dan kuartil, serta melihat posisi dari nilai tersebut. Dalam R tentunya bukanlah perkara yang sulit, dapat dengan mudah menggunakan fungsi boxplot(). Berikut adalah contohnya : data("iris") > quantile(iris$Sepal.Length, prob=c(0.25,0.5,0.75)) #melihat Q1,Q2,Q3 25% 50% 75% 5.1 5.8 6.4 Menggambarkan kuartil bisa  ...

Continue Reading

Uncategorized

Membuat Diagram Batang Daun dengan R

Salah satu untuk meringkaskan data adalah dengan membuat diagram batang daun. Hampir software pengolahan angka bisa membuat diagram ini, namun dalam artikel ini hanya bahas pembuatan batang daun dengan software R. Secara umum pembuatan diagram ini sangat sederhana, yakni menggunakan satu perintah saja, yaitu stem(). Berikut adalah contohnya, dimana saya menggunakan data yang sudah terpasang di Ri, yaitu attitudde. >data("attitude") > attitude    rating complaints privileges  ...

Continue Reading

Uncategorized

Membuat Histogram Probability Density Function dengan R

Probability Density Function (PDF) (dalam bahasa Indonesia sering disebut Fungsi Kepadatan Peluang) adalah salah satu cara menggambarkan data bivariat yang muncul berdasarkan peluang. Fungsi ini digunakan untuk menggambarkan keadaan sebenarnya ketika data yang range-nya tinggi dan menyebar di satu titik saja. Penjelasan tentang PDF bisa dilihat di slide Bapak Achmad Basuki di bawah ini : http://basuki.lecturer.pens.ac.id/lecture/statistik2.pdf Dalam artikel ini akan dibahas pembuatan  ...

Continue Reading

Uncategorized

Membuat Histogram dalam R

Membuat Histogram adalah eksplorasi data dalam grafik yang paling sederhana. Karena dalam membuat histogram, hanya diperlukan satu buah variabel (bivariat). Namun dari histogram ini saja kita bisa banyak cerita tentang fenonema dalam grafik. Berikut adalah pembuatan histogram dalam R, disarankan package DAAG sudah terpasang dengan baik di R. Dalam contoh ini menggunakan data yang sudah terpasang dalam R. Saya memilih Iris. Untuk melihat data lainnnya bisa dilihat dengan syntax : data ()  ...

Continue Reading

Uncategorized

Membedakan = (equal) dan == (double equal) dalam R

Dalam syntax R kadang kita dibuat pusing dengan fungsi matematis yang tidak ditulis dengan semestinya. Seperti ada = dan ==. Sama dengan yang kita tahu ya hanya satu bukan double seperti itu. Perbedaannya ternyata sangat mudah, berikut sedikit penjelasannya. Dalam R single equal dibuat untuk menunjukkan satu variabel, seperti X = 2c+3.  Single equal juga biasanya dapat diganti dengan ‘<-‘ . Karenanya persamaan diatas dapat pula diganti dengan X <- 2c+3. Sedangkan  ...

Continue Reading

Uncategorized

Looping dengan R | Part I

Anggapan saya dulu, looping adalah fase expert bagi pengguna R. Digunakan untuk membuat fungsi sendiri yang semerawut. Iya, mungkin ada benarnya juga. Tapi looping sangat bermanfaat untuk pengoperasian satu fungsi yang spesifik. Kesulitannya pengguna harus mempunyai basis programming dan logika yang memadai. Artikel ini adalah artikel pertama dalam penggunaan looping. Proses sederhana ini diharapkan mempraktikkan looping untuk para pemula. Berikut adalah syntax untuk membuat print kata dari  ...

Continue Reading