Cara Menghapus Outlier di Google Sheets
Google Sheet Google Google Docs Pahlawan / / June 02, 2023

Diterbitkan

Terkadang spreadsheet Anda dapat menyertakan nilai tinggi atau rendah yang tidak biasa yang mendistorsi hasil Anda. Pelajari cara menghapus outlier di Google Sheets di sini.
Saat Anda menganalisis data, satu atau dua hasil yang dapat mengacaukan segalanya. Poin data yang secara signifikan lebih tinggi atau jauh lebih rendah daripada sebagian besar data Anda dapat mencondongkan ukuran seperti rata-rata rata-rata secara signifikan. Dalam beberapa kasus, sebaiknya Anda menghapus outlier ini dari data sebelum memulai analisis.
Jika Anda memiliki beberapa poin data yang tidak terlalu cocok, pelajari cara menghapus outlier di Google Sheets di bawah ini.
Apa itu Outlier?
Outlier adalah titik data yang secara signifikan lebih besar atau lebih kecil dari sebagian besar data dalam himpunan.
Misalnya, jika Anda mengukur pertumbuhan lima tanaman, dan hasilnya adalah 5 cm, 7 cm, 6 cm, 7 cm, dan 25 cm, hasil akhirnya adalah outlier. Sebagian besar hasilnya memiliki nilai yang sama, dan hasil akhirnya jauh lebih tinggi daripada yang lain.
Ada beberapa metode untuk menentukan nilai apa yang akan dianggap sebagai outlier berdasarkan rentang atau penyebaran data Anda.
Mengapa Menghapus Outlier?
Dalam beberapa kasus, outlier dalam data Anda dapat mendistorsi hasil saat Anda menganalisis data.
Sebagai contoh, dalam kasus di atas, jika kita ambil rata-rata rata-rata pertumbuhan kelima tanaman, maka akan menjadi (5+7+6+7+25)/5 atau 10 cm. Empat tanaman tumbuh jauh lebih sedikit dari ini, dengan hanya satu tanaman yang tumbuh jauh lebih banyak, jadi rata-rata rata-rata tidak benar-benar mewakili titik data mana pun.
Namun, jika outlier dihilangkan, rata-rata rata-ratanya adalah (5+7+6+7)/4 atau 6,25. Ini jauh lebih mewakili nilai yang tersisa dan memberikan refleksi data yang lebih akurat.
Beberapa statistik, seperti median, tidak akan terpengaruh oleh outlier, namun dalam banyak kasus, outlier dapat memiliki dampak yang signifikan.
Cara Menemukan Outlier
Ada beberapa cara untuk menentukan outlier, berdasarkan rentang atau sebaran data. Salah satu yang paling sederhana melibatkan penggunaan jarak interkuartil.
Kuartil hanyalah titik data yang ditemukan dengan membagi data Anda menjadi empat bagian yang sama. Kuartil bawah adalah angka seperempat dari seluruh data Anda saat dicantumkan dalam urutan dari terendah ke tertinggi. Kuartil atas adalah nilai tiga perempat dari seluruh data Anda.
Rentang interkuartil adalah perbedaan antara kedua nilai ini. Karena ini adalah perbedaan antara kuartil bawah dan kuartil atas, tepat setengah dari nilai Anda akan berada dalam rentang interkuartil ini.
Anda dapat menentukan batas atas outlier dengan mengalikan rentang interkuartil dengan 1,5 dan menambahkan hasilnya ke nilai kuartil atas. Setiap nilai di atas angka ini adalah outlier. Demikian pula, Anda dapat menemukan batas bawah untuk outlier dengan mengalikan rentang interkuartil dengan 1,5 dan mengurangkannya dari nilai kuartil bawah. Angka apa pun di bawah nilai ini akan menjadi outlier.
Cara Menemukan Outlier di Google Sheets
Jika semua hal di atas terdengar terlalu banyak matematika untuk Anda sukai, jangan pernah takut. Google Spreadsheet melakukan semua kerja keras untuk Anda. Ini akan membantu Anda menghitung kuartil atas, kuartil bawah, dan rentang interkuartil untuk data Anda, lalu Anda dapat membuat rumus untuk menentukan apakah setiap nilai adalah outlier atau tidak.
Untuk menemukan outlier di Google Sheets:
- Pilih sel tempat Anda ingin menghitung kuartil bawah.
- Masukkan berikut:
=KUARTIL(
- Pilih semua data Anda.
- Ketik koma, lalu 1, diikuti dengan tanda kurung tutup.
- Tekan Memasuki dan kuartil yang lebih rendah akan dihitung.
- Pilih sel berikutnya ke bawah dan masukkan yang berikut ini:
=KUARTIL(
- Pilih semua data Anda.
- Ketik koma, lalu 3, diikuti tanda kurung tutup.
- Tekan Memasuki dan kuartil atas akan dihitung.
- Pilih baris berikutnya ke bawah dan ketik = lalu pilih sel yang berisi kuartil atas.
- Ketik minus (-) dan pilih sel yang berisi kuartil bawah.
- Tekan Memasuki dan rentang interkuartil akan dihitung.
- Pilih sel di sebelah sel teratas data Anda dan masukkan rumus berikut, ganti C3 dengan lokasi sel teratas data Anda, $C$18 dengan sel yang berisi kuartil bawah (pastikan Anda memberi tanda $ sebelum huruf dan angka), $C$19 dengan sel yang berisi kuartil atas Anda, dan $C$20 dengan sel yang berisi interkuartil Anda jangkauan:
=IF(C3$C$19+1.5*$C$20,"Outlier",""))
- Jika titik data pertama Anda adalah outlier, rumus Anda akan menghasilkan outlier teks. Jika tidak, itu akan kosong.
- Untuk menerapkan rumus ke sel lain di data Anda, klik dan tahan gagang seret di sudut bawah sel.
- Seret ke bawah sel tempat Anda ingin menerapkan rumus.
- Lepaskan, dan rumus Anda akan disalin dan akan dihitung. Anda sekarang dapat dengan jelas melihat nilai apa pun yang merupakan outlier.
Cara Menghapus Outlier di Google Sheets
Anda sekarang tahu cara menemukan outlier, tetapi bagaimana dengan menghapusnya?
Kita bisa melakukannya dengan sederhana JIKA rumus yang akan menghapus data dari setiap sel yang terdaftar sebagai outlier, tetapi mengembalikan nilai asli untuk yang tidak.
Untuk menghapus outlier di Google Sheets:
- Ikuti langkah-langkah di bagian atas untuk menentukan nilai mana yang merupakan outlier.
- Pilih sel dua kolom dari titik data teratas Anda.
- Masukkan rumus berikut, ganti C3 dengan posisi sel teratas Anda dan D3 dengan posisi sel di sebelah kanannya:
=IF(D3="Outlier","",C3)
- Tekan Memasuki. Jika sel teratas adalah outlier, rumus akan mengembalikan kosong. Jika tidak, itu akan mengembalikan nilai sel teratas Anda.
- Untuk menerapkan rumus ke seluruh sel Anda, klik dan tahan tuas seret di sudut bawah sel.
- Seret ke bawah sel tempat Anda ingin menerapkan rumus.
- Saat Anda melepaskan mouse, rumus akan disalin dan Google Sheets akan menghitung hasil akhirnya. Setiap nilai yang tercantum sebagai outlier akan dihapus.
Memanipulasi Data di Google Sheets
Mempelajari cara menghapus outlier di Google Sheets memastikan bahwa data Anda tidak terdistorsi oleh nilai yang secara signifikan berada di luar jangkauan sebagian besar data Anda. Dalam beberapa kasus, ini dapat berdampak besar pada statistik yang Anda gunakan untuk menganalisis data.
Mengetahui cara menghapus nilai-nilai ini memberi Anda opsi untuk menghilangkannya jika Anda mau, atau menyertakannya jika Anda ingin menganalisis seluruh kumpulan data. Anda bahkan dapat mencoba keduanya dan membandingkan hasilnya.
Google Sheets sangat bagus untuk analisis statistik tetapi dapat melakukan lebih banyak lagi. Anda dapat berkolaborasi dengan pengguna lain saat membuat dokumen Google Sheets dan bahkan komentar dan bereaksi terhadap pekerjaan mereka. Kamu bisa masukkan tabel Google Sheets ke dalam Google Documents Anda, dan Anda bahkan bisa buat kode QR di Google Sheets.