November 30, 2021
3 Pustaka Python Yang Seharusnya Data Scientis Gunakan

3 Pustaka Python Yang Seharusnya Data Scientis Gunakan

Mito

Mito adalah program Python gratis yang memungkinkan pengguna mengintegrasikan antarmuka spreadsheet ke dalam notebook Jupyter yang digunakan. Setiap perubahan yang dilakukan pada spreadsheet akan tercermin dalam sel kode Python di bawahnya. Mito adalah alat yang sangat baik untuk pengguna Python yang ingin membangun sintaks tanpa mencarinya di Stack Overflow atau Google. Ini juga digunakan oleh pengguna Excel yang ingin beralih ke Python.

Berikut ini video demonya

Untuk instalasi Mito, jalankan perintah berikut ini:

python -m pip install mitoinstaller
python -m mitoinstaller install

Kemudian buka Jupyter Lab, dan kode ini akan muncul:

import mitosheet
mitosheet.sheet()

Mito menyertakan banyak fitur berguna untuk analisis data eksplorasi, pembersihan data, dan analisis data, seperti:

  • Membuat grafik dan kode yang sesuai
  • Menyusun tabel pivot
  • Menggunakan rumus Excel untuk menggabungkan kumpulan data
  • Pemfilteran dan pengurutan kumpulan data
  • Menganalisis statistik ringkasan
  • Mengisi nilai nol, antara lain!

Dokumentasi lengkap dapat ditemukan di sini.

Streamlit

Mengacu pada Streamlit, bahwa pekerjaan data science harus dikomunikasikan dan dipahami oleh orang-orang di luar tim yang lainnya. Menggunakan Streamlit, memungkinkan mengubah skrip Python menjadi aplikasi data yang mudah digunakan.

Berikut adalah situs web.

Untuk instalasi Streamlit, jalankan perintah ini:

pip install streamlit
streamlit hello

Aplikasi yang dibangun juga dapat diterapkan dengan cepat dengan Streamlit. Hal yang paling sulit dalam mengembangkan aplikasi data adalah bagaimana cara menerapkannya. Streamlit akan menyebarkan repositori, dan lokasi file utama ketika Anda telah memilihnya.

Streamlit membantu tim untuk berkonsentrasi pada studi mereka sementara juga memungkinkan mereka untuk berhasil mendiskusikan temuannya tanpa harus menghabiskan banyak waktu untuk melakukannya.

Lux

Lux adalah alat yang luar biasa untuk penelitian data eksplorasi dan visualisasi data. Lux akan secara otomatis menawarkan visual untuk frame data apa pun untuk membantu Anda mempelajari dan membagikan data. Tak satu pun dari kode visualisasi perlu ditulis.

Untuk menggunakan lux

import lux
import pandas as pd

Lux menyediakan kemungkinan visualisasi untuk frame data apa pun, seperti yang ditunjukkan di bawah ini. Yang harus dilakukan sekarang adalah memilih grafik yang ingin dilihat. Tidak perlu kode. Ini menghemat banyak waktu karena memperoleh sintaks yang benar dan tepat dari alat seperti matplotlib atau seaborn bisa memakan waktu lama.

https://github.com/lux-org/lux

Lux juga memungkinkan untuk mengekspor visualisasi Anda, membuat proses membagikannya menjadi mudah. Anda memiliki opsi untuk mengekspor visual ke HTML atau mengonversinya ke kode matplotlib sehingga dapat mengubahnya lebih lanjut.

Kesimpulan

Pemanfaatan pustaka yang ada memungkinkan para data scientis dapat bekerja lebih efektif dan efisien.

Rajo Intan

Blogger, pemiliki Onestring Lab, menulis artikel terkait teknologi informasi dan pendidikan. Web Developer, berpengalaman lebih dari 20 tahun mengembangkan berbagai aplikasi dan sistem informasi. Kerjasama kontak di onestringlab@gmail.com atau https://forms.gle/xAGKkpi6B3BzJyzk7

View all posts by Rajo Intan →