November 30, 2021
Memuat Data CSV ke DataFrame

Memuat Data CSV ke DataFrame

Pada artikel ini akan di bahas mengenai menampilkan data dari sebuah file .csv dan juga beberapa cara untuk pencarian terhadap data yang ada.

Jupyter Notebook

Memuat data ke Pandas

In [1]:
import pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/Onestringlab/notebook/main/pokemon_data.csv')

Menampilkan 5 data pertama

In [2]:
print(df.head(5))
   #                   Name Type 1  ... Speed  Generation  Legendary
0  1              Bulbasaur  Grass  ...    45           1      False
1  2                Ivysaur  Grass  ...    60           1      False
2  3               Venusaur  Grass  ...    80           1      False
3  3  VenusaurMega Venusaur  Grass  ...    80           1      False
4  4             Charmander   Fire  ...    65           1      False

[5 rows x 12 columns]

Menampilkan 10 data terakhir

In [3]:
print(df.tail(5))
       #                 Name   Type 1  ... Speed  Generation  Legendary
795  719              Diancie     Rock  ...    50           6       True
796  719  DiancieMega Diancie     Rock  ...   110           6       True
797  720  HoopaHoopa Confined  Psychic  ...    70           6       True
798  720   HoopaHoopa Unbound  Psychic  ...    80           6       True
799  721            Volcanion     Fire  ...    70           6       True

[5 rows x 12 columns]

Menampilkan nama judul kolom

In [4]:
print(df.columns)
Index(['#', 'Name', 'Type 1', 'Type 2', 'HP', 'Attack', 'Defense', 'Sp. Atk',
       'Sp. Def', 'Speed', 'Generation', 'Legendary'],
      dtype='object')

Menampilkan data berdasarkan kolom

In [5]:
print(df[['Name','Type 1', 'HP']])
                      Name   Type 1  HP
0                Bulbasaur    Grass  45
1                  Ivysaur    Grass  60
2                 Venusaur    Grass  80
3    VenusaurMega Venusaur    Grass  80
4               Charmander     Fire  39
..                     ...      ...  ..
795                Diancie     Rock  50
796    DiancieMega Diancie     Rock  50
797    HoopaHoopa Confined  Psychic  80
798     HoopaHoopa Unbound  Psychic  80
799              Volcanion     Fire  80

[800 rows x 3 columns]

Menampilkan data berdasarkan baris

In [6]:
print(df.iloc[0:4])
   #                   Name Type 1  ... Speed  Generation  Legendary
0  1              Bulbasaur  Grass  ...    45           1      False
1  2                Ivysaur  Grass  ...    60           1      False
2  3               Venusaur  Grass  ...    80           1      False
3  3  VenusaurMega Venusaur  Grass  ...    80           1      False

[4 rows x 12 columns]
In [7]:
for index, row in df.iterrows():
  print(index,row['Name'])
  if index == 50:
    break
0 Bulbasaur
1 Ivysaur
2 Venusaur
3 VenusaurMega Venusaur
4 Charmander
5 Charmeleon
6 Charizard
7 CharizardMega Charizard X
8 CharizardMega Charizard Y
9 Squirtle
10 Wartortle
11 Blastoise
12 BlastoiseMega Blastoise
13 Caterpie
14 Metapod
15 Butterfree
16 Weedle
17 Kakuna
18 Beedrill
19 BeedrillMega Beedrill
20 Pidgey
21 Pidgeotto
22 Pidgeot
23 PidgeotMega Pidgeot
24 Rattata
25 Raticate
26 Spearow
27 Fearow
28 Ekans
29 Arbok
30 Pikachu
31 Raichu
32 Sandshrew
33 Sandslash
34 Nidoran (Female)
35 Nidorina
36 Nidoqueen
37 Nidoran (Male)
38 Nidorino
39 Nidoking
40 Clefairy
41 Clefable
42 Vulpix
43 Ninetales
44 Jigglypuff
45 Wigglytuff
46 Zubat
47 Golbat
48 Oddish
49 Gloom
50 Vileplume
In [8]:
print(df.loc[df['Type 1'] == 'Fire'].head(10))
     #                       Name Type 1  ... Speed  Generation  Legendary
4    4                 Charmander   Fire  ...    65           1      False
5    5                 Charmeleon   Fire  ...    80           1      False
6    6                  Charizard   Fire  ...   100           1      False
7    6  CharizardMega Charizard X   Fire  ...   100           1      False
8    6  CharizardMega Charizard Y   Fire  ...   100           1      False
42  37                     Vulpix   Fire  ...    65           1      False
43  38                  Ninetales   Fire  ...   100           1      False
63  58                  Growlithe   Fire  ...    60           1      False
64  59                   Arcanine   Fire  ...    95           1      False
83  77                     Ponyta   Fire  ...    90           1      False

[10 rows x 12 columns]

Kesimpulan

Dataframe merupakan sebuah format yang dimiliki oleh library Pandas. Ini merupakan format yang biasa digunakan para data scientist untuk mengolah data yang dimiliki. Untuk artikel lain terkait dengan data science silahkan lihat kumpulan artikelnya disini.

Rajo Intan

Blogger, pemiliki Onestring Lab, menulis artikel terkait teknologi informasi dan pendidikan. Web Developer, berpengalaman lebih dari 20 tahun mengembangkan berbagai aplikasi dan sistem informasi. Kerjasama kontak di onestringlab@gmail.com atau https://forms.gle/xAGKkpi6B3BzJyzk7

View all posts by Rajo Intan →