Machine Learning - Machine Learning Development Life Cycle - Understanding your Data Tutorial

# size of row and column

df.shape()

# first five-row

df.head()

# to get random row sample

df.sample(5)

# to get datatype, non-null value

df.info()

# to check null value

df.isnull().sum()

# to check mean, min, max, std deviation

df.describe()

df.duplicated.sum()

# To check the correlation between two variables – pearson corr

df.corr()

df[‘Survived’].value_counts()

df[‘age’].mean()

df[‘age’].min()

df[‘age’].max()

df[‘age’].skew()

About Fresherbell