Commit 21d6a8b4 authored by Odair M.'s avatar Odair M.

Resolves #184: fiz casting das coluna ANO e ANO_INGRESSO de float para...

Resolves #184: fiz casting das coluna ANO e ANO_INGRESSO de float para inteiro, se tentar o casting da coluna ANO_EVASAO quebra alguma analise
parent b5700cc5
Pipeline #19989 passed with stage
in 2 minutes and 51 seconds
......@@ -64,9 +64,18 @@ def fix_dataframes(dataframes):
return merged
# convert NaN to 0 and cast float to integer os list collumns
def fix_datatype(df):
collums = ["ANO", "ANO_INGRESSO"]
df["ANO_EVASAO"].fillna(0, inplace=True)
for i in collums:
df[i].fillna(0, inplace=True)
df[i] = df[i].astype(int)
def clean_history(df):
......@@ -90,8 +99,11 @@ def clean_register(df):
df_split = df['PERIODO_EVASAO'].str.split('/')
df['ANO_EVASAO'] = df_split.str[0]
df['SEMESTRE_EVASAO'] = df_split.str[1].str.split('o').str[0]
df['ANO_EVASAO'].fillna(0, inplace=True)
# replace nan cell to 0, ANO_INGRESSO and ANO_EVASAO is trated in function
# fix_dataype
df['SEMESTRE_EVASAO'].fillna(0, inplace=True)
df['SEMESTRE_INGRESSO'].fillna(0, inplace=True)
