상세 컨텐츠

본문 제목

빅데이터분석기사 실기

자격증/빅데이터 분석기사

by 손가우 2022. 6. 22. 19:44

본문

#a['mpg']=a['mpg'].fillna(a.mpg.mean())
#작업형 1-1 상위 70% 추출 사분수의 Q1의 값을 구하시오 
a1=a.iloc[:int(len(a)*0.7)]
#데이터의 70%를 추출
#사분위수 구하기 Q1
a2=a1.quantile(0.25)
#다른방법
a2=a1['mpg'].describe()['25%']

 

단답형

 

2000년 감염자 수의 평균보다 큰 나라의 개수를 구하시오.

 

import pandas as pd
df = pd.read_csv("data",encoding='latin',sep=',')
df1=df[(df.year==2000)]
df2=df1[(df1.new_sp>df1.new_sp.mean())]
df2.new_sp.count()​

2323

 

isnull()

영문 의미인 null이다 라는 뜻이 같이, 데이터 값들이 null 여부를 판단해주는 학습이다. 

데이터 값이 결측치이면 True로 출력되고, 값이 있으면 False로 출력됩니다

여기서 null은 존재하지 않는 값을 의미한다. 

파이썬 환경에서 isnull() 함수를 사용하여 나이와 성별 데이터의 null 여부를 확인한다. 

False는 숫자 0을 의미함

True는 숫자 1을 의미함 

 

2

#작업형 1-3번 결측치의 비율이 가장 높은 변수명을 구하시오. 
print(a.isnull().sum()/len(a)).sort_values(asceding='False').index[0]

dfdg

관련글 더보기

댓글 영역