책 내용 질문하기
실기시험 관련 질문
도서
2025 시나공 빅데이터분석기사 실기
페이지
0
조회수
138
작성일
2024-11-22
작성자
장*식
첨부파일

안녕하세요 이번에 출시된 실기교재로 독학 중입니다 공부하다 확신이 들지 않는 부분이 있어서 그리고 지금까지 잘 준비하고 있는건지 궁금해서 질문 남기게 됐습니다


이번 9회 시험부터 시험환경이 업데이트 되면서 numeric_only=True 설정이 필요해졌다고 들었습니다


1. sum이나 corr 함수 등을 사용할때

이번 시험부터 print(train.isnull().sum())이 아닌

print(train.isnull().sum(numeric_only=True)와 같이 사용해야 오류없이 정상적으로 출력되는걸까요?


2. 2유형에서 제출전 마지막으로 확인할게 test 데이터의 행의 개수와 csv 파일의 행의 개수가 일치여부를 강조하셨습니다


행 개수가 일치하면 csv 생성 코드까지 작성 완료 후 제출 시 csv 파일 생성코드 이외에 불필요한 print문은 주석처리해 두는게 실행시간 단축을 위해 도움이 될까요?


3. 인코딩 작업시 원핫이나 레이블 모두 target=train.pop("예측 컬럼명")을 사용해서 예측컬럼을 target 변수에 정의하고 사용하는게 맞을까요?


그리고 인코딩 할 컬럼이 없더라도 검증 데이터 분할을 위해 tarin_test_split을 사용할때도 target 변수 정의하면 될까요?


4. 제3유형은 작년부터 새롭게 생긴 유형이다보니 어떻게 준비해야할지 다른 유형에 비해 막막한 상황입니다 책에세 제시한대로 15점 이상을 목표로 한다면 회귀분석 파트만 준비해도 충분할까요?


시험이 임박해지다보니 지금까지 준비해온게 맞나 싶어서 질문글 남겨봤습니다


답변
2024-11-24 01:31:33
1. numeric_only=True 사용 필요함 2. 네 그런데 print()은 시간 단축에 미미합니다. 3. 전처리 시작과 동시에 target=train.pop("예측 컬럼명") 을 작성하시죠! 4. 회귀와 로지스틱회귀 2개 준비하시죠!! 합격 응원합니다 :)
  • 퇴근*딴짓
    2024-11-24 01:31:33
    1. numeric_only=True 사용 필요함 2. 네 그런데 print()은 시간 단축에 미미합니다. 3. 전처리 시작과 동시에 target=train.pop("예측 컬럼명") 을 작성하시죠! 4. 회귀와 로지스틱회귀 2개 준비하시죠!! 합격 응원합니다 :)
· 5MB 이하의 zip, 문서, 이미지 파일만 가능합니다.
· 폭언, 욕설, 비방 등은 관리자에 의해 경고없이 삭제됩니다.