15

첫 번째 CSV 파일, 그리고 대혼란

Day 2: 자료형 심화

학습 목표

실무에서 자료형 문제가 왜 중요한지 이해한다 타입 관련 버그의 실제 사례를 파악한다

첫 번째 CSV 파일

"이거 간단해. 매출 데이터 합계만 내면 돼."

입사 3일차. 팀장이 CSV 파일 하나를 건넸다.

sales_data.csv:

에디터 로딩 중...

쉽다. 그냥 price * quantity 합치면 되잖아?

에디터 로딩 중...

실행 결과:

에디터 로딩 중...

???


왜 에러가 났을까?

CSV 파일은 모든 값을 문자열로 읽는다.

에디터 로딩 중...

"1200000"은 숫자가 아니다. 숫자처럼 생긴 문자열이다.

문자열 * 문자열? Python은 그게 뭔지 모른다.


이게 왜 중요한가?

실무에서 마주치는 데이터의 90%는 "더러운" 데이터다.

문제예시
숫자가 문자열로"1200000"
공백이 포함된" 1200000 "
쉼표가 포함된"1,200,000"
빈 값"", None
소수점 표기"3.14" vs 3.14

이 문제들을 해결하려면 자료형을 제대로 이해해야 한다.

오늘 배울 것:

  1. 숫자 자료형 (int, float)과 산술 연산
  2. 문자열 다루기 (인덱싱, 슬라이싱, 메서드)
  3. 불린과 비교 연산

시작하자.