15분
첫 번째 CSV 파일, 그리고 대혼란
Day 2: 자료형 심화
첫 번째 CSV 파일, 그리고 대혼란
Python 기초 1: 변수, 자료형, 조건문, 반복문 > Day 2: 자료형 심화
학습 목표
실무에서 자료형 문제가 왜 중요한지 이해한다 타입 관련 버그의 실제 사례를 파악한다
첫 번째 CSV 파일
"이거 간단해. 매출 데이터 합계만 내면 돼."
입사 3일차. 팀장이 CSV 파일 하나를 건넸다.
sales_data.csv:
에디터 로딩 중...
쉽다. 그냥 price * quantity 합치면 되잖아?
에디터 로딩 중...
실행 결과:
에디터 로딩 중...
???
왜 에러가 났을까?
CSV 파일은 모든 값을 문자열로 읽는다.
에디터 로딩 중...
"1200000"은 숫자가 아니다. 숫자처럼 생긴 문자열이다.
문자열 * 문자열? Python은 그게 뭔지 모른다.
이게 왜 중요한가?
실무에서 마주치는 데이터의 90%는 "더러운" 데이터다.
| 문제 | 예시 |
|---|---|
| 숫자가 문자열로 | "1200000" |
| 공백이 포함된 | " 1200000 " |
| 쉼표가 포함된 | "1,200,000" |
| 빈 값 | "", None |
| 소수점 표기 | "3.14" vs 3.14 |
이 문제들을 해결하려면 자료형을 제대로 이해해야 한다.
오늘 배울 것:
- 숫자 자료형 (int, float)과 산술 연산
- 문자열 다루기 (인덱싱, 슬라이싱, 메서드)
- 불린과 비교 연산
시작하자.