1. 기업맞춤형 빅데이터 분석가 양성과정 소개
2. 기업맞춤형 빅데이터 분석가 양성과정 노트목록
https://crosefrog.tistory.com/entry/20210104-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-4%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8
https://crosefrog.tistory.com/entry/20240105-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-5%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8
https://crosefrog.tistory.com/entry/20240109-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-7%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8
https://crosefrog.tistory.com/entry/20240111-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-9%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8
https://crosefrog.tistory.com/entry/20240115-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-11%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8
https://crosefrog.tistory.com/entry/20240116-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-12%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8
3. Notion 일과 삶 & 빅데이터 분석가 양성과정 대시보드
https://lifemoment.notion.site/497bff9488aa4dec9171d08224a7a978?pvs=4
4. Google Colaboratory Notebook
https://colab.research.google.com/drive/1vAWm2SxcRgCFuAuC0CmexxppQvMYR6dy#scrollTo=UoEliezX0-ve
5. Naver 블로그 포스팅
성공포르노, 갓생 비즈니스 (동기부여 뒤집기) : 네이버 블로그 (naver.com)
6. 필기노트
모닝 도스
- 도스: 운영체제 이름, 컴퓨터 올라오는 동안 시간이 필요하다.
→ 사람도 출근하는 동안 시간이 필요하다.
노트북을 가져오지만, 한번도 사용하지 않는다.
- 습관처럼 가져간다.
- 강의자료를 외장하드에 올려둔다.
→ 보험 차원에서 들고 다닌다.
20대 후반 서른 2명을 강의로 보낸 적이 있다.
→ 강의를 망친 것 같다고 연락이 왔다.
이유: 학교 컴퓨터 소프트웨어가 돌아가지 않았다.
회사가 이사 간다고 하면, 자기 짐을 챙겨야 한다.
일요일에 나와서 짐을 챙겨라.
그 다음날 아침에 픽업하러 갔다.
마냥 기다릴 수 없어서, 회사로 갔다.
아무리 늦게 자도 전화벨이 울려도 잤을 것이다.
→ 대화가 많이 부족했지 않았을까?
사람마다 가치관이 다르기에 생각하는 것이 다르다.
→ 튀는 사람을, 꼰대나 MZ라고 부른다.
얘기 안하고 살면 되지 않을까?
사이가 안 좋을 수 있다.
그런데, 서로가 서로를 무시할 순 없다.
한 조직, 한 세상 안에서 같이 살아간다.
잘났든, 못났든 평가하는 사람은 상사이다.
→ 둥글둥글한 것이 좋다.
남자직원: 잘 받아준다.
보통 술 먹자는 것이 말 하자는 얘기다.
→ 할 얘기가 없나?
사회 나가면, 나보다 나이 많은 사람이 상사다.
요령껏 잘 표현해야 한다.
→ 서로 대화를 나눠서 좋은 관계를 만들어야 한다.
어제 퀴즈를 안 보낸 사람들이 있다.
→ 소통하고 싶다.
퀴즈: 연평균 기온 분포 그리기
셋째 마당 - 인구 공공 데이터
헬리콥터 mom: 아이를 차에 태워다니고 학원, 학교에 내려주는 엄마
아이들이 좀 더 크면, 학구열이 높은 곳으로 이사간다.
- 구미시 인동동 VS 구미시 양포동 인구수 분포 그래프 (for문)
import csv
import matplotlib.pyplot as plt
import koreanize_matplotlib
f = open('age.csv', encoding='cp949')
data = csv.reader(f)
next(data)
data = list(data)
for row in data:
if '구미시 인동동' in row[0]:
print(row)
break
population = []
for p in row[3:]:
population.append( int( p.replace(',','') ) )
print(population)
plt.plot(range(0, 101), population)
for row in data:
if '구미시 양포동' in row[0]:
print(row)
break
population = []
for p in row[3:]:
population.append( int( p.replace(',','') ) )
print(population)
plt.plot(range(0, 101), population)
plt.xlabel('연령대')
plt.ylabel('인구수')
plt.title('연령대별 인구수 비교(구미시 인동동 vs. 구미시 양포동)')
plt.grid()
plt.show()
f.close()
동백2동과 동탄2동의 인구수 분포 그래프 (리스트 내포)
import csv
import matplotlib.pyplot as plt
# 파일로부터 데이터 읽어 오기
f = open('age.csv', encoding='cp949')
data = csv.reader(f)
next(data)
# 이터레이터를 리스트로 변경
data = list(data)
# 살펴 보기 원하는 두 지역 정보 가져오기
a_lst = [area_info for area_info in data if '동백2동' in area_info[0]][0]
b_lst = [area_info for area_info in data if '동탄2동' in area_info[0]][0]
%page a_lst
# 문자열로 저장된 인구수 정보를 추출하여 정수로 변환 후 리스트로 보관
p_a_lst = [int(pop.replace(',','')) for pop in a_lst[3:]]
p_b_lst = [int(pop.replace(',','')) for pop in b_lst[3:]]
# 그림 그리기
plt.plot(p_a_lst, label = '동백2동')
plt.plot(p_b_lst, label = '동탄2동')
plt.grid()
plt.xlabel('나이')
plt.ylabel('인구수')
plt.legend()
plt.show()
메모: open()함수, 인코딩 cp949 (마이크로소프트), csv.reader()함수, next()함수
막대 그래프 그리기
- bar() 함수
import matplotlib.pyplot as plt
plt.bar([0, 1, 2, 4, 6, 10], [1, 2, 3, 5, 6, 7])
plt.show()
→ range() 함수 사용,
동네 인구 구조를 막대 그래프로 표현
import csv
import matplotlib.pyplot as plt
f = open('age.csv', encoding='cp949')
data = csv.reader(f)
next(data)
population =[]
for row in data:
if '동백2동' in row[0]:
for number in row[3:]:
population.append( int(number.replace(',','')) )
break
f.close()
plt.figure(figsize=(16,9))
plt.bar(range(101), population)
plt.grid()
plt.show()
내가 뭔가를 표현하고자 할 때
어떤 그래프를 사용하여 표현하는 것이 좋은가?
- 논문 등
- 1억 규모의 제안서
발표자료를 만들어서 시각화를 한다고 할 때, 이것이 최선인가?
→ 분석용으로 사용할 수 있다.
bath() 함수: bar() 함수가 수직으로 나타내는 그래프라면, bath() 함수는 수평으로 나타내는 그래프다.
SW융합교육원: 정보처리기사
2월 초 데이터분석 특강
2월 달 채용전환시험을 본다고 생각하자.
총인구수 = 연령구간인구수
bar 차트를 그린 다음, bath 차트를 그렸다.
항아리 그래프로 비교하고 싶은 것들을 표현하여 나타낼 수 있다.
<동탄5동 연령대별 인구분포 항아리 차트>
import csv
import matplotlib.pyplot as plt
f = open('gender_202306.csv', encoding='cp949')
data = csv.reader(f)
next(data)
man_population =[]
woman_population =[]
for row in data:
if '동탄5동' in row[0]:
for number in row[3:14]:
man_population.append( -1*int(number.replace(',','')) )
for number in row[16:]:
woman_population.append( int(number.replace(',','')) )
f.close()
plt.figure(figsize=(16,9))
plt.barh(range(11), man_population, label='남자 인구수')
plt.barh(range(11), woman_population, label='여자 인구수')
plt.title('연령대 별 인구수')
plt.legend()
plt.grid()
plt.show()
→ 분석이라는 관점에서 생각하면 어떤가?
import csv
import matplotlib.pyplot as plt
f = open('gender_202306.csv', encoding='cp949')
data = csv.reader(f)
next(data)
man_population =[]
woman_population =[]
addr = '제주특별자치도 (5000000000)'
for row in data:
#if '부산광역시 (2600000000)' in row[0]:
if addr in row[0]:
for number in row[3:14]:
man_population.app