본문 바로가기
카테고리 없음

2024.01.04 빅데이터 분석가 양성과정 4일차 노트

by Choose Me 2024. 1. 4.
SMALL

1. 기업맞춤형 빅데이터 분석가 양성과정 소개 

https://bit.ly/41x8FOX

 

[기업맞춤형 빅데이터 분석가 양성과정] 선수과정이란 무엇인가?

안녕하세요! 저는 12월 28일부터 한국품질재단의 기업맞춤형 빅데이터 분석 양성과정을 시작합니다! [취업과 창업]고용노동부와 한국품질재단 & 안동대학교가 함께하는 2024년 K-Digital Training(1,000

crosefrog.tistory.com

https://bit.ly/3NIinbu

 

[취업과 창업]고용노동부와 한국품질재단 & 안동대학교가 함께하는 2024년 K-Digital Training(1,000만원

안녕하세요. 저는 졸업을 1년 남기고 이력서, 자소서, 포트폴리오 및 미니프로젝트와 최종프로젝트를 수행하는 한국품질재단의 빅데이터 분석가 양성과정에 참가하게 되었습니다. 오늘날 세상

crosefrog.tistory.com

 

2. 기업맞춤형 빅데이터 분석가 양성과정 노트목록

 https://crosefrog.tistory.com/entry/20231228-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-1%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8

 

2023.12.28 빅데이터 분석가 양성과정 1일차 노트

오늘은 기업맞춤형 빅데이터 분석가 오리엔테이션이 있었습니다. 1. 기업맞춤형 빅데이터 분석가 양성과정 소개 https://bit.ly/41x8FOX [기업맞춤형 빅데이터 분석가 양성과정] 선수과정이란 무엇인

crosefrog.tistory.com

https://crosefrog.tistory.com/entry/20240102-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-2%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8

 

2024.01.02 빅데이터 분석가 양성과정 2일차 노트

1. 기업맞춤형 빅데이터 분석가 양성과정 소개 https://bit.ly/41x8FOX [기업맞춤형 빅데이터 분석가 양성과정] 선수과정이란 무엇인가? 안녕하세요! 저는 12월 28일부터 한국품질재단의 기업맞춤형 빅

crosefrog.tistory.com

https://crosefrog.tistory.com/entry/20240103-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80-%EC%96%91%EC%84%B1%EA%B3%BC%EC%A0%95-3%EC%9D%BC%EC%B0%A8-%EB%85%B8%ED%8A%B8

 

2024.01.03 빅데이터 분석가 양성과정 3일차 노트

1. 기업맞춤형 빅데이터 분석가 양성과정 소개 https://bit.ly/41x8FOX [기업맞춤형 빅데이터 분석가 양성과정] 선수과정이란 무엇인가? 안녕하세요! 저는 12월 28일부터 한국품질재단의 기업맞춤형 빅

crosefrog.tistory.com

3. Chepter 04. 반복문.ipynb

Ch04 반복문.ipynb
0.33MB

 

4. Notion 빅데이터 분석가 양성과정 대시보드

https://shaded-chair-f39.notion.site/d1191ac35d7c4f09b2fd0bdc9a91debc?pvs=4

 

빅데이터 분석가 양성과정 대시보드 | Built with Notion

템플릿의 아이콘들은 https://notionicons.website 사이트를 참조했습니다

shaded-chair-f39.notion.site

5. Naver 블로그 (매일 포스팅)

Notion을 시작한 당신. 기록한 내용을 대.. : 네이버블로그 (naver.com)

 

Notion을 시작한 당신. 기록한 내용을 대시보드로 정리하자. (쌓아두기만 하면 의미가 없다.)

기록을 쌓은 다음, 표현해야 한다. 노션으로 기록된 정보들을 어떻게 내가 활용할 수 있는가가 중요한 시점...

blog.naver.com

6. Google Colaboratory Notebook

https://colab.research.google.com/drive/1MEzv-0K231_dKwlp4gfLrPwkUTc0Qo1b#scrollTo=dXEkdB2kmbj_

 

Google Colaboratory Notebook

Run, share, and edit Python notebooks

colab.research.google.com

7. 필기노트

파이썬: 10년이 채 안되었다.

  • 파이썬은 팔방미인이다. (데이터분석, 인공지능, 웹 서버 등등 여러 응용분야에 적용이 된다.)

⇒ 속도가 느린 점이 아쉬운 점이다.

⇒ 빠른 속도의 파이썬을 준비하고 있는 중이다.

⇒ 아주 느리진 않는다. 그러나 C언어에 비해서는 느리다고 볼 수 있다. (크게 중요하지 않다.)

기계를 제어하는 경우, 파이썬을 사용하진 않을 것이다.

  • 초창기: 파이썬 인터렉티브 셀, 텍스트 에디터

아나콘다(Anaconda), 파이참, 비주얼 스튜디오 코드, google colab

  • 구글 코랩은 학습하고 적용하기가 좋다.
  • 비주얼 스튜디오 코드는 조각조각 실행하기가 어렵다.

노트북 설정이 다르면, 상황에 따라 가능여부가 달라진다.

그러나, 구글 코랩은 동일한 설정을 가지고 있다.

코드 셀을 분리하거나 하는 등의 단축키가 많다. (쓰다보면 적용될 것이다.)

문장: 실행가능한 최소형태

표현식: 값을 산출하는 표현

키워드: 사전에 파이썬을 만든 사람이 의미를 부여한 단어

식별자: 변수이름이나 함수이름 등에 이름을 붙여줄 때, 구분하기 위한 규칙

#한글은 데이터로만 사용

스네이크 케이스와 캐멀 케이스

  • 관습도 지켜야 하는 것과 지키지 않아도 되는 것이 있다.
  • 주석: 메모, 설명 등 코드 이외에 다른 것을 기록할 때, 테스트할 때 기억을 상기시키기 위해서 등의 목적으로 기록함
  • 전체 드래그 + Ctrl + / : 전체 주석처리 및 주석해제

기본 자료형은 3가지이다.

(기본 자료형을 조합하여 새로운 자료형을 만들 수 있음)

  • 문자열 결합 연산자: +

#데이터 형이 같지 않으면 결합이 불가능하다.

인덱싱: 글자 1개를 뽑아오는 것

슬라이싱: 범위지정

인덱싱은 범위를 벗어나면 error가 나지만, 슬라이싱에서 범위를 지정하면 해당 범위내에서 값을 출력해준다.

  • len() 함수로 문자열 데이터의 길이(문자 개수)를 구할 수 있다.

파이썬을 개발한 사람은 약어를 사용하는 것을 선호한다.

  • 어느 분야에서 프로그램을 하느냐에 따라 주로 사용하는 것이 달라진다.

#실무에서 input함수를 사용할 일은 없다.

  • valueError

int: 정수로 바꿀 수 있는 문자열을 넣어주면 정수로 변환, float를 넣어주면 소수점 자리를 떼주고 정수로 변환해준다.

  • 문자열 format() 함수

단순히 값만 존재하는 것이 아니다.

IndexError예외:

대소문자 변환: Upper(), lower(), strip()

  • isXX()함수의 결과값은 참, 거짓으로 나온다.

find()

in연산자: 내부에 해당 내용이 있는가?

문자열 자르기: split()

  • split()함수는 특정 문자(열)을 기준으로 문자열을 분리해주는 기능.
  • 분리한 문자열을 요소로 하는 리스트를 반환

문자 대체: replace()

f-문자열: f ’ ’

⇒ 필요에 따라 f나 format을 활용하여 문자열을 생성할 수 있다.

부울 형 데이터(True, False)만들기: 비교 연산자

#어떻게 코딩하는 것이 효율적인가?

(소스 코드의 가독성, 실행(계산) 속도, 소스 코드의 양)

⇒ 코드를 잘못 만들면, 나중에 찾아볼 때 다시 정리해야 한다.

양주를 처음 산 게 30 무렵이었고, 장학금 500만원이 나왔었다.

남들은 자주 멋있게 노는 거 같고, 매일 비싼 술집 가는 거 같고, 다 멋있게 사는 거 같지만, 대부분 비슷한 삶을 살고 있다.

  • 취업해서 내가 얼마 받게 될 지 냉철하게 생각해보자. 연복 억대인 사람은 3%밖에 되지 않는다.

⇒ 30명 중 1명이다.

연봉 2,000만원인 사람들도 상당수이다.

⇒ 세상을 객관적으로 봐야한다.

4장에서는 반복문을 다룰 수 있어야 한다.

파이썬에서 가장 많이 사용하는 데이터 형태가 리스트(목록)이다.

  • 리스트 안에 숫자, 문자열, 부울형 데이터를 같이 넣어도 된다.

요소가 없는 빈 리스트 생성

  • 빈 문자열과 비교

리스트 생성 및 리스트 요소 확인

  • 뽈락, 우럭, 광어

신이 종자를 만들 때 설계가 이루어진다.

⇒ ‘list’ 라는 종을 설계한 것이다.

리스트를 선언하고 요소에 접근하기(인덱싱)

a_list=[’b’, ‘o’, ‘y’]

  • 데이터를 리스트에 담아서 가지고 다닌다.

문자열로만 구성된 리스트(name list)

name_list = ['왕조현', '구숙정', '김성필', '오천련', '매염방']
what = name_list[2][0]
print(what)
=> 김
  • 리스트에서 인덱싱을 할 때도 -1도 사용가능하다.

lst = [’a’, [’b’,’c’],’d’,’e’]

second_element = lst[1]

리스트안에 리스트도 담을 수 있을 뿐만 아니라, 대부분의 것들을 담을 수 있다.

⇒ 봉투의 개념이라고 보면 된다.

lst = ['a', ['b', 'c'], 'd', 'e']

print( lst[1][0] )
print( lst[1][1] )
print( type(lst[1]) )
=> b
   c
   <class 'list'>
  • 리스트를 선언하고 요소에 접근하기 (슬라이싱)

리스트안에서 슬라이싱으로 하나를 빼오면 리스트로 출력해주고, 인덱싱으로 뺴오면 문자열로 출력해준다.

  • 리스트 연결하기

연결(+), 반복(*), len()함수

#len()함수에 리스트를 넣으면 요소의 갯수를 알려주고, 그냥 대입하면 공백과 특수기호까지 세어준다.

  • 리스트 요소추가: append(), insert()

append(): 리스트의 맨 마지막에 요소 하나를 추가

⇒ 요소 하나를 뒤에 붙인다.

insert(): 리스트의 원하는 인덱스 위치에 추가할 요소를 하나 insert(끼워 넣다)함

extend() 함수

  • extend: 확장, 한번에 여러 요소를 추가하는 기능

리스트 연결 연산자 +와 extend()함수의 차이

  • 연결 연산자 (+)는 원본이 바뀌지 않는 비파괴적 처리다.
  • extend()함수는 확장의 개념이므로 원본을 변경하는 파괴적 처리다.

pop()에서 인덱스 내용을 써주면 그 인덱스 내용을 삭제해준다.

  • FiFo구조: First In First Out이라는 의미이다.

예를 들어 pop(0)과 append()함수를 활용하여 사용한다.

del, pop = 인덱스를 써준다.

remove: 값을 지정항 해당 요소를 삭제한다.

만약, 동일한 값을 갖는 요소가 다수일 경우 remove에 해당 값을 입력하면, 하나의 요소만 삭제한다.(순서대로)

리스트의 요소 정렬: sort()

  • 기본 정렬 방식은 오름차순(작은 수부터 큰 수 순으로 표현)이다.

리스트 내부에 있는지 확인하기: in/not in 연산자

  • import?

어떤 동작이나 기능을 시키려면 수행할 수 있는 함수들이 있어야 한다. 이를 라이브러리라 부른다. 파이썬에선 모듈이라고 부른다. 이 중에서 random이라는 기능이 있다고 할 때, 이 모듈을 사용하기 위해선 import 라는 명령어를 앞에 써준다.

⇒ 개념: 기능블럭 또는 그러한 기능을 가지고 있는 일꾼, 멕가이버 칼 등의 사물(object)⇒ 객체를 가져올 때 사용함.

sample()함수는 random이라는 객체가 가지고 있다.

  • sample(): 지정한 범위안에서 랜덤한 지정 수만큼의 요소를 추출함

영덕 대게를 사먹으러 간다.

30만원에 2마리를 받았다.

3마리를 시키면 45만원이다.

대게 1마리 먹을 돈으로 안동찜닭 2번은 먹을 수 있다.

for 반복문

  • 컴퓨터 프로그래밍에 있어 기본 중에 기본이면서 핵심 중에 핵심은 반복문과 조건문이다.

컴퓨터 프로그램은 결국 조건에 따라 무수히 많은 반복 실행을 통해 결과를 얻는 구조를 가지고 있다고 할 수 있다.

영어문장으로 살펴보자.

for each_element in [0, 1, 2], print(each_element)
=>
for each_element in [0, 1, 2],
  print(each_element)

영어가 아닌, 파이썬 문법에 맞도록 바꿔보자.

for each_element in [0, 1, 2]:
  print(each_element)
=>
0
1
2

이처럼 영어문장으로 먼저 해석한 다음, 프로그램 문법에 맞도록 변환한다면 해당 내용을 어떻게 적용해야 하는지 알 수 있을 것이다.

  • 반복작업을 할 때, ‘for’라는 키워드를 활용해서 간단하게 처리할 수 있다.
for each_element in [0, 1, 2]:
  print(each_element)
  print( '{}번째 작업이 완료 되었습니다'.format(each_element + 1) )
  print('---'*30)
  print()

  print('모든 작업이 끝났습니다.')
=>
0
1번째 작업이 완료 되었습니다
------------------------------------------------------------------------------------------

모든 작업이 끝났습니다.
1
2번째 작업이 완료 되었습니다
------------------------------------------------------------------------------------------

모든 작업이 끝났습니다.
2
3번째 작업이 완료 되었습니다
------------------------------------------------------------------------------------------

모든 작업이 끝났습니다.
  • iterable: 반복가능한 데이터

⇒ 봉투같은 의미

range()함수: 0부터 N-1까지의 둘 이상의 정수를 생성하는 함수

range([start,]end[,step])

r = range(0,10)
print(type(r))
=> <class 'range'>

print(r)
=> range(0, 10)

rr = list( r )  # int(), float(), str()
print(rr)
=> [1, 2, 3, 4, 5, 6, 7, 8, 9]

#range()함수로 생성한 값은 range의 데이터형이며, 출력 시, 범위값을 반환한다. 전체값을 확인하려면 list, str, int, float등으로 변환한 다음 출력해야 한다.

참고 in

지금까지 수업을 진행하면서 in 키워드를 세 차례 만났다.

1) 
'b' in 'boy'

2) 
'boy' in ['boy', 'girl', 'apple']

3) 
for element in ['apple', 'bannana', 'watermelon']:
  print(element)

list는 각 요소를 인덱스로 뽑아올 수도 있고, 요소 각각에 대하여 아래 써놓은 것을 수행한다.

문법을 알고만 있으면 안된다.

썡초보와 초보의 기준: 내 머리속에 있는 생각을 코딩으로 옮길 수 있는가? 없는가?

상승곡선을 그리기까지는 에너지가 필요하다.

  • 강사 양성 2~3개월 과정

⇒ 인생을 바꾸고 싶으면, 열심히 해야 한다.

  • 6개월동안 변화를 기대하고 모였지만 얼마나 스스로가 노력하는가에 따라 변화가 달라진다.

매개변수 위치에 사용하는 경우

list( range(0, 10, 2))

parameter

요소가 list

  • 전개연산자 *

기초다지기라는 범주에서 웹 크롤링, 파이참등을 해보면서 익숙해진다고 생각하면 된다.

목차를 보면, 해당 챕터에서 어떤 것이 Key point인지 보인다.

4-1: 리스트와 반복문

4-2 딕셔너리와 반복문

딕셔너리는 key와 value를 쌍으로 보관한다.

⇒ 왼쪽은key, 오른쪽은value

list는 index로 접근한다.

딕셔너리는 key로 접근한다.

딕셔너리는 key의 짝꿍인 value를 가져온다.

  • 딕셔너리도 리스트와 마찬가지로 봉투의 개념이라 보면 된다.

#딕셔너리는 구조적으로 표현하기가 좋다.

json형태로 전달을 많이 한다.

딕셔너리에서 특정 항목을 지울(del) 때는 인덱스 번호가 아닌, 해당 key를 입력해야 한다.

반응형
LIST