본문 바로가기

Programming/[Python]

(9)
[Python] 데이터 수집을 위한 웹 크롤링(Crawling) 원하는 데이터를 수집하고자 할 때 크롤링(Crwaling)을 하곤 한다. 크롤링은 해당 페이지의 데이터들을 추출하는 행위를 의미한다. 이 때 크롤링을 하기 위한 소프트웨어를 크롤러(Crawler)라고 하며, 봇, 스파이더, 지능 에이전트 라고도 불린다. 스크래이핑과 크롤링의 차이 ? Scraping : 웹 사이트의 특정 정보를 추출하는 것. 웹 데이터의 구조 분석이 필요 Crawling : 프로그램이 웹사이트를 정기적으로 돌며 정보를 추출하는 것 수집 데이터의 형태 데이터를 수집하기 앞서, 수집 데이터의 형태를 3가지로 구분할 수 있다. 수집 데이터 형태 정형 – 일정한 규격에 맞춰서 구성된 데이터 (어떠한 역할을 알고 있는 데이터) 관계형 데이터베이스 시스템의 테이블과 같이 고정된 컬럼에 저장되는 데이..
[Python] 함수 - arguments Positional arguments 함수 호출 시 인수 순서대로 매개변수에 값을 전달. (위치 기반) # positional def checkout(name, age, birth): print(f'{name}, {age}, {birth}') checkout('kim', 99, '2020/07/17') 첫 번째 인수 'kim' 은 name 매개변수에 전달 두 번째 인수 99 는 age 매개변수에 전달 세 번째 인수 '2020/07/17' 은 birth 매개변수에 전달 Keyword arguments 함수 호출 시 매개변수 이름대로 인자를 매칭. (키워드 기반) # keyword def checkout(name, age, birth): print(f'{name}, {age}, {birth}') checko..
[Python/점프 투 파이썬 복습] 2. (6) Python 프로그래밍 자료형 연습문제 복습용/초보자 참고를 목적으로 포스팅합니다. 최근 들어 프로그래밍 언어들 중 직관적인 표현으로 코딩이 가능한 Python이 인기를 끌고 있습니다. 코드 구성의 가독성이 타 언어 대비 뛰어나고, C/C++/JAVA 에서 구현 가능한 모든 것들을 Python에서도 만들 수 있습니다. 데이터 분석부터 머신러닝, 딥러닝 등 다양한 분야에서 활용 가능한 언어 Python 지금부터 차근차근 공부해봅시다. 2장 연습문제 Q1. 문자열 슬라이싱 활용 문제 홍길동 씨의 주민번호는 881120-1068234입니다. 홍길동씨의 주민등록번호를 연월일(YYYYMMDD) 부분과 그 뒤의 숫자 부분으로 나누어 출력하십시오 pin = "881120-1068234" yyyymmdd = num = print( ) print( ) # 결..
[Python/점프 투 파이썬 복습] 2. (5) Python 프로그래밍 자료형(변수) 복습용/초보자 참고를 목적으로 포스팅합니다. 최근 들어 프로그래밍 언어들 중 직관적인 표현으로 코딩이 가능한 Python이 인기를 끌고 있습니다. 코드 구성의 가독성이 타 언어 대비 뛰어나고, C/C++/JAVA 에서 구현 가능한 모든 것들을 Python에서도 만들 수 있습니다. 데이터 분석부터 머신러닝, 딥러닝 등 다양한 분야에서 활용 가능한 언어 Python 지금부터 차근차근 공부해봅시다. 2. (5) 자료형(변수) 2. 7 자료형의 값을 저장하는 공간, 변수 앞 내용들에서 이미 변수를 여러 번 사용했습니다. 이제는 그 변수들의 정확한 의미와 사용법을 살펴보겠습니다. 변수를 만들 때는 예시처럼 =(assignment)기호를 사용합니다. # 변수 정의 a = 1 b = "Python" c = [1, 2..
[Python/점프 투 파이썬 복습] 2. (4) Python 프로그래밍 자료형(집합 자료형) 복습용/초보자 참고를 목적으로 포스팅합니다. 최근 들어 프로그래밍 언어들 중 직관적인 표현으로 코딩이 가능한 Python이 인기를 끌고 있습니다. 코드 구성의 가독성이 타 언어 대비 뛰어나고, C/C++/JAVA 에서 구현 가능한 모든 것들을 Python에서도 만들 수 있습니다. 데이터 분석부터 머신러닝, 딥러닝 등 다양한 분야에서 활용 가능한 언어 Python 지금부터 차근차근 공부해봅시다. 2. (4) 자료형(집합) 2. 6 집합 자료형 집합 자료형은 집합에 관련된 것들을 쉽게 처리하기 위해 만들어진 자료형으로, 파이썬 초기부터 지원되기 시작한 자료형입니다. 집합 자료형은 set키워드를 이용해 만들 수 있습니다. # 집합 자료형 예시 s1 = set([1, 2, 3]) s1 # {1, 2, 3} s2..
[Python/점프 투 파이썬 복습] 2. (3) Python 프로그래밍 자료형(튜플, 딕셔너리 자료형) 복습용/초보자 참고를 목적으로 포스팅합니다. 최근 들어 프로그래밍 언어들 중 직관적인 표현으로 코딩이 가능한 Python이 인기를 끌고 있습니다. 코드 구성의 가독성이 타 언어 대비 뛰어나고, C/C++/JAVA 에서 구현 가능한 모든 것들을 Python에서도 만들 수 있습니다. 데이터 분석부터 머신러닝, 딥러닝 등 다양한 분야에서 활용 가능한 언어 Python 지금부터 차근차근 공부해봅시다. 2. (3) 자료형(튜플, 딕셔너리) 2. 4 튜플 자료형 앞서 리스트 자료형에서 알아보았는데 튜플은 리스트 자료형과 매우 유사한 성격을 띱니다. 몇 가지 차이점이 있다면 리스트는 [ ], 튜플은 ( )을 이용합니다. 리스트는 요소들의 수정, 생성, 삭제가 가능하지만 튜플은 요소들을 바꿀 수 없습니다. 튜플의 모습..
[Python/점프 투 파이썬 복습] 2. (2) Python 프로그래밍 자료형(리스트 자료형) 복습용/초보자 참고를 목적으로 포스팅합니다. 최근 들어 프로그래밍 언어들 중 직관적인 표현으로 코딩이 가능한 Python이 인기를 끌고 있습니다. 코드 구성의 가독성이 타 언어 대비 뛰어나고, C/C++/JAVA 에서 구현 가능한 모든 것들을 Python에서도 만들 수 있습니다. 데이터 분석부터 머신러닝, 딥러닝 등 다양한 분야에서 활용 가능한 언어 Python 지금부터 차근차근 공부해봅시다. 2. (2) 자료형(리스트) 2. 3 리스트 자료형 리스트는 어떤 숫자나 문자의 모음을 간단하게 표현해줍니다. 리스트를 만들때는 각 요소값들을 쉼표로 구분해 주며 대괄호로 감싸줍니다. 리스트에는 문자열, 숫자형 등 어떠한 자료형이든 포함시킬수 있고 빈 리스트 혹은 리스트 자체를 요소로 가질 수 있습니다. # 리스트..
[Python/점프 투 파이썬 복습] 2. (1) Python 프로그래밍 자료형(숫자형과 문자열 자료형) 복습용/초보자 참고를 목적으로 포스팅합니다. 최근 들어 프로그래밍 언어들 중 직관적인 표현으로 코딩이 가능한 Python이 인기를 끌고 있습니다. 코드 구성의 가독성이 타 언어 대비 뛰어나고, C/C++/JAVA에서 구현 가능한 모든 것들을 Python에서도 만들 수 있습니다. 데이터 분석부터 머신러닝, 딥러닝 등 다양한 분야에서 활용 가능한 언어 Python 지금부터 차근차근 공부해봅시다. 2장 (1). 자료형(숫자형과 문자열 자료형) 2. 1 숫자형 숫자형이란 숫자 형태로 이루어진 자료형입니다. 우리가 흔히 사용하는 숫자들이 이에 해당됩니다. 예를 들어 1, 2, 3과 같은 정수, 12.3과 같은 실수, 1 + 2j 같은 복소수, 8진수, 16진수 모두가 숫자형입니다. 정수형(Integer)은 말 그..