파이썬
-
[야후 파이낸스 데이터를 활용한 Quant Analysis - 3] 쓸 만한 데이터 정리하기 (2)Morgan Project/주식 데이터 분석 (Quant Analysis) 2022. 7. 6. 19:11
지난 포스팅에 이어, yfinance를 통해 가져온 Ticker 객체에서 쓸 만한 정보가 뭐가 있는지 나머지를 정리해보고, pandas로 데이터를 보기좋게 정리하는 방법을 살펴보도록 하자. [financials, balance_sheet 정보] 마찬가지로 종목코드를 입력하여 Ticker 객체를 가져오도록 하자. import yfinance as yf ticker = yf.Ticker("MSFT") 이번에는 info 변수가 아니라, financials와 balance_sheet을 출력해보자. 그럼 다음과 같은 출력 결과를 볼 수 있다. 기업의 재무제표, 현금 흐름과 관련된 세부 내용들을 이렇게 살펴볼 수 있다. 여기에서도 필요 이상으로 많은 정보가 있기 때문에, 실제 분석에서 사용될 법한 것들로만 한번 더..
-
[Recommender System] - Factorization Machine (From Scratch with Python)Recommender System/추천 시스템 2020. 4. 17. 18:57
이전 포스팅 보기 본 포스팅은 Factorization Machine의 intuitive한 설명(블로그 번역 + 필자 개인적 해석)과 라이브러리 활용법에 대한 포스팅의 후속이다. FM이 sparse한 피처간의 pair-wise interaction을 학습한다는 것을 어렴풋이 이해했다면, 이번에는 실제로 Science 레벨에서 모델링 할때 어떻게 활용해야 하는지를 수식 레벨부터 직접 코드로 구현해보면서 따라가보자. 백문이 불여일견이라 하였으니, 코드 역시 마찬가지일 것이다. 이번 글에서는 FM의 intuitive한 설명은 생략하고 실제로 벡터 단위로 어떤 분석을 수행해야 하는지, pair-wise한 학습을 하면 어떤 이득을 얻을 수 있는지에 대해서 중점적으로 서술하였다. 1. Algorithm Concep..
-
파이썬 언어에 대한 참고사항들Programming & Machine Learning/Python X 머신러닝 2018. 5. 23. 00:47
github 자료와 메모 자료들을 정리하던 도중, CS 관련 지식들을 정리해놓은 자료들을 발견했다.아주 기초적이고 쉬운 내용들이지만, 복습 겸 블로그에 다시 정리하고자 한다. 이 중 파이썬 언어와 관련된 참고사항들을 정리할 것이다. 1. 파이썬의 네이밍 원칙 어느 언어들이 그렇듯이, 파이썬 역시 네이밍 원칙 즉 code convention이 존재한다. 간략한 내용은 다음과 같다. - 하나의 알파벳으로 변수의 이름을 지어서는 안된다. - 모듈 : 모듈 이름은 짧아야 하고, 소문자여야만 한다. 문장이 길어지는 경우 가독성을 위한 언더스코어 사용은 허용된다. - 패키지 : 무조건 소문자여야 한다. - 클래스 이름 : CapWords 형식을 따른다. 첫글자는 대문자로 한다. - exception : 클래스와 동..
-
감성분석을 위한 Python에서의 텍스트 데이터 처리기법Programming & Machine Learning/Python X 머신러닝 2017. 8. 2. 13:18
감성분석을 위한 텍스트 데이터 처리1. 문서의 변수화 작업, bag-of-words감성분석은 문서의 양극성을 분석하는 작업이다. 데이터에서 추출한 단어들을 설명 변수, 해당 데이터에 대한 양과 음의 레이블을 목적 변수로 하는 것이 일반적이다. 분류를 위한 설명 변수들을 정해줘야 하는데, 즉 텍스트를 수치형 피처 벡터로 표현할 수 있어야 한다. 가장 기본적인 방법이 bag-of-words 모델이라고 할 수 있다. bag-of-words 모델은 전체 문서 집합의 단어들의 단어집을 만든 후, 특정 문서에서 단어집에 포함된 단어가 얼마나 자주 사용되었는지 횟수를 포함하는 각 문서에 대한 피처 벡터를 만든다. 각 문서의 단어들은 단어집 내에서의 부분집합을 나타낼 뿐이기 때문에, 피처벡터는 대부분 0이 된다. 문서..
-
파이썬 기초 문법 - 4 ('_' 언더스코어의 의미)Programming & Machine Learning/Python X 머신러닝 2017. 7. 27. 02:38
4. 언더스코어의 의미타 언어에서 언더스코어 '_'은 단순히 스네이크 표기법 정도로만 사용이 되곤 한다. 파이썬에서 언더스코어는 조금 특별한 기능을 하는데, 이는 파이썬이 인터프리터 언어라는 속성에 기인한다. 4.1 파이썬 인터프리터에서의 사용위 그림은 IPython으로 파이썬 인터프리터를 실행한 것이다. 언더스코어는 다음에서 볼 수 있듯, 마지막 변수를 저장하는 역할을 한다. 4.2 특정 값을 skip할 때a, _, b = 1, 3, 2 # a=1, b=2 a, _, b = [1, 2, 3] # a=1, b=3 for _ in range(10): print("hello")4.3 숫자의 구분자로써 활용a = 1_000_00_0 # a=1000000 b = 0b_11_0_1 # b=134.4 네이밍의 용도..
-
파이썬 기초 문법 - 3 (클래스와 오브젝트)Programming & Machine Learning/Python X 머신러닝 2017. 7. 27. 02:36
클래스와 오브젝트################################################################# ################################################################# ### 클래스에서 self, cls, static의 역할 # class는 붕어빵 빵틀, object는 붕어빵이라고 비유가 가능. # self는 붕어빵 각각이 가지는 속성이고, cls는 붕어빵 빵틀이 가지는 속성임. # 클래스의 멤버변수를 선언할때 아래처럼 선언하면 빵틀 변수가 되는 것이고, # init 에서 self로 선언하면 붕어빵의 변수가 되는 것이다. class InstanceCounter: count = 0 count2 = 0 def __init__..
-
파이썬 기초 문법 - 2 (함수와 모듈)Programming & Machine Learning/Python X 머신러닝 2017. 7. 27. 02:34
1. 파이썬의 함수1.1 함수 사용 개념파이썬에서 함수는 정의(def keyword)로 표현.파이썬에서는 함수를 일급 객체(First Class Object)로 다룸.일급 객체란 프로그래밍 언어 설계에서 매개변수로 넘길 수 있고 함수가 반환할 수도 있으며 변수에 할당이 가능한 개체를 가리키는 용어파이썬에서는 함수를 매개변수로도 사용할 수 있고 함수의 결과로 반환하는 것도 가능1.2 함수 사용 예제### 다중 리턴과 타입 def abc(a,b): re1 = a+b re2 = a-b re3 = a*b return re1,re2,re3 def abc2(a,b): re1 = a+b re2 = a-b re3 = a*b return [re1,re2,re3] def abc3(a,b): re1 = a+b re2 = a..
-
파이썬 기초 문법 - 1 (수, 텍스트, 자료구조)Programming & Machine Learning/Python X 머신러닝 2017. 7. 25. 17:23
1. 파이썬 기본 문법파이썬에서 기초가 되는, 파이썬의 독특한 문법들을 대강 코드로 정리해봤다. 제어문이나 반복문은 파이썬에서만 사용되는 특징적인 부분을 나중에 정리해야겠다. 1.1 수 다루기### 2,16,10 진법 관련 # Ob xxxxx -> 2진법 # Oc xxxxx -> 16진법 # Ox xxxxx -> 10진법 # >>> bin(8) # '0b1000' # >>> hex(10) # '0xa' # >>> oct(10) # '0o12' ### math module import math # 여러 수를 표현 가능 math.pi math.e math.abs() # 절대값 round() # 반올림 math.trunc() # 버림1.2 텍스트 다루기a = "hello world!" b = "헬로 월드!" ..