데이터 분석가의 (재)테크 블로그
-
LLM with Recommender System 논문 리뷰 - 2부 [A Survey on Large Language Models forRecommendation]
1부는 여기에서 LLM with Recommender System 논문 리뷰 - 1부 [M6-Rec: Generative Pretrained Language Models are Open-Ended Recommender Syste원문 보기 : https://arxiv.org/pdf/2205.08084.pdf 오랜만에 추천 관련 기술 논문을 두 개 정도 읽게 됐다. 업무 연차가 올라가다보니, 새로운 기술을 접목하거나 논문을 읽어보는 데 할yamalab.tistory.com RS(Recommender System) 분야에 대한 연구는 이제(원래도 그랬지만) 서비스를 가진 기업 단위로만 유의미하게 이루어지고 있다. 그도 그럴 것이, 실제 서비스에서 발생하는 로그데이터로 이 분야를 연구하는 것 말고는 별다른..
2025.01.20
-
[생애최초 주택 매매 여정] 부동산 입지분석 주택매매 후보군 정하기
2020년 계약한 전세계약이 어느새 4년차. 작년부터 다음 살 집에 대해 고민하기 시작했다. 묵시적 갱신으로 계약을 연장한 후에 아직 1년 정도 만기가 남긴 했지만, 아무래도 다음 집은 매매를 생각하고 있었기 때문에 미리부터 준비하고 있다. 사회생활을 한 6년 동안 나름대로 돈을 많이 모았다고 생각하기도 했고, 금리가 더이상 내려가지 않을거라는 매크로적인 판단이 서기도 해서, 이제 슬슬 주택을 구매하기에 적당한 시점이 아닌가라는 결론을 내렸다. 물론 금리가 더 올라갈 수도 있고, 집값 하락이 아직 허벅지도 안 내려왔을 수도 있지만 어느정도 감내가 가능한 수준이 된 것 같다. 대한민국에서 매매로 집을 보유한다는 것은 이제 '중산층'으로 가는 필수적인 조건이 되었다. 하지만 고등교육을 받은 약 30년간, 금..
2024.03.15
-
[추천시스템과 통계 모델 1] - 다양성 지수(Diversity Index)
추천시스템을 고도화 할 때 필요한 것 중 하나는, 유저 단위, 혹은 아이템 단위의 적절한 Index를 만들어내는 것이다. 이를테면 어떤 유저는 다양한 아이템을 소비하는 것을 좋아하고, 어떤 유저는 새로운 아이템을 소비하는 것을 좋아하고, 어떤 유저는 자신이 선호하는 카테고리의 아이템만 선호할 수도 있다. 이런 것들을 하나의 Index로 점수화 하여 사용하는 것은 큰 의미가 있다. 물론 Neural Network 구조의 Deep Learning이 보편화 된 이후부터는 Index를 만들어내는 것 자체가 이론적으로는 무의미 해지긴 했지만, 실제 서비스에서는 그렇지 않다. 모델이 Feature Engineering을 아무리 잘 해낸다고 해도, 결국 Binary Task 혹은 지정된 Task에만 활용될 수 있을 ..
2024.02.27
-
XGBoost 알고리즘의 간단한 이해
캐글에서 가장 유명한 알고리즘은 XGBoost이다. 웬만한 대회의 리더보드에는 XGBoost가 최상단에 위치해 있다. 이가 시사하는 바는, Vision 이나 NLP 등의 Specific한 Task를 제외한 일반적인 ML Task에서 가장 범용적으로 잘 동작하는 알고리즘이 XGBoost라는 것이다. 이런 기법은 아직 문제의 해결법이 미숙하거나 숙련도가 높지 않은 도메인의 새로운 문제를 풀 때 가장 먼저 고려되어야 하는 방법이 될 수 있다. 일반적으로 어떤 도메인의 ML 문제를 해결할 때 가장 중요한 것은 정확한 피쳐 엔지니어링을 통한 모델링이다. 또는 샘플링이나 파라미터 튜닝 같은 ML 테크닉이 중요할 수도 있고, 어떤 알고리즘을 사용하느냐가 중요할 수도 있다. 하지만 오늘 소개할 XGBoost는 데이터 ..
2023.07.06
-
LLM with Recommender System 논문 리뷰 - 1부 [M6-Rec: Generative Pretrained Language Models are Open-Ended Recommender Systems]
원문 보기 : https://arxiv.org/pdf/2205.08084.pdf 오랜만에 추천 관련 기술 논문을 두 개 정도 읽게 됐다. 업무 연차가 올라가다보니, 새로운 기술을 접목하거나 논문을 읽어보는 데 할애하는 시간이 점점 줄어들고, 도메인과 서비스에 적용되는 루틴한 개발이나 킬러 피쳐 발굴에만 몰두하게 된다. 그래서 새로운 기술이나 논문을 알아보는 시간이 점점 없어지는 것 같다. 그래도 곁눈질로 종종 들여다보곤 하는데, 요즘 많이 언급되는 추천시스템 관련 기술 동향은 크게 2가지 꼭지가 있다고 생각한다. 하나는 GNN-based 모델이고, 또 하나는 Transformer(BERT)를 기반으로 하는 Sequential Recommendation 이다. 한 2~3년 전에도 이 생각을 똑같이 했었..
2023.05.22