제로타이 2022. 12. 23. 02:09

데일리 스크럼

어떤 데이터를 처리할 수 있는가?  웹사이트 구현만 되도록 하기.
유저클러스터링은 어떻게 할 수 잇는가? 클러스터링을 해서 시각화를 하는 게 목적이라면, 차원축소를 해서 할 수는 있다. 
클러스터링 추가하는 것 자체가 어떤 정보를 주는 것이기도 하다. 
이게 실용적인 가정인가?  물어보기. 

오프라인

성훈이 형의 제안으로 오프라인으로 가서 공부를 했다. 코드 치는 것이야 불편하지만, 그래도 장점은 분명히 있으니까. 그런데 조금 난감했던 것이, 갔던 카페에서 정전이 나버렸다. 이번 화요일 때도 클래스룸에 정전이 났는데, 그때는 그래도 그나마 빠르게 복구되어서 문제가 덜했다. 그런데 이번에는 피어세션에 정전이 나버린 채로 거의 한 시간 동안 고쳐지질 않았다. 결국 피어세션은 핫스팟으로 참여를 해야만 했다.. 어떻게 꼭 오프라인을 하는 곳에서, 그것도 하필이면 줌을 화상 회의를 할 때만 기가 막히게 정전이 나는 거냐? 아무튼, 여차저차로 기록을 많이 하지는 못 했다. 그게 오프라인의 최대 단점 중 하나다. 

그래서 그냥 집에서 쓸 것들만이라도 쓰자.

왜 이걸 넘는 아이템이 있는가? 봤더니 유저랑 아이디 갯수를 하나씩 더 세고 있다. 왜? 마스크? 오답?을 위해? 왜 그런 짓을 해서 내 예측을 불가능하게 만드는 걸까?

htop으로 찍었을 때 이게 정상적인 상태. 간혹 가다보면 평소에 5분 걸렸던 게 갑자기 40분이 걸리는 경우가 있었다. 그런 경우에는 tqdm으로 봤을 때 중간부터 눈에 띄게 진행 속도가 느려지고는 했었다. 지금은 그 이유를 어느 정도 알 것 같다. cuda를 사용할 수 없는 경우에 그렇게 된다. 그럴 때는 일단 그냥 끄고 다시 키는 게 답인 것 같다. 근데 간혹 그렇게 해도 안 될 때가 있는데, 자세하게 어떻게 해야 할 지는 모르겠다. 갑자기 지가 cuda 안 쓰고 싶다는데 내가 뭐 찾아가서 켜달라고 빌 수도 없는 노릇이잖냐.. 아무튼 느리다 싶으면 꼭 껏다가 다시 키는 과정을 거쳐야 할 것 같다. 
여태 그 이유도 잘 모르고 많은 시간을 날려먹었네..

pip install로 받은 recbole에는 이 함수가 없다.. 문서에는 있는데.. 내가 또 이걸로 한참 헤맸는데, 내가 간단하게 파일을 작동시키려면, 결국 저장된 모델을 사용하는 수밖에 없고, 그렇다면 이런 함수가 필요할 수밖에 없다. 여러 모로 진짜 귀찮게 하는 라이브러리다. 처음부터 그냥 깃헙에 있는 것으로 클론을 받아서 할 걸.

말 나온 김에 못할 게 무어냐. 그냥 깃헙에 있는 잘난 버전으로 하겠다. 직접 받아서 쓰면 디버깅도 원활하게 가능하지 않을까? 제발 그러기를 바란다.

별 문제가 다 일어난다. 깃 클론 디렉을 pip insatll 해주니 해결됐다. 아무래도 환경 변수에 제대로 등록하는 과정이 필요했던 모양이다.

오 젠자아앙 역시 깃헙에서 받는게 정답이었다.

회고 및 다짐

어떻게, 그래도 추천이 가능하게 만들어냈는데 본격적으로 이 라이브러리를 활용하려면 조금 더 자세한 이해가 필요할 것 같았고, 그런 차원에서 깃헙에 있는 최신 버전의 recbole을 다운 받았더니 무언가 세세한 설정이 더 생겨난 모양이다. 킹받게 이전에는 문제가 생기지 않았던 것들이 계속 문제를 일으킨다. 결국 이것들도 해결해내야만 제대로 쓸 수 있을 예정이다. 결국 금요일까지 recbole을 붙들어야 하나.
근데 개인적인 심정으로는, recbole을 파보는 것은 나쁘지는 않긴 하다. 뭐랄까, 대회 베이스라인 코드를 뜯는 기분이다. 대신 난이도가 훨씬 높은 베이스라인 코드. 사용법도 까다롭지만, 이것을 파면서 또 공부가 되는 것 같다. 다만 문제는 팀에 기여를 못하고 있다는 것이다. 간단한 모델 몇 개만 돌려보려고 시작했던 recbole이었는데, 무슨 3일을 넘어가는가. 근데 이 정도 들어왔으면 이제 물릴 수도 없다. 그냥 이대로 가는 수밖에. 그럼 강의는..? 미션은..?