추천 시스템을 위한 전략 외 행위자 비판 알고리즘 Off-Policy Actor-critic for Recommender Systems | Proceedings of the 16th ACM Conference on Recommender Systems 파파고를 기본으로 하며, 어색한 문구를 고치며 읽는다 off-policy: 전략 외 라고 번역한다. 여기서의 policy는 정치적인 측면의 정책을 이야기하는 것이 아니라 ai 모델이 목표를 달성하기 위해 사용하는 전략(a strategy that an agent uses in pursuit of goals)을 의미하는 것으로 보인다. agent: 모델 이라고 번역한다. distribution shift: 분포 변화 라고 번역한다. 초록 산업추천 플랫폼은 사용..