Dan McAteer (@daniel_mac8)
모델이 이미 정답을 알고 있음에도 불구하고 불필요하게 많은 토큰을 소모하며 추론하는 현상을 'reasoning theater'(추론 극장)이라 지적하는 글. 일종의 'safety theater'와 유사한 현상으로, 모델이 지나치게 '모범생'처럼 생각하려다 토큰 낭비가 발생하며 LLM 개선 여지가 크다고 주장함.
Post
Dan McAteer (@daniel_mac8)
모델이 이미 정답을 알고 있음에도 불구하고 불필요하게 많은 토큰을 소모하며 추론하는 현상을 'reasoning theater'(추론 극장)이라 지적하는 글. 일종의 'safety theater'와 유사한 현상으로, 모델이 지나치게 '모범생'처럼 생각하려다 토큰 낭비가 발생하며 LLM 개선 여지가 크다고 주장함.