金のニワトリ (@gosrum)
step-3.5-flash의 ts-bench 결과 발표: 벤치마크에서 GLM-4.7보다 낮은 점수를 기록했으며, gpt-oss-120b와는 동등하거나 그 이하 수준이라는 평가 결과를 공유.
https://x.com/gosrum/status/2018298305676238879
#benchmark #llm #step3.5flash #glm #gptoss
金のニワトリ (@gosrum)
step-3.5-flash의 ts-bench 결과 발표: 벤치마크에서 GLM-4.7보다 낮은 점수를 기록했으며, gpt-oss-120b와는 동등하거나 그 이하 수준이라는 평가 결과를 공유.
https://x.com/gosrum/status/2018298305676238879
#benchmark #llm #step3.5flash #glm #gptoss
金のニワトリ (@gosrum)
step-3.5-flash의 ts-bench 결과 발표: 벤치마크에서 GLM-4.7보다 낮은 점수를 기록했으며, gpt-oss-120b와는 동등하거나 그 이하 수준이라는 평가 결과를 공유.
https://x.com/gosrum/status/2018298305676238879
#benchmark #llm #step3.5flash #glm #gptoss
Zixuan Li (@ZixuanLi_)
GLM-4.7이 출시된 지 38일밖에 되지 않았지만 AI 업계의 상황이 급변해 수년이 지난 것처럼 느껴진다는 소감입니다. 작성자는 매일이 흥분과 불안의 소용돌이라며 빠르게 변하는 모델 출시·생태계의 변동성을 언급하고 있습니다.
Zixuan Li (@ZixuanLi_)
GLM-4.7이 출시된 지 38일밖에 되지 않았지만 AI 업계의 상황이 급변해 수년이 지난 것처럼 느껴진다는 소감입니다. 작성자는 매일이 흥분과 불안의 소용돌이라며 빠르게 변하는 모델 출시·생태계의 변동성을 언급하고 있습니다.