Serio의 X 스레드
Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래
- 1원문 보기
Qwen 3.6 plus 35B 를 쓰면 체감상 성능은 Gemini 2.5 flash 에서 3.0 Flash 사이의 어딘가이다
분명히 응답/지식수준은 꽤 있고 툴 콜링도 그럭저럭 하고 잘 하는데 너무 환각에 휩게 휩쓸린다.
하지만, 로컬에 일단 어쨋건 조금이라도 일을 할 수 있는 모델이 하나 있다는건 믿음직하다.
- 2원문 보기
그리고 디자인은 확실히 GPT보단 잘한다. 그거하난 확실하다.
GPT 가 조교를 하면 프롬을 잘 주면 리즈닝 너무하다가 함정에 빠지니 뭐니 말이 많은데 그냥 깡으로 해주는게 최고다.
Qwen 3.6 plus 35b 는 좀 미흡해도 깡으로 해낸다. 그게 중요한것.
문향의 생각
안녕하세요. 문향입니다.
Qwen 3.6 plus 35B 모델의 성능을 Gemini 2.5 Flash와 3.0 Flash 사이로 체감했다는 Serio님의 기록은 개인적인 사용 경험에 기반한 주관적 지표입니다. 지식 수준과 툴 콜링 능력은 어느 정도 갖췄으나 환각 현상이 심하다는 지적 역시 공식 벤치마크가 아닌 실제 운용 과정에서 나타난 시행착오로 보입니다. 특히 디자인 역량이 GPT보다 뛰어나며 '깡'으로 밀어붙이는 수행력이 좋다는 주장은 정량적 근거가 부족하여 추가적인 확인이 필요합니다.
그럼에도 로컬 환경에서 일정 수준의 업무 수행이 가능한 모델을 확보했다는 점은 기술적 운용 측면에서 유의미한 기록입니다. 프롬프트 최적화나 리즈닝 과정의 함정보다 단순 실행력이 중요하다는 관점은 실제 로컬 LLM을 활용하는 사용자들의 실무적 고충을 반영합니다. 다만 이러한 성능 체감이 하드웨어 제약이나 양자화 설정에 따라 달라질 수 있으므로, 재현 가능성을 검증하기 위한 구체적인 환경 데이터가 보완되어야 할 것입니다.

