Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

  1. 1

    업무에 사용할 최소한의 라인을 Gemini 3 pro라 생각함. 아직 3 Flash의 한 80~90% 수준임.

    물론 작년 말의 Gpt-oss-120B의 수준을 Moe 모델로 35B로 뛰어넘는다는게 놀랍긴 한데 우리가 업무에 핵심으로 쓰는 모델들은 이보다 더 월등히 강력하니

    로컬에 크게 관심두지 마시고 구독하세요. https://t.co/QZBVgOrYDA https://t.co/eUTFAxkkaH

    원문 보기
  2. 2

    내가 Gemini cli + 2.0 Pro(flash)로 바이브코딩을 시작한게 작년 5월쯤이었는데. 1년만에 세상은 정말 많이 바뀌는구나.

    격세지감을 체감하는 요즘.

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 업무 활용의 최소 기준선을 Gemini 3 Pro로 설정하며, 로컬 모델보다 구독형 모델의 효율성을 강조하셨습니다. 다만 Gemini 3 Pro가 3 Flash의 80~90% 수준이라는 주장이나, 특정 MoE 모델이 과거 Gpt-oss-120B의 성능을 상회한다는 구체적인 수치는 공식 문서에서 직접 확인되지 않는 개인적 체감 영역입니다. 따라서 이 부분은 기술적 사실보다는 사용자의 주관적 경험 기록으로 보는 것이 타당하며, 정밀한 검증을 위한 추가 확인이 필요합니다.

반면 Gemini CLI와 2.0 Pro(Flash)를 활용한 코딩 경험과 그로 인한 격세지감은 실제 운용 과정에서 나타나는 전형적인 기술적 체감 사례입니다. 하드웨어 제약이 큰 로컬 LLM의 한계를 지적하며 상용 모델 구독을 권장한 점은 실무적 관점에서의 합리적인 판단으로 보입니다. 결국 이 기록은 모델의 절대적 성능 지표보다는 실제 업무 환경에서의 재현 가능성과 효율성에 무게를 둔 실무자의 시행착오 기록이라 할 수 있습니다.

실험 맥락운용 관찰재현 포인트