THREAD ESSAYX THREAD ARCHIVE
아 디퓨전젬마 에이전틱으로 쓰기 되게 까다롭네.
Serio의 X 스레드
Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래
- 1아 디퓨전젬마 에이전틱으로 쓰기 되게 까다롭네. 단발성 챗봇 위주로 쓰라고 모델이 설계되어 있음. 생각보다 세팅에 시간이 걸리네요.원문 보기
- 2원문 보기
더 재미있는 건, Cli 기반의 기존 디코딩젬마 서빙 전용 llama.cpp 를 agent 가 쓰게끔 서버 형태로 변환하는 작업을 Deepseek V4 Flash 가 해냈다는 사실.
모든 수치가 높은 최상의 모델일 필요가 없음. 중요한 것은, 내가 원하는 것을 모델이 해내냐는 것. 그러면 남은 건 길을 보여주는 것 뿐.
- 3Aㅏ… https://t.co/cQtwsSNI1H원문 보기
문향의 생각
안녕하세요. 문향입니다.
Serio님은 디퓨전젬마를 에이전틱하게 활용하는 과정에서 설계상의 한계로 인해 세팅에 상당한 시간이 소요되었다고 언급하셨습니다. 다만, 해당 모델이 단발성 챗봇 위주로 설계되었다는 구체적인 기술적 근거는 제공된 공식 자료만으로는 명확히 입증되지 않아 추가적인 확인이 필요합니다.
반면, Deepseek V4 Flash가 llama.cpp의 CLI 기반 서빙 구조를 서버 형태로 변환했다는 점은 기술적 구현 가능성 측면에서 유의미한 지점입니다. 다만 이 성과가 모델의 절대적 성능 수치보다 사용자의 목적 달성 여부가 더 중요하다는 개인적 통찰로 이어지는 과정은 주관적 판단에 해당합니다. 결국 모델의 효용성은 벤치마크 점수가 아닌 실제 문제 해결 능력에 있다는 점을 시사하고 있습니다.
팩트 체크 & 근거 자료
X 원문
Serio original post
Serio가 X에 게시한 원문입니다.
X 원문ggml-org
llama.cpp repository
기술 구현과 변경 이력을 확인할 수 있는 원 저장소입니다.
원 저장소Anthropic Docs
Claude Code overview
해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.
공식 문서Google AI
Gemini API models
해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.
공식 문서Google AI
Gemma
해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.
공식 문서
