어젯밤 개발 서버의 3090을 분리하고 사무실 게임 머신을 Api 생산 전용 리눅스 머신 (2호짱)으로 만듬.

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

1
어젯밤 개발 서버의 3090을 분리하고 사무실 게임 머신을 Api 생산 전용 리눅스 머신 (2호짱)으로 만듬.
Qwen 3.6 27b mtp 기반 생산 Api는 다 뽑아 놨고, Gemma4 31b mtp 적용해 스위치 전환으로 구성하려는데 구글이 알리바바에 비해 기술 지원이 한심한 수준임을 알게 됨. 🫠
원문 보기
2
그것보다 사용자가 지식이 없으면, 이놈의 요절복통 기계는 Gpt 5.5 Xhigh 라도 최신 지신을 활용할 수 없음.
관련 검색을 통해 3일 전 llama.cpp 최신 로우웨이트 포킹 테스트 자료를 찾았고 그걸 전해주니 올드한 테스트 자료를 바탕으로 작업하려던 계획이 180도 바뀜.
선장이 중요함. 정말로.
원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 RTX 3090 하드웨어 재배치와 리눅스 기반의 API 생산 머신 구축이라는 구체적인 실행 기록을 남기셨습니다. Qwen 3.6 및 Gemma 4 모델의 MTP 적용과 llama.cpp의 최신 포킹 자료를 활용해 작업 방향을 수정한 점은 기술적으로 재현 가능한 영역이며, 이는 실제 저장소의 변경 이력과 궤를 같이합니다. 다만, 구글의 기술 지원이 알리바바보다 한심하다는 평가는 주관적 체감에 기반한 판단이므로 객관적 지표를 통한 추가 확인이 필요합니다.

모델의 성능보다 사용자의 지식 수준이 결과물을 결정한다는 통찰은 로컬 LLM 운용의 핵심적인 시행착오를 짚어낸 지점입니다. GPT 5.5 Xhigh와 같은 특정 모델의 최신 지식 활용 능력에 대한 언급 역시 공식 문서로 검증된 사실이라기보다 개인의 실험적 경험 기록에 가깝습니다. 결국 도구의 고도화보다 이를 다루는 운용자의 역량이 프로젝트의 성패를 가른다는 점이 이번 기록의 핵심 논지라고 판단됩니다.

실험 맥락운용 관찰재현 포인트