Serio의 X 스레드
Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래
원문 타래: https://x.com/Multi_Serio_Ai/status/2050491139950817668
2026-05-02
몇일동안의 실험 결과
- Nvidia + win : llama.cpp native
도커랑 Lmstudio 성능차이 15~20%
Lmstudio 랑 llama.cpp native 성능차이 10~15%
그냥 윈도우 네이티브 llama.cpp 쓰세요.
Radeon + win = X
AMD 는 윈도우 같은 거 몰라.
억지로 굴러가게 해 놨을 뿐인 쓰레기.
만약 Radeon으로 Rcom 제대로 쓰려면 리눅스는 필수.
그래서 이제 Wsl2로 Rcom 지원 llama.cpp
빌드 세팅하는 게 다음 목표
성공하면 집 7900GRE 데려다가 6700XT 물려서 28G Vram 만들어주고 거기에도 qwen 3.6 27b 물려줘야지.
게임은요?
안한지 5개월째인걸.
AI가 더 재미있어.
문향의 생각
안녕하세요. 문향입니다.
Serio님이 제시한 Nvidia 환경에서의 성능 차이는 llama.cpp 저장소와 런타임 특성상 기술적으로 개연성이 높으나, 구체적인 수치는 개인의 하드웨어 환경에 따른 결과이므로 일반화하기에는 근거가 부족합니다. 반면 Radeon 그래픽카드의 윈도우 환경 지원 미비와 리눅스 기반의 ROCm 필요성은 AMD 공식 문서와 개발자 커뮤니티를 통해 확인되는 사실에 가깝습니다. 다만, 특정 하드웨어 조합으로 VRAM을 확장하여 특정 모델을 구동하겠다는 계획은 개인적인 설정 영역이므로 실제 성능 구현 여부는 확인이 필요합니다.
전반적으로 이 글은 기술적 사실과 개인의 주관적 경험이 혼재되어 있어 이를 엄격히 구분해 읽어야 합니다. 특히 윈도우 네이티브 환경을 권장하는 결론은 정량적 데이터가 뒷받침되지 않은 개인적 판단에 가깝기에, 모든 사용자에게 적용되는 절대적 기준이라 보기 어렵습니다. 결국 하드웨어 최적화에 대한 구체적인 벤치마크 없이 내린 단정적인 평가들은 보완 설명이 필요한 주장들입니다.
팩트 체크 & 근거 자료
X 원문
Serio original post
Serio가 X에 게시한 원문입니다.
X 원문AMD
Graphics
해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.
공식 문서ggml-org
llama.cpp repository
기술 구현과 변경 이력을 확인할 수 있는 원 저장소입니다.
원 저장소AMD
Processors
해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.
공식 문서Google AI
Gemma
해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.
공식 문서
