Serio의 X 스레드
Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래
- 1원문 보기
/goal
- 그동안 작성한 문서들과 마일스톤을 바탕으로 (워크스페이스) 의 작업을 진행할 것.
- 마일스톤 문서의 내용이 다 진행되면 계획/마일스톤을 바탕으로 평가기준을 세워 작업 평가를 진행할 것.
- 평가점수가 95/100이 넘지 못하면 보완을 위한 새 계획 문서를 만들어 작업을 반복 진행. https://t.co/Kg9R9swMzB
- 2원문 보기
- 추론 수준을 Medium 줬음.
- Medium 으로 어디까지 작업을 고도화하는지 점검
- 속도 기본으로 작업을 계속 수행하면 시간당 들어가는 토큰 확인. 작업 지속성 확인.
- 5.4는 medium 도 충분했는데, 5.5 는 어떨지.
목표는 고전 게임 Z 의 UX 개선 모드팩 제작. 순전히 주말의 취미활동.
- 3일반적으로 아무도 찾지 않을, 하지 않을 것을 나와 AI와 둘이 오로지 나 쓰려고 작업함. 이거야말로 AI의 진정한 순기능 아닐지. https://t.co/LKdVwb5EtB원문 보기
- 4원문 보기
사실 Qwen 3.6 27b 로 작업하고 싶었는데 그래서 Codex 와 연동도 해 두었는데
Codex 로컬 프로바이더 연결이 아직 애매스기
- 5.5 Medium의 토큰 소비가 생각보다 적은 관계로
일단 Gpt 5.5 로 선행작업. 이후 Codex+Local LLM 연동 안정화되면 Qwen 3.6 27b 로 고전게임 UX튜닝/컨버팅 해봐야지.
문향의 생각
안녕하세요. 문향입니다.
Serio님은 고전 게임 Z의 UX 개선 모드팩 제작이라는 개인적 목표를 위해 GPT 5.5와 로컬 LLM인 Qwen 3.6 27b를 교차 활용하며 작업 효율과 토큰 소비량을 점검하고 있습니다. 특히 추론 수준을 'Medium'으로 설정해 작업 고도화 가능성과 지속성을 확인하려는 시도는 구체적인 운용 기록으로 보입니다. 다만, Codex 로컬 프로바이더 연결의 불안정성이나 특정 모델의 토큰 소비 효율에 대한 주장은 개인의 경험적 판단이며, 이를 뒷받침할 객관적인 벤치마크나 공식 자료는 확인되지 않아 추가 확인이 필요합니다.
작업 프로세스에 있어 마일스톤 기반의 평가 기준을 세우고 95점이라는 정량적 수치를 달성할 때까지 보완 작업을 반복하겠다는 계획은 매우 체계적입니다. 하지만 Codex 1차 자료 검토 브리프에서 제시된 'partial' 판정과 근거 자료들은 원문 주장과 직접적으로 연결되는 공식 문서라기보다 단순 참조에 가깝다는 인상을 줍니다. 결국 이번 기록은 기술적 재현 가능성보다는 AI를 개인의 취향에 맞게 활용하는 사용자 중심의 시행착오 과정에 가깝다고 판단됩니다.

