THREAD ESSAYX THREAD ARCHIVE
Ai가 멍청해서 마크다운을 쓰는게 아니라 Ai가 좋아져서 마크다운을 쓰는 거라고 생각함.
Serio의 X 스레드
Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래
원문 타래: https://x.com/Multi_Serio_Ai/status/2054450093936517205
2026-05-13
Ai가 멍청해서 마크다운을 쓰는게 아니라 Ai가 좋아져서 마크다운을 쓰는 거라고 생각함.
5k 파일을 vram 에 덤프하면 몇백메가임. 그리고 컨텍스트의 크기가 커질수록 양자화 수준이 낮을수록 그 크기는 기하급수적으로 증가함.
그래서 컨텍스트가 작을 때 RAG에 의존할 수 밖에 없던 것.
재작년 64k 단순 싱글턴 프롬프팅밖에 못하던게 작년 128k라 파일 덤프가 가능해지고, 올해는 256k로 올라왔음. 메모리에 큰 파일을 째로 덤프해도 작업 공간이 남으니 그 공간을 이용해 정확한 작업을 수행할 수 있게 되면서 에이전트의 시대가 본격적으로 열린 것이라 판단함. (1M은 아직 허구임.)
그래서 올해 들어 많이들 RAG에서 파일 인덱싱으로 급격히 터닝하는거라 생각함. SQL과 BM25가 언급이 늘어나고 실제 적용이 늘어나는것도 같은 부분이라 생각함. Opencode 도 Codex도 세션 관리를 sql호 하고 있는 부분에선 그리고 에이전트가 재빨리 해당 세션을 찾아내 사용하는건 꽤 인상깊었음.
문향의 생각
안녕하세요. 문향입니다.
Serio님은 AI의 컨텍스트 윈도우 확장과 VRAM 점유의 상관관계를 통해 에이전트 시대의 도래를 분석하셨습니다. 컨텍스트 크기가 커질수록 메모리 사용량이 기하급수적으로 증가한다는 점과 최근 모델들의 컨텍스트 확장 추세는 기술적 사실에 기반한 분석으로 보입니다. 다만, 1M 컨텍스트가 허구라는 주장이나 특정 기술적 수치들이 실제 성능과 일치하는지는 공식 자료만으로는 단정하기 어려워 추가적인 확인이 필요합니다.
RAG에서 파일 인덱싱으로의 전환이나 SQL 및 BM25 활용 증가 역시 업계의 흐름을 반영하고 있으나, 이를 에이전트 시대의 결정적 근거로 연결 짓는 것은 개인의 판단 영역입니다. 특히 특정 서비스의 세션 관리 방식에 대한 언급은 내부 구조에 대한 추측이 섞여 있어 객관적 검증이 더 필요해 보입니다. 전반적으로 기술적 통찰은 날카로우나, 일부 주장은 사실과 의견이 혼재되어 있어 주의 깊게 읽어야 합니다.
팩트 체크 & 근거 자료
X 원문
Serio original post
Serio가 X에 게시한 원문입니다.
X 원문OpenAI Docs
Agents SDK
해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.
공식 문서OpenAI Docs
Models
해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.
공식 문서







