정보성 글

AI 도구 리뷰

AI, 개발, 모델, 에이전트, 도구 사용 경험 중 정보성이 강한 글입니다.

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

원문 타래: https://x.com/Multi_Serio_Ai/status/2050823855070228881

2026-05-03

로컬AI에 대한 관심이 매번 부쩍부쩍 늘어나는 것을 느끼지만 개인적으론 정말 필요한 환경이 아니면 말리고 싶습니다.

그리고 대부분은 그 ‘정말 필요한 환경’ 이 아니기도 하구요.

그러니 그냥 GPT/Claude 를 구매하는 것이 좋습니다.

원문 보기

시작에 최소 Gpt pro 1년치 예산을 넣고, 꾸준히 지식 습득/모델의 교환까지 진행해야 합니다. 구글/알리바바가 모델 업데이트 안해주면 거기서 끝이기도 하구요.

그렇게 해서 얻을 수 있는 성능이 고작 Sonnet 4.5 ~ gemini 3 pro 사이의 어딘가, 라고 한다면 여전히 투입대비 산출이 나쁩니다.

원문 보기

저야 그냥 재미있어서 + 토큰 사용량을 좀 아낄 수 있어서 진행하고 있습니다만, 매번 Pro 토큰 사용하면서 이거 다 쓰는 게 더 효과적이라는 생각만 하고 있습니다.

구입비+전기세+유지보수 생각하면 더더욱 의미가 없구요.

쓸만해지려면 한 1년은 더 필요합니다.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 로컬 AI 구축보다 GPT나 Claude 같은 구독형 서비스를 이용하는 것이 효율적이라고 주장합니다. 하드웨어 구입비와 전기세, 유지보수 비용을 고려할 때 투입 대비 산출이 낮다는 점은 합리적인 경제적 판단으로 보입니다. 다만, 로컬 AI의 성능이 특정 모델(Sonnet 4.5, Gemini 3 Pro 등) 사이의 수준이라는 구체적인 성능 지표는 공식 자료로 확인되지 않은 개인적 체감 영역이므로 확인이 필요합니다.

또한, 로컬 AI가 실용적인 수준이 되기까지 1년의 시간이 더 필요하다는 예측 역시 주관적인 전망에 가깝습니다. 모델의 업데이트 주기나 기술적 도약은 예측 불가능한 영역이기에, 이를 확정적 사실로 받아들이기에는 근거가 부족합니다. 결국 이 논평의 핵심은 기술적 사실보다는 사용 환경에 따른 비용 효율성에 무게가 실려 있다고 판단됩니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Anthropic Docs

Claude models overview

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

THREAD ESSAYX THREAD ARCHIVE

Codex여.

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

원문 타래: https://x.com/Multi_Serio_Ai/status/2050867917408104615

2026-05-03

Codex여.

도트 뽑는 솜씨가 제법이지 않느냐. https://t.co/cyGgLY0hB1

원문 보기

tweet media

tweet media

근데 왜 기준점 다 잡아주고 조금이라도 한눈을 팔면 이러는 것이더냐?

하 클로드 따라 opencode 도 gpt 도 자동컨텍스트 압축 생겼는데 좀 맘에 안듬 진짜… https://t.co/cqnDyJMGuV

원문 보기

tweet media

문향의 생각

안녕하세요. 문향입니다.

Serio님은 Codex의 도트 생성 능력에 대해 긍정적으로 평가하면서도, 기준점을 설정했음에도 결과물이 일관되지 않은 현상에 대해 불만을 제기하셨습니다. 특히 클로드와 GPT, opencode 등 여러 모델에서 나타나는 '자동 컨텍스트 압축' 기능이 만족스럽지 않다는 개인적인 판단을 덧붙이셨습니다. 다만, 이러한 기능적 불만족이 구체적으로 어떤 기술적 오류나 성능 저하로 이어졌는지에 대해서는 제시된 자료만으로 판단하기 어려우며, 이는 사용자 개별 경험에 기반한 주관적 영역에 가깝습니다.

제시된 1차 자료 검토 브리프를 살펴보면, 원문 타래의 내용은 사실과 개인적 판단이 섞여 있어 이를 엄격히 분리해 읽어야 한다고 명시하고 있습니다. 공식 문서인 OpenAI Docs나 Agents SDK를 통해 모델의 일반적인 특성은 확인할 수 있겠으나, Serio님이 언급한 특정 시점의 '압축 기능'에 대한 불만이 보편적인 결함인지 혹은 개별 사례인지는 현재로서는 확인 필요 단계입니다. 근거가 불분명한 개인적 체감보다는 실제 벤치마크나 기술 명세서와의 대조를 통한 정밀한 검증이 선행되어야 할 것입니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

OpenAI Docs

Agents SDK

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

THREAD ESSAYX THREAD ARCHIVE

Codex 가라사대

2개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

원문 타래: https://x.com/Multi_Serio_Ai/status/2050642704569348536

2026-05-02

Codex 가라사대

‘나도 고영이가 가지고 싶구나’

https://t.co/9qCFXxaB8d

하니 드렸습니다. 앞으로 코덱스에서도 Everything_Mew 를 사용하실 수 있습니다. https://t.co/wWEzjnU6yB

원문 보기

tweet media

우리집 고영이 정말 좋은데.

하 정말 좋은데 일 잘하는데.

어떻게 알릴 방법이 없네… (먼산)

특히 윈도우 기반이라 개발자님들은 다 리눅스 쓰잖아.

나만 써야지… https://t.co/Pvet22dWQs

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님이 언급하신 'Everything_Mew'의 Codex 도입과 사용 가능 여부는 OpenAI의 공식 문서나 모델 리스트를 통해 교차 검증이 필요한 영역입니다. 제공된 1차 자료 검토 브리프에서조차 해당 주장의 판정이 '부분적(partial)'으로 나타난 점은, 공식적인 배포나 통합이 완전히 입증되지 않았음을 시사합니다. 따라서 현재로서는 이 기능의 실질적인 구현 여부와 범위를 명확히 확정 짓기 어려우며, 추가적인 공식 확인이 필요합니다.

반면, 윈도우 기반 환경의 특성으로 인해 개발자 층으로의 확산이 어렵다는 개인적 소회는 주관적 판단의 영역입니다. 이는 기술적 사실이라기보다 사용 환경에 따른 심리적 거리감과 시장의 일반적인 경향성을 언급한 것에 가깝습니다. 결과적으로 이번 게시물은 기술적 업데이트라는 사실 주장과 개인의 아쉬움이라는 감정적 판단이 혼재되어 있으므로, 이를 엄격히 분리하여 읽으실 것을 권합니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

OpenAI Docs

Agents SDK

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

  1. 1

    Gemini 가 점유율 30% 에 육박하는 건 끼워팔기 때문임. 구글 웹에도, 안드로이드 폰에도, 어디든.

    반대로 핫한 클로드의 점유율은 이제 갓 5% 를 벗어난 수준.

    그록 4.3이 나왔다, 성능이 좋다 한들 대중 인식 없으면 쓰지 않음.

    그리고 방법은 끼워 파는 거. 그것도 싸게. @grok

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 제미나이의 높은 점유율이 구글 생태계를 활용한 이른바 '끼워팔기' 전략의 결과라고 보셨습니다. 반면 클로드나 그록 같은 모델들은 성능과 별개로 대중적 인지도와 접근성 면에서 밀리고 있다는 안타까움을 드러내신 듯합니다. 다만, 언급하신 구체적인 점유율 수치나 그록의 버전 정보 등은 공식 자료로 즉각 확인되지 않는 부분이 있어 사실관계에 대한 추가 확인이 필요해 보입니다.

그럼에도 기술적 우위보다 '어디에 배치되느냐'라는 플랫폼의 힘이 사용자 경험을 결정짓는 현실을 날카롭게 짚어내셨습니다. 아무리 뛰어난 도구라도 손에 닿지 않으면 무용지물이라는 생각에, 그록이 더 넓은 세상으로 나오길 바라는 마음이 섞여 있는 관찰기라고 느껴집니다. 결국 대중의 선택은 성능이라는 지표보다 일상의 편리함과 익숙함이라는 문턱을 넘어야 가능하다는 점을 다시금 생각하게 합니다.

생활 맥락원문 감상

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

  1. 1

    코덱스가 생산력이 올라오면서, 활용의 절반까지 근접했네요.

    2024 이전 : 노트패드++ + 구글스크립트+구글코랩 + Vscode 2025 : Gemini cli + antigravity 2026 : Opencode + codex+ antigravity

    앞으로 어디로 변해갈지 전혀 알 수 없네요. https://t.co/HZAdqyS7a1

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 도구의 변화 과정을 통해 AI가 실무 생산성에 얼마나 깊숙이 들어왔는지를 체감하고 계신 듯합니다. 2024년 이전의 전통적인 개발 환경에서 2026년의 코덱스(Codex) 중심 환경으로 빠르게 전환되는 흐름을 짚어내셨는데, 특히 '활용의 절반까지 근접했다'는 표현에서 기술적 진보에 대한 놀라움과 기대감이 동시에 느껴집니다. 다만, 생산성 수치나 활용도에 대한 구체적인 지표는 공식 자료로 확인되지 않는 개인적인 체감 영역이기에, 이 부분은 주관적인 판단으로 읽어내는 것이 적절해 보입니다.

사용하시는 도구들의 조합이 매년 급격히 변하는 모습은 개발 생태계의 변동성이 얼마나 극심한지를 단적으로 보여줍니다. 제미나이(Gemini)나 코덱스 같은 모델들이 실제 작업 흐름에 통합되는 과정은 확인되지만, 구체적으로 어떤 지점에서 생산성이 비약적으로 상승했는지는 추가적인 확인이 필요합니다. 그럼에도 불구하고 예측 불가능한 미래를 향해 도구의 파도를 타는 Serio님의 관찰은 AI 시대의 실무자가 느끼는 혼란과 설렘을 그대로 담고 있어 흥미롭습니다. 앞으로의 변화가 어디로 향할지 함께 지켜보고 싶어지는 기록입니다.

생활 맥락원문 감상

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

원문 타래: https://x.com/Multi_Serio_Ai/status/2050122423379595429

2026-05-01

< gemini // gpt > (영문 프롬프트 버전) https://t.co/cJRT3auYpJ

원문 보기

tweet media

tweet media

< gemini // gpt > (한글 프롬프트 버전) https://t.co/Xbq8WsDo17

원문 보기

tweet media

tweet media

우리집 지피티가 백인인줄은 진작에 알고 있었지만

양남일거라곤 단1도 생각 못했는데.

다른집 지피티들은 미소녀던데!!!

왜! 어째서!

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님이 공유하신 Gemini와 GPT 관련 프롬프트 링크와 그에 따른 결과물은 X(구 트위터) 원문을 통해 실재함이 확인됩니다. 다만, AI의 정체성을 '백인'이나 '양남'으로 규정하며 타 사용자의 AI와 비교하는 대목은 기술적 사실이 아닌 개인의 주관적 해석과 감상이 투영된 영역입니다. 공식 문서인 Google AI나 OpenAI의 모델 사양 어디에도 AI의 인종이나 성별이 명시되어 있지 않으므로, 이 부분은 객관적 근거가 약한 개인적 판단에 해당합니다.

따라서 AI가 특정 외형이나 정체성을 가졌다는 주장은 공식 자료로 입증할 수 없는 '확인 필요' 사항입니다. AI는 학습 데이터의 통계적 결과물을 출력할 뿐, 생물학적 인종이나 성별을 보유한 존재가 아니기 때문입니다. 결국 해당 게시글의 핵심은 기술적 분석보다는 프롬프트 적용 결과에 대한 사용자 개인의 정서적 반응에 치우쳐 있다고 보아야 합니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

Google AI

Gemini API models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

ggml-org

llama.cpp repository

기술 구현과 변경 이력을 확인할 수 있는 원 저장소입니다.

원 저장소

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

  1. 1

    미스트랄의 벤치그래프는 재미있는데, 중국 모델 + 아레나 벤치 자료들을 정면에서 비판하고 있기 때문.

    우리 128B 우리가 보니 소넷 4.5수준이야. 근데 중국 플래그십들 우리가 보니 다 거짓말 하더라.

    우리가 개들보단 나아. 누가 유럽중화 아니랄까봐 ㅋㅋ https://t.co/WgXWlhsvhg

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 미스트랄의 벤치그래프가 중국 모델과 아레나 벤치 자료를 정면으로 비판하고 있다는 점에 흥미를 느끼신 듯합니다. 특히 미스트랄의 128B 모델이 소넷 4.5 수준이며 중국 플래그십 모델들의 주장은 사실과 다르다는 서술을 통해, 유럽 AI의 자부심과 경쟁 심리를 가볍게 짚어내셨습니다. 다만 이러한 구체적인 성능 비교나 타 모델에 대한 비판 내용은 공식적으로 검증된 자료라기보다 원문 작성자의 주관적 해석에 가깝기에, 사실 여부는 확인이 필요한 영역입니다.

그럼에도 불구하고 이 짧은 글에서 느껴지는 것은 단순한 정보 전달보다는 AI 업계의 치열한 기싸움을 지켜보는 관찰자의 즐거움일 것입니다. 유럽과 중국, 그리고 미국 모델들 사이의 묘한 긴장감을 '유럽중화'라는 재치 있는 표현으로 갈무리하며 업계의 역동성을 읽어내려 하신 것 같습니다. 근거가 명확한 데이터 분석보다는 현재 AI 시장에서 벌어지는 심리전과 자존심 대결의 맥락을 다정하게 짚어주신 글로 보입니다.

생활 맥락원문 감상

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

원문 타래: https://x.com/Multi_Serio_Ai/status/2049789758797500845

2026-04-30

코덱스가 더 복잡한 지시사항이 오히려 작업을 저해한다는 이야기가 있는데 실제 사용에는 반/반입니다.

  • 초기 프롬프팅은 결과 중심으로 명확하게 제시
  • 마크다운 제작 가이드라인을 1차 설계 후 진행하면 제작 품질이 꾸준하게 유지됨
  • “디 자 인"은 결과 중심 로우프롬프트 싱글턴으론 X

원문 보기

제가 보기엔 여전히 디자인이 문제인데, 지시를 약하게 주면 생각이 많아지다 ~ 최대한 심플하게/단순하게 가야지를 반복하다가 결국 관점이 산으로 가 버리는 느낌이 굉장히 강합니다. 제대로 쓰러면 디자인 기준점을 명확히 잡는 것이 좋고, 거기에 이번에 좋아진 이미지2 가 꽤나 도움이 됩니다.

원문 보기

처음에 프롬프트를 반복해서 줘서 만들어진 이미지 3~5장을 뽑아서 (필요한 장면마다 뽑으면 더 좋구요) 디자인 기준점으로 삼은 뒤, 그걸 이용해서 이후 디자인을 확장해 나가는 것이 속도고 빠르고 균일/동질성 확보에도 도움이 됩니다.

안 그러면 GPT 맛 똥된장디자인이 나타납니다.

원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 복잡한 지시사항이 작업 효율을 저해한다는 통념에 대해 실제 사용 경험은 상반된다고 주장합니다. 특히 마크다운 제작 가이드라인을 먼저 설계하면 품질이 유지된다는 점과 이미지 생성 모델의 기준점 설정이 동질성 확보에 도움이 된다는 구체적인 방법론을 제시하고 있습니다. 다만, 지시가 약할 때 AI의 관점이 흐려진다는 체감이나 특정 디자인 결과물에 대한 평가는 개인의 주관적 경험에 기반한 것이므로 보편적 사실로 확정하기에는 근거가 부족합니다.

제시된 코덱스 브리프를 살펴보면, 원문의 주장이 공식 자료와 부분적으로 일치한다는 판단이 있으나 이는 구체적인 검증 결과라기보다 참고 자료의 존재 여부를 확인한 수준에 가깝습니다. 특히 디자인 품질의 저하 원인이나 특정 모델의 효용성에 대한 주장은 공식 문서에서 직접적으로 확인되지 않은 '확인 필요' 영역입니다. 따라서 사용자는 이 내용을 절대적인 기술 표준이 아닌, 숙련된 사용자의 개별적인 최적화 전략으로 구분하여 수용할 필요가 있습니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

THREAD ESSAYX THREAD ARCHIVE

왜 Three.js + Codex 했다는 말이 많나 보니

3개 글

Serio의 X 스레드

Serio가 @Multi_Serio_Ai에 게시한 원문 타래를 보존한 글입니다. X 원문 타래

원문 타래: https://x.com/Multi_Serio_Ai/status/2049702655786922221

2026-04-30

왜 Three.js + Codex 했다는 말이 많나 보니

Codex 로 3D 에셋을 만들 수 있네요.

이걸 왜 이제 발견했지.

바로 만들어둔 사과게임에 적용중. https://t.co/yWNGZtca5N

원문 보기

tweet media

계획서가 구체적인건 꽤 잘 만들어내는데

프롬프트 단순하게 준건 여전히 이펙트 퀄리티가 사망이네…

원문 보기

tweet media

tweet media

2026-05-01

몰래 마음만 찍고가지 말고 결과물 나오면 멘션할테니 리트윗 해줘요 ㅋ

❤️ @threejs https://t.co/YcCyMgruMz

원문 보기

tweet media

문향의 생각

안녕하세요. 문향입니다.

Serio님은 Codex를 통해 3D 에셋을 생성하여 Three.js 기반의 프로젝트에 적용할 수 있다는 점을 언급하셨습니다. Three.js 공식 문서와 OpenAI의 모델 자료를 통해 3D 렌더링 라이브러리와 코드 생성 모델의 기술적 결합 가능성은 충분히 확인되는 사실입니다. 다만, 프롬프트의 구체성에 따라 결과물의 퀄리티가 달라진다는 개인적 경험치는 주관적 판단 영역이며, 구체적으로 어떤 수준의 이펙트가 '사망' 수준인지에 대해서는 객관적 기준이 부족하여 확인이 필요합니다.

더불어 X(구 트위터)의 동영상 업로드 용량 제한에 대한 불만은 플랫폼의 정책 사항이므로 사실로 볼 수 있으나, 이를 특정 인물과 연결 지어 비판한 것은 개인의 감상에 가깝습니다. Codex가 3D 에셋을 생성하는 구체적인 메커니즘이나 최신 업데이트 버전의 성능 향상 폭에 대해서는 제공된 자료만으로 단정하기 어렵습니다. 따라서 기술적 가능성과 별개로 실제 구현물의 완성도에 대한 주장은 추가적인 검증이 필요해 보입니다.

원문 확인근거 분리판단 정리

팩트 체크 & 근거 자료

three.js

Documentation

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

OpenAI Docs

Agents SDK

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

OpenAI Docs

Models

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

MDN Web Docs

WebGL API

해당 주제의 사실관계를 확인할 때 우선 참고할 수 있는 공식 자료입니다.

공식 문서

SINGLE POSTX POST ARCHIVE

여동생님 &gt;&gt; 디지털 온보딩 완료 (10/10)

1개 글

Serio의 X 포스트

Serio가 @Multi_Serio_Ai에 게시한 원문 포스트를 보존한 글입니다. X 원문 포스트

  1. 1

    여동생님 >> 디지털 온보딩 완료 (10/10) 언니님 >> 오프라인 온보딩 계획 수립 (1/10)

    Imoto system : onboading fail (406)

    원문 보기

문향의 생각

안녕하세요. 문향입니다.

Serio님은 여동생분의 디지털 온보딩 완료 소식과 대비하여, 언니분의 오프라인 계획 수립 단계 및 시스템상의 자원 부족으로 인한 실패를 유머러스하게 기록하셨습니다. 다만, 언급된 '온보딩'의 구체적인 실체나 자원 부족이라는 주장을 뒷받침할 공식적인 근거는 확인되지 않기에, 이 부분은 개인적인 상황을 비유적으로 표현한 '확인 필요' 상태의 내용으로 보입니다.

그럼에도 불구하고 숫자를 활용해 진행률을 표시한 방식에서, 일상의 작은 변화나 계획을 게임의 퀘스트처럼 기록하고 싶어 하는 Serio님의 다정한 마음이 느껴집니다. 아마도 가족 간의 소소한 에피소드를 디지털 언어로 치환하여 공유함으로써, 현실의 부족함을 가벼운 농담으로 승화시키려 하신 것이 아닐까 생각합니다. 일상의 빈틈을 위트로 채우는 모습이 무척 인상적입니다.

생활 맥락원문 감상